首頁 > 科技 > 正文

智源研究院林詠華:多模態(tài)模型需求旺盛,但基礎(chǔ)能力仍有提升空間

2024-12-22 13:51:45 21世紀(jì)經(jīng)濟(jì)報(bào)道 21財(cái)經(jīng)APP 雷晨

21世紀(jì)經(jīng)濟(jì)報(bào)道記者雷晨北京報(bào)道

今年下半年以來,大模型經(jīng)歷了殘酷的淘汰賽,少數(shù)用戶活躍度高的大模型脫穎而出,進(jìn)入決賽圈。與此同時(shí),各界對(duì)于這些模型的性能表現(xiàn)、發(fā)展?jié)摿Φ确矫娴年P(guān)注與日俱增。

近期,北京智源人工智能研究院(簡(jiǎn)稱:智源研究院)發(fā)布并解讀了國(guó)內(nèi)外100余個(gè)大模型的綜合及專項(xiàng)評(píng)測(cè)結(jié)果,涵蓋語言、視覺語言、文生圖、文生視頻、語音語言等多個(gè)領(lǐng)域。

圍繞大模型發(fā)展趨勢(shì)、行業(yè)現(xiàn)狀及相關(guān)熱點(diǎn)問題,智源研究院副院長(zhǎng)兼總工程師林詠華與21世紀(jì)經(jīng)濟(jì)報(bào)道等媒體進(jìn)行了一場(chǎng)深度對(duì)話,從專業(yè)視角對(duì)大模型的發(fā)展趨勢(shì)、行業(yè)現(xiàn)狀以及相關(guān)熱點(diǎn)問題進(jìn)行剖析。

互聯(lián)網(wǎng)大廠優(yōu)勢(shì)明顯,模型發(fā)展仍具潛力

林詠華指出,互聯(lián)網(wǎng)大廠在大模型領(lǐng)域具有顯著優(yōu)勢(shì)。在語言模型方面,憑借強(qiáng)大的流量?jī)?yōu)勢(shì),大廠能獲取更多用戶反饋,推動(dòng)數(shù)據(jù)飛輪,在主觀評(píng)測(cè)中表現(xiàn)良好。例如字節(jié)、快手等公司,在文生圖、文生視頻領(lǐng)域,因自身短視頻平臺(tái)積累的高質(zhì)量數(shù)據(jù)而領(lǐng)先于非互聯(lián)網(wǎng)廠商。

針對(duì)前OpenAI聯(lián)合創(chuàng)始人、SSI創(chuàng)始人Ilya提出的預(yù)訓(xùn)練停滯觀點(diǎn),林詠華予以反駁。她表示,當(dāng)前互聯(lián)網(wǎng)存在數(shù)據(jù)孤島現(xiàn)象,大量數(shù)據(jù)未被充分利用,中文數(shù)據(jù)在全球占比下降,但使用中文上網(wǎng)人數(shù)未變。同時(shí),海量視頻數(shù)據(jù)也有待挖掘,以促進(jìn)模型對(duì)世界的認(rèn)知學(xué)習(xí),大模型發(fā)展仍有巨大潛力。

模型發(fā)展態(tài)勢(shì)分化,多模態(tài)潛力凸顯

智源評(píng)測(cè)結(jié)果顯示,2024年下半年大模型發(fā)展呈現(xiàn)新趨勢(shì):多模態(tài)模型發(fā)展迅速,新廠商與新模型不斷涌現(xiàn),在K12學(xué)科測(cè)試中,融合語言和視覺的多模態(tài)模型表現(xiàn)出色,其理解和推理能力更強(qiáng)。語言模型發(fā)展則相對(duì)放緩,開源的第一梯隊(duì)模型已達(dá)到較高水平,繼續(xù)提升需更多創(chuàng)新,模型尺寸出現(xiàn)兩極分化,除大型稠密模型外,7B或以下小模型下載量也較高。

林詠華認(rèn)為,多模態(tài)模型需求旺盛,但基礎(chǔ)能力仍有提升空間,預(yù)計(jì)2025年將有更多新模型出現(xiàn)。對(duì)于資金不強(qiáng)但創(chuàng)新能力足的團(tuán)隊(duì),可在多模態(tài)模型的拼接、預(yù)處理、后處理、學(xué)習(xí)方式等方面進(jìn)行創(chuàng)新。

AI應(yīng)用趨勢(shì)明確,算力需求將提升

林詠華還對(duì)AI應(yīng)用趨勢(shì)進(jìn)行了展望。她表示,2024年語言模型基礎(chǔ)能力提升,推動(dòng)了復(fù)雜應(yīng)用發(fā)展,2025年基于語言模型的Agent將成為熱點(diǎn),用于構(gòu)建更復(fù)雜的AI應(yīng)用和系統(tǒng)。文生圖、文生視頻應(yīng)用也將在2025年迎來發(fā)展,VLM多模態(tài)模型在企業(yè)的落地場(chǎng)景廣泛,未來需提升基礎(chǔ)能力以形成新應(yīng)用。

隨著模型發(fā)展,對(duì)算力需求也將變化。林詠華提到,端側(cè)模型正在發(fā)力,未來端云結(jié)合將成趨勢(shì),小模型和大模型將分別承擔(dān)不同工作,以平衡資源消耗與效率提升。

開源生態(tài)持續(xù)發(fā)展,國(guó)內(nèi)外差距仍存

在模型開源生態(tài)方面,除了堅(jiān)定開源的機(jī)構(gòu)外,新的開源貢獻(xiàn)者不斷出現(xiàn)。林詠華同時(shí)指出,中國(guó)在大模型技術(shù)領(lǐng)域與國(guó)際先進(jìn)水平相比,在數(shù)據(jù)和AI系統(tǒng)方面存在差距,包括各類數(shù)據(jù)資源及算力。未來,國(guó)內(nèi)需加強(qiáng)數(shù)據(jù)建設(shè),提升算力水平,以推動(dòng)大模型技術(shù)的進(jìn)一步發(fā)展。

21財(cái)經(jīng)客戶端下載