21深度丨OpenAI內(nèi)憂外患中的自我救贖

2024-12-11 07:41:24 21世紀(jì)經(jīng)濟(jì)報(bào)道 21財(cái)經(jīng)APP 孔海麗

21世紀(jì)經(jīng)濟(jì)報(bào)道記者孔海麗、實(shí)習(xí)生賈晨溪北京報(bào)道

OpenAI終于正式上線了Sora,而且是比原定更高效、更好用的Sora Turbo版本。

北京時(shí)間12月10日,延宕了10個(gè)月之久,OpenAI向付費(fèi)用戶開(kāi)放使用Sora,可以生成任意長(zhǎng)寬比、時(shí)長(zhǎng)從5秒到20秒的全新視頻,支持文生視頻、圖生視頻、視頻衍生視頻,并且附帶替換、刪除、混合、剪輯視頻功能。

在OpenAI的官方表述中,Sora依然是早期版本,OpenAI CEO塞姆·奧特曼把它類比為視頻界的GPT-1。以這家公司的調(diào)性,或許更多通往AGI的工具也在悄悄訓(xùn)練中了。

偉大的愿景背后,也少不了現(xiàn)實(shí)壓力。雖然產(chǎn)品足夠炸裂,但長(zhǎng)居熱搜第一的OpenAI,也有自己的煩惱。

想要嘗鮮Sora,付費(fèi)用戶分為兩個(gè)等級(jí):月費(fèi)20美元的Plus會(huì)員每月可以快速生成50次視頻,每條視頻長(zhǎng)度最多5秒,最高清晰度為720p;OpenAI上周剛推出的“史上最貴會(huì)員”——月費(fèi)200美元的Pro會(huì)員,每月可以快速生成500次視頻,并且有不限量慢速生成機(jī)會(huì),每條視頻長(zhǎng)度最多20秒,最高清晰度為1080p,并且支持同時(shí)運(yùn)行5個(gè)生成任務(wù),視頻還可以無(wú)水印下載。

在OpenAI的X社交賬號(hào)下,有網(wǎng)友稱:“這是我花過(guò)最快的200美元?!?/p>

一方面,OpenAI的明星產(chǎn)品GPT系列模型迭代速度正在放緩,高昂的開(kāi)發(fā)成本與低于預(yù)期的性能提升,讓前方蒙上一片迷霧。

另一方面,營(yíng)利壓力是懸在OpenAI頭上的達(dá)摩克利斯之劍,奧特曼甚至坦言,如果能回到過(guò)去,他們當(dāng)初一定不會(huì)選非營(yíng)利組織架構(gòu),“我們也沒(méi)有預(yù)見(jiàn)到需要的資本量會(huì)如此龐大?!彼f(shuō)。

為了修正這種組織架構(gòu)與商業(yè)訴求之間的“撕扯”,OpenAI在考量各種可能性,試圖轉(zhuǎn)向營(yíng)利性組織架構(gòu),取消與微軟的AGI條款以釋放投資潛力,也包括尋求更多融資甚至貸款。

國(guó)內(nèi)一位AI領(lǐng)域投資人告訴21世紀(jì)經(jīng)濟(jì)報(bào)道記者,雖然相較于絕大部分AI企業(yè),OpenAI能夠吸引的資金已經(jīng)是“天量”,但高昂的研發(fā)與訓(xùn)練費(fèi)用,仍然讓OpenAI難以大膽前行,未來(lái),轉(zhuǎn)向營(yíng)利性架構(gòu)既是團(tuán)隊(duì)訴求,也是市場(chǎng)的要求。

AI競(jìng)賽沒(méi)有止境。就在北京時(shí)間12月10日,谷歌發(fā)布最新的量子芯片 Willow,5分鐘內(nèi)完成了當(dāng)今世界上最快超級(jí)計(jì)算機(jī)需要102?年(這個(gè)數(shù)字遠(yuǎn)遠(yuǎn)超過(guò)宇宙的年齡138億年)才能完成的計(jì)算,解決了量子計(jì)算領(lǐng)域逾30年未攻克的難題,震驚了整個(gè)AI圈。

AI視頻生態(tài)初成

與今年2月放出的Sora預(yù)覽相比,Sora Turbo已經(jīng)突破了純視頻生成架構(gòu),更像是一套完備的AI視頻生態(tài)。

首先,文生視頻功能作為“基礎(chǔ)操作”,表現(xiàn)力一如既往。

整體觀感上,對(duì)AI視頻生成有認(rèn)知的人,依然大概率能從直覺(jué)上判斷出來(lái)“這是AI生成的視頻”。

在視頻生成之外,Sora的驚艷在于,它已經(jīng)是一個(gè)相對(duì)完整的實(shí)用視頻工具,聚合了創(chuàng)作、生成、剪輯等一連串功能。

創(chuàng)作環(huán)節(jié),Sora提供了“社區(qū)功能”,在這里可以看到其他創(chuàng)作者的作品,尋求一定的創(chuàng)作靈感或啟發(fā)。

Sora也給出了預(yù)設(shè)風(fēng)格模板,用戶也可以在持續(xù)使用中,將新的風(fēng)格變成預(yù)設(shè)模板。這一方面有助于探索不同風(fēng)格創(chuàng)作,也將幫助有連續(xù)作品創(chuàng)作需求的用戶,保持風(fēng)格統(tǒng)一性。

視頻生成之后,才是Sora與其他AI視頻大模型拉開(kāi)差距的地方。

Sora提供的Remix重混功能,支持對(duì)已生成視頻的修改,可以替換、刪除或重新構(gòu)想視頻中的元素。

比如,已經(jīng)生成了“打開(kāi)通往圖書(shū)館的大門(mén)”效果,可以繼續(xù)用一句話把視頻里的門(mén)換掉、把場(chǎng)景換掉……

可以想象一下,影視界耗資巨大的視頻特效,似乎將被徹底顛覆。

Sora的剪輯功能還體現(xiàn)在Re-cut,用戶可以選中自己最喜歡的一幀視頻,并向任意方向延伸它們。也就是說(shuō),如果一個(gè)片段中,只有一部分是你滿意的畫(huà)面,完全可以只用這部分繼續(xù)創(chuàng)作。

編輯視頻,也可以是段與段之間的銜接。Storyboard支持在時(shí)間軸上組織和編輯視頻的獨(dú)特序列。

常用的過(guò)渡效果也可以在Sora實(shí)現(xiàn)。Loop功能可以修剪并創(chuàng)建無(wú)縫銜接的循環(huán)視頻。

Blend功能可以把兩個(gè)視頻合并為一個(gè)無(wú)縫剪輯視頻。

秀肌肉的同時(shí),奧特曼本人解釋了AI視頻對(duì)OpenAI的重要性,其實(shí)這也是整個(gè)AI行業(yè)向前的路徑折射。

他說(shuō),對(duì)于OpenAI而言,Sora不僅是一項(xiàng)技術(shù),更是激發(fā)創(chuàng)意的重要工具。通過(guò)Sora,OpenAI看到了一種全新的協(xié)作模式——AI和人類共同創(chuàng)造,AI創(chuàng)意工具或許將極大地改變?nèi)祟愃伎己蛣?chuàng)意的方式。

而且,相對(duì)于用文本進(jìn)行人機(jī)交互,視頻交互意味著更立體、更生動(dòng)、更豐富的信息維度。

“Sora是OpenAI通往AGI路線圖上的重要里程碑?!眾W特曼強(qiáng)調(diào)說(shuō)。

有AI從業(yè)者表示,Sora打開(kāi)的不只是AI視頻生成的想象力,行業(yè)更大的野心和愿望在于,AI視頻可能極大地改變?nèi)藱C(jī)交互。

“目前,大家也不能明確說(shuō)出AI視頻通向哪里,或者怎么影響商業(yè)世界,但未來(lái)想象空間是巨大的。”國(guó)內(nèi)一位關(guān)注AI生態(tài)的企業(yè)人士說(shuō)。

Scaling Law瓶頸

近期,關(guān)于Scaling Law“暴力美學(xué)”正在失效的擔(dān)憂,被進(jìn)一步放大。

所謂Scaling Law,也被稱為“規(guī)模定律”,在AI領(lǐng)域,Scaling Law是指模型性能會(huì)隨著模型大小(如參數(shù)數(shù)量)、數(shù)據(jù)集大小和計(jì)算資源的增加而放大,并且這些變化通常遵循冪律關(guān)系?。

但行業(yè)早早就在擔(dān)心,Scaling Law會(huì)觸及邊界,在那之后,可能意味著訓(xùn)練投入不再有相應(yīng)成效。

而最早碰到這個(gè)瓶頸的,恰恰是行業(yè)巨獸OpenAI。

據(jù)報(bào)道,OpenAI最新模型Orion遇到訓(xùn)練困境。盡管Orion模型已完成約20%的訓(xùn)練,并在此前稱計(jì)劃于12月發(fā)布,但其在處理復(fù)雜任務(wù)時(shí)并未顯著超越GPT-4。

相較于現(xiàn)有模型,Orion能力提升有限,代碼能力甚至不如現(xiàn)有模型,躍升程度遠(yuǎn)不如GPT-3到GPT-4階段,而且Orion運(yùn)行成本更高。

與此同時(shí),技術(shù)進(jìn)展放緩可能對(duì)OpenAI的盈利模式產(chǎn)生重大影響。OpenAI的主要收入來(lái)源包括訂閱服務(wù)和API服務(wù),但如果Orion模型無(wú)法達(dá)到預(yù)期,企業(yè)客戶可能減少對(duì)OpenAI的依賴,從而影響公司收入。

投資者也在觀望,OpenAI的未來(lái)盈利能力,決定了資本現(xiàn)在的投入力度。

不只OpenAI一家,Scaling Law瓶頸也公平地困擾著其他科技公司。谷歌下一代Gemini模型也被曝性能未達(dá)預(yù)期,Anthropic傳出放緩了Opus 3.5的進(jìn)展。

OpenAI不得不考慮新的技術(shù)方向。

據(jù)OpenAI知名研究員、O1研究團(tuán)隊(duì)的核心科學(xué)家NoamBrown透露,盡管擴(kuò)大預(yù)訓(xùn)練規(guī)模是提升模型性能的有效手段,但成本高昂且終將觸及天花板。而o1模型所代表的“推理時(shí)計(jì)算”技術(shù),為解決這一瓶頸提供了全新的思路,將加速AGI的到來(lái)。

NoamBrown介紹,這項(xiàng)技術(shù)讓模型能夠在推理階段進(jìn)行更深入的思考和計(jì)算,從而解決更復(fù)雜的問(wèn)題。

比如,o1模型可以自主學(xué)習(xí)策略、拆解任務(wù)、識(shí)別并糾正錯(cuò)誤,展現(xiàn)出前所未有的智能水平,證明了模型可以進(jìn)行更深入的推理和解決更復(fù)雜的問(wèn)題,“它存在的意義被大大低估”。

NoamBrown還強(qiáng)調(diào),“推理時(shí)計(jì)算”技術(shù)目前還處于早期階段,未來(lái)提升空間巨大。

謀求轉(zhuǎn)向營(yíng)利性架構(gòu)

除了內(nèi)部產(chǎn)品焦慮,OpenAI的外部壓力也不算小。

謀求轉(zhuǎn)向營(yíng)利性組織結(jié)構(gòu)的OpenAI,遭到了特斯拉CEO埃隆·馬斯克更強(qiáng)烈的狙擊,后者甚至試圖向美國(guó)聯(lián)邦法院申請(qǐng)禁令,以阻止OpenAI改變組織架構(gòu)。

近日,知情人士透露,OpenAI還在別的方面努力籌劃,增加公司的投資潛力。

此前,OpenAI與大股東微軟訂立了一個(gè)條款,條款規(guī)定,當(dāng)OpenAI開(kāi)發(fā)出通用人工智能(AGI)后,微軟就將無(wú)法再獲取其技術(shù)。據(jù)悉,OpenAI正在考慮撤銷這一條款,但董事會(huì)尚未做出最終決定,正在討論各種選擇。

兩個(gè)月前,微軟還曾就OpenAI轉(zhuǎn)化為營(yíng)利性公司后的股權(quán)分配問(wèn)題進(jìn)行了談判。

OpenAI近期完成的66億美元融資中,微軟投資額約為7.5億美元。根據(jù)融資協(xié)議,OpenAI將在兩年內(nèi)完成向營(yíng)利性公司的轉(zhuǎn)變,否則投資者將有權(quán)收回資本。

截至目前,微軟共計(jì)投資OpenAI137.5億美元,而作為OpenAI的最大投資方,微軟卻沒(méi)有OpenAI的話事權(quán),甚至迫于反壟斷調(diào)查的壓力,退出了OpenAI董事會(huì)。

如果OpenAI能夠順利轉(zhuǎn)向營(yíng)利性組織,投資方將通過(guò)更直接的股權(quán)結(jié)構(gòu)消除非營(yíng)利組織規(guī)定的利潤(rùn)上限,并且通過(guò)掌握股權(quán)減少OpenAI高層變動(dòng)可能帶來(lái)的風(fēng)險(xiǎn)。其中,微軟作為OpenAI最大投資方,可能會(huì)獲得該公司大量股權(quán)。

加州大學(xué)洛杉磯分校洛厄爾-米爾肯慈善與非營(yíng)利中心的創(chuàng)始執(zhí)行董事Rose Chan Loui表示:“OpenAI已明確表示,非營(yíng)利組織將不再控制(營(yíng)利性公司),因此這可能意味著微軟和其他投資者將對(duì)OpenAI的工作有更多發(fā)言權(quán)?!?/p>

近日,奧特曼本人也再次強(qiáng)調(diào)了這種轉(zhuǎn)變的必要性。據(jù)他透露,OpenAI成立時(shí),完全沒(méi)有想到將來(lái)會(huì)成為一家產(chǎn)品公司,所以他們本著初心,將OpenAI設(shè)立成了非營(yíng)利性的組織,承諾公司不為任何人的私利而成立,并將其技術(shù)保持開(kāi)源,以AI造福公眾。

但后來(lái),研發(fā)與訓(xùn)練AI需要的資金量巨大,OpenAI不得不設(shè)立了一個(gè)營(yíng)利性子公司,拓展了有限盈利的模式。奧特曼說(shuō):“但這種模式已經(jīng)開(kāi)始拉扯OpenAI非營(yíng)利組織的形態(tài),而且OpenAI在下一階段所需的資本量實(shí)在是太大了?!?/p>

所以,OpenAI在積極思索一些變化,這個(gè)問(wèn)題非常復(fù)雜,董事會(huì)正在研究,還未做出任何決定。

曾經(jīng)考慮過(guò)的一個(gè)方案是,非營(yíng)利組織擁有一個(gè)公共利益公司(PBC)的絕大部分股份,并通過(guò)這種方式利用大量財(cái)富來(lái)實(shí)現(xiàn)非營(yíng)利組織的目標(biāo)。

為了幫助OpenAI融資,也不排除奧特曼本人會(huì)為了增加投資者信心而持有一部分股權(quán)。

“如果能回到過(guò)去,我會(huì)拿一點(diǎn)OpenAI股權(quán),至少這會(huì)讓投資者們對(duì)我的態(tài)度更清晰一些,可能也會(huì)讓融資變得容易一些。確實(shí)有很多投資者因?yàn)槲覜](méi)有拿股權(quán)而沒(méi)有投資?!眾W特曼透露。

一位來(lái)自高校的觀察人士認(rèn)為,AI尤其是一個(gè)資本密集型行業(yè),OpenAI為吸引投資做出的改變,有助于公司改善資金狀況,并進(jìn)一步提升業(yè)務(wù)運(yùn)營(yíng)能力。

21財(cái)經(jīng)客戶端下載