亚洲中文字乱码免费播放,精品国产日韩专区欧美第一页,亚洲中文有码字幕青青,亚洲综合另类专区在线

          首頁 > 新聞 > 科技

          分享到微信

          打開微信,點(diǎn)擊底部的“發(fā)現(xiàn)”,
          使用“掃一掃”即可將網(wǎng)頁分享至朋友圈。

          OpenAI信號燈又亮了 Sora能照亮國內(nèi)AGI前路嗎?

          第一財經(jīng) 2024-02-21 18:30:52 聽新聞

          作者:呂倩    責(zé)編:李娜

          作為AGI領(lǐng)域的信號燈,OpenAI推出Sora的成功,輕易掩蓋掉AI視頻創(chuàng)業(yè)公司此前的光芒,給國內(nèi)希冀通過垂直行業(yè)應(yīng)用落地實(shí)現(xiàn)彎道超車的路徑,蒙上了一層陰影。

          OpenAI旗下文生視頻Sora爆火之時,國內(nèi)大模型初創(chuàng)企業(yè)頭部之一的月之暗面(Moonshot AI)傳出最新融資消息。

          據(jù)稱,月之暗面在完成新一輪融資后,估值已達(dá)約25億美元。這輪融資是由紅杉中國、小紅書、美團(tuán)、阿里等投資方參與,且是國內(nèi)AI大模型公司迄今獲得的單輪最大金額融資。

          此次融資動作,阿里與美團(tuán)站到同一陣列。此前,另一家頭部大模型企業(yè)智譜AI最新融資列表中,美團(tuán)、螞蟻、阿里、騰訊在列。王小川創(chuàng)立的百川智能資方中,也有阿里、騰訊、小米的身影。

          面對微軟加持OpenAI、亞馬遜與谷歌加持Anthropic的巨頭陣列,以及復(fù)雜的宏觀環(huán)境,國內(nèi)大廠與大廠之間、大廠與大模型創(chuàng)業(yè)公司之間,選擇了牽手的形式,下注人工智能2.0賽道。

          作為AGI(通用人工智能)領(lǐng)域的信號燈,此次OpenAI推出Sora的成功,輕易掩蓋掉AI視頻創(chuàng)業(yè)公司此前的光芒,給國內(nèi)希冀通過垂直行業(yè)應(yīng)用落地實(shí)現(xiàn)彎道超車的路徑,蒙上了一層陰影。

          Sora拉起新一輪大模型熱潮

          Sora的面世將人工智能熱潮再次拉到新高度,360集團(tuán)創(chuàng)始人周鴻祎感嘆:Sora的出現(xiàn)意味著AGI的實(shí)現(xiàn)從十年縮短至一兩年。從OpenAI發(fā)布的樣片來看,Sora不僅展現(xiàn)了視頻畫面的前后一致性,也展現(xiàn)出基本符合現(xiàn)實(shí)世界物理規(guī)律的畫面效果。

          興奮之余也需冷靜看到,一方面Sora產(chǎn)出的視頻內(nèi)容仍存在不符合物理規(guī)律的問題。另一方面,文本轉(zhuǎn)視頻模型并非OpenAI首創(chuàng),該領(lǐng)域中此前已有Google推出的Lumiere、Stability AI推出的SVD、Meta推出的Emu Video等,相關(guān)產(chǎn)品技術(shù)已被影視制作公司使用制作影視特效。

          真格基金管理合伙人戴雨森表示,很多人現(xiàn)在對Sora的期待短期會落空,是因?yàn)閷ora直接類比ChatGPT,實(shí)際上類比GPT3更合適。Sora通過學(xué)習(xí)海量視頻使得AI開始涌現(xiàn)對物理規(guī)律的理解,這與GPT3通過學(xué)習(xí)海量文本使得AI開始涌現(xiàn)對語言+知識的理解很像。但需注意,GPT3剛面世時也是一個問題很多、很難用的模型,經(jīng)過了幾次模型和產(chǎn)品的迭代,兩年后才有了一個完整的ChatGPT產(chǎn)品問世。

          IDC 中國研究總監(jiān)盧言霞表示,Sora是生成式AI在文生視頻領(lǐng)域真正邁出了第一步,做到生成式AI驅(qū)動生成短視頻。接下來也將刺激其他科技巨頭加快在該領(lǐng)域的技術(shù)攻關(guān)力度以及產(chǎn)品發(fā)布速度。但未來具體哪些公司能在什么時間點(diǎn)推出與 Sora 類似的產(chǎn)品,不可預(yù)測。當(dāng)前Sora生成的是1分鐘的視頻,對于行業(yè)已經(jīng)是重大突破,下一步何時能生成2分鐘或5分鐘以上的視頻,也不可預(yù)測。

          但目前最先應(yīng)用落地的領(lǐng)域?qū)⑹嵌桃曨l、廣告、互娛、影視、媒體等。在盧言霞看來,這些領(lǐng)域采用多模態(tài)大模型能力輔助人類員工生成視頻,既可以提高生產(chǎn)速度又可以提高生產(chǎn)數(shù)量,還可以創(chuàng)造全新的視覺感受,能夠幫助企業(yè)真正實(shí)現(xiàn)降本增效、提升用戶體驗(yàn)。

          在萬興科技AI創(chuàng)新中心總經(jīng)理齊博看來,OpenAI采用DiT等技術(shù)實(shí)現(xiàn)“世界模擬器”,達(dá)到理解真實(shí)世界的運(yùn)動和物理能力。它用于文生視頻,可以生成超逼真的符合物理和運(yùn)動學(xué)的復(fù)雜場景的視頻,也就是說,可以理解和模擬真實(shí)世界。理解和模擬真實(shí)世界是AGI關(guān)鍵一步,能夠加速通用人工智能的實(shí)現(xiàn)。

          此次Sora的成功在齊博看來是因其依然遵循OpenAI的Scaling Law,大力出奇跡,采用了大量數(shù)據(jù)、大模型與大量算力。Sora底層采用了游戲、無人駕駛和機(jī)器人領(lǐng)域驗(yàn)證的世界模型,構(gòu)建文生視頻模型,達(dá)到模擬世界的能力,具體采用DiT(Diffusion Transformer),處理不同持續(xù)時間、分辨率和比例的視頻/圖像。

          世界模擬器是AI生成視頻的另一種方式,齊博認(rèn)為,它的成功會帶動視頻生成賽道的發(fā)展,加速視頻生成的創(chuàng)新和成熟。

          Sora背后的多模態(tài)趨勢

          OpenAI憑借此次Sora的爆火一舉將生成式AI的關(guān)注點(diǎn)從文生文、文生圖拉高至文生視頻。一位行業(yè)人士表示,如果說AIGC(生成式人工智能)是AI領(lǐng)域皇冠,那么文生視頻就是皇冠上的寶石。而Sora的出現(xiàn)意味著大模型的競爭到了比拼多模態(tài)、也是大模型技術(shù)最后一塊拼圖的階段。在國內(nèi)市場從業(yè)者眼中,這是他們正在追趕但尚未達(dá)到的目標(biāo)。

          清華系背景的楊植麟在2015年從清華計算機(jī)系畢業(yè)后,前往美國卡內(nèi)基梅隆大學(xué)攻讀博士,師從蘋果AI研究負(fù)責(zé)人Ruslan Salakhutdinov 和谷歌首席科學(xué)家 William Cohen。

          雖從2020年開始確定“大模型是未來”的趨勢,但在2023年之前,他認(rèn)為亞洲可能并不存在做大模型公司的機(jī)會。但從2022年年底,楊植麟的判斷開始發(fā)生很大變化,因GPT在美國市場已引發(fā)很大關(guān)注。

          如今行業(yè)對大模型的議題已從ChatGPT變?yōu)镾ora,楊植麟表示,多模態(tài)過去幾年卡在架構(gòu)上,缺少真正通用的模型。預(yù)計2024年月之暗面也會推出多模態(tài)產(chǎn)品,但公司的目標(biāo)是在大模型領(lǐng)域做To C超級應(yīng)用。

          智譜AI成立于2019年,由清華大學(xué)計算機(jī)系知識工程實(shí)驗(yàn)室的技術(shù)成果轉(zhuǎn)化而來。其創(chuàng)始人張鵬表示,智譜AI可能是國內(nèi)最早開始一批做大模型和技術(shù)研發(fā)的團(tuán)隊(duì),

          談及OpenAI,張鵬表示智譜AI和OpenAI最重要的一個相似之處是目標(biāo)相同,都希望能夠?qū)崿F(xiàn)AGI,且都認(rèn)為大模型是實(shí)現(xiàn)AGI的必經(jīng)之路,因此雙方在發(fā)展路徑有相似性。但智譜AI也并不是完全按照OpenAI的路徑發(fā)展。不同于比較主流的 GPT,智譜AI采用的是全自研的GLM(通用語言模型)預(yù)訓(xùn)練框架,這也是張鵬認(rèn)為有可能超越OpenAI的機(jī)會。

          在張鵬看來,從2020年開始,國外的一些頂尖的公司不再選擇開源路線,學(xué)術(shù)界關(guān)于大模型的研究和技術(shù)上的細(xì)節(jié)也不再公開,國內(nèi)研發(fā)團(tuán)隊(duì)相當(dāng)于走進(jìn)了“無人區(qū)”,前方?jīng)]有可供參照的道路,而一個千億參數(shù)規(guī)模的大模型研發(fā)成本動輒上千萬,試錯成本巨大。

          談及美國率先進(jìn)行多模態(tài)落地的動作,張鵬對記者表示,首先國外先產(chǎn)生多模態(tài)的概念與技術(shù)。其次,商業(yè)化路徑上,國外會先熱一陣子,國內(nèi)在一定程度上進(jìn)行跟進(jìn),這與雙方的創(chuàng)新生態(tài)有關(guān)。相較而言,美國市場與投資者更愿意去采納新的技術(shù),再進(jìn)行孵化,也允許行業(yè)發(fā)生失敗,在更替的循環(huán)中催熟技術(shù)與市場。而國內(nèi)市場更多會選擇尋找一個合適的時機(jī)切入,而非上述創(chuàng)新試錯過程,這屬于雙方在生態(tài)上的差異性。

          至于多模態(tài)技術(shù)本身,張鵬表示,對于AGI來說,多模態(tài)這件事情是必須要去解決的,這個能力必須擁有。包括模型本身能力提升所帶來的類似CoT(思維鏈)這樣的高階能力,便根植于底層的基礎(chǔ)模型能力。包括智譜AI在內(nèi)的多家公司已經(jīng)在做了。

          面壁智能CEO李大海表示,公司在多模態(tài)結(jié)合方面處于進(jìn)行中狀態(tài),當(dāng)技術(shù)研究到一定程度后會選擇接入。在清華大學(xué)計算機(jī)系長聘副教授、面壁智能聯(lián)合創(chuàng)始人劉知遠(yuǎn)看來,多模態(tài)大模型方向反而是國內(nèi)與國際差距相對較小的方向,該方向與自然語言處理領(lǐng)域大模型相比,成熟度還不夠,技術(shù)路線也不明確,包括此前各類的模型架構(gòu)尚處于百花齊放的過程。劉知遠(yuǎn)認(rèn)為,未來一兩年內(nèi)可能會形成一個類似于ChatGPT的模式來支持面壁智能將多模態(tài)的工作做得更好。

          OpenAI的路徑到底是什么

          從文生文的ChatGPT,到文生圖的DALL·E,再到此次文生視頻的Sora,OpenAI每次發(fā)布的產(chǎn)品都將業(yè)界目光吸引。國內(nèi)市場也在不斷追問——距離OpenAI還有多遠(yuǎn)?

          談及與OpenAI之間的差距,楊植麟表示,追趕的過程需要時間與技術(shù)創(chuàng)新。一方面后發(fā)優(yōu)勢可以利用OpenAI等先行者已做出的工作與成功。但客觀上需承認(rèn),雙方差距很大。長期來看,AI是異質(zhì)化的,不同人面對的AI維度不同。另外,AI模型的自建也不存在超越與否的問題,不同工具在不同場景上的優(yōu)勢也不同。

          就目前國內(nèi)在大模型領(lǐng)域的布局來看,主要分為兩派——一派是以阿里、百度、騰訊、字節(jié)為代表的互聯(lián)網(wǎng)大廠,其所產(chǎn)出的大模型產(chǎn)品不同于美國自實(shí)驗(yàn)室孵化成熟再推出的路徑,多從產(chǎn)業(yè)角度出發(fā),如百度文心一言結(jié)合搜索業(yè)務(wù),騰訊通過混元大模型技術(shù)提升廣告效率,阿里通義千問結(jié)合自身生態(tài)產(chǎn)品進(jìn)行提效,原抖音CEO張楠調(diào)任剪映,將AI技術(shù)應(yīng)用于視頻創(chuàng)作。另一派是從技術(shù)側(cè)入手的創(chuàng)業(yè)公司,尤以清華系為重。

          兩大派別雖在通用大模型與垂直行業(yè)模型領(lǐng)域投入力度有所不同,但均對應(yīng)用端寄予厚望。多位投資人對記者表示,目前國內(nèi)市場在大模型領(lǐng)域的最大機(jī)會在于應(yīng)用層面。BV百度風(fēng)投CEO、管理合伙人高雪表示,在目前的市場上,想要找到既能訓(xùn)練出好模型,又有充足的私有數(shù)據(jù),同時實(shí)現(xiàn)數(shù)據(jù)飛輪的項(xiàng)目,是一件比較有挑戰(zhàn)的事情。針對大模型應(yīng)用層面,由于海外生態(tài)發(fā)展繁榮,大量底層模型已趨成熟,提供了很多可接入的API。而中國剛剛開始,還需要時間去成長。一類是訓(xùn)練AI做個人助理類型,第二類是情感陪護(hù)類型。

          渶策資本創(chuàng)始合伙人胡斌認(rèn)為,底層大模型雖然很卷,可中國也有自己的機(jī)會。在人工智能的賦能下,垂直領(lǐng)域會有很多的顛覆出現(xiàn),它的組織形式和用戶的入口和人機(jī)界面的形式都會發(fā)生革命性的變化。

          至于大模型應(yīng)用的具體應(yīng)用,包括百度、騰訊等相關(guān)負(fù)責(zé)人均強(qiáng)調(diào),是指從大模型原生能力出發(fā)誕生的新應(yīng)用,而不是借助大模型技術(shù)對原有應(yīng)用的升級。這在美國的AI視頻領(lǐng)域已呈活躍態(tài)勢,如Runway宣布其AI視頻生成工具Gen-2更新;Meta 宣布推出兩款 AI 驅(qū)動的生成模型—— Emu Video 和 Emu Edit;靠AI 繪畫走紅的 Stability AI 發(fā)布AI 模型 Stable Video Diffusion;AI 視頻工具 Pika 1.0 發(fā)布,效果媲美 Runway 的 Gen-2。

          彼時,不少投資人認(rèn)為Pika是OpenAI經(jīng)歷“政變”后的潛力股,但Sora的面世給應(yīng)用層公司敲響了警鐘,通用大模型的升級一舉打破此前Runway、Pika在該領(lǐng)域的領(lǐng)先優(yōu)勢。Pika創(chuàng)始人郭文景也回應(yīng)稱“已經(jīng)在籌備直接沖,將直接對標(biāo)Sora”??梢哉f,OpenAI通過Sora的成功,直接證明了通用大模型相較垂直模型的優(yōu)勢。在架構(gòu)與算法明確的前提下,通過大規(guī)模數(shù)據(jù)與大算力加持,便能夠?qū)崿F(xiàn)垂直領(lǐng)域應(yīng)用生成的“暴力美學(xué)”。

          張鵬也持有類似觀點(diǎn),他對記者表示,技術(shù)發(fā)展過程需要分層,這是一件階段性的事情。不做通用大模型,在垂直行業(yè)的落地效果未必能達(dá)到客戶要求。不去做垂直模型,很難知道客戶在想什么,也就不知道技術(shù)能幫助客戶提升的價值到底有多少。

          但通用大模型所耗費(fèi)的巨大成本,是限制如今大廠與創(chuàng)業(yè)公司大模型訓(xùn)練的重要因素,也是目前諸多大模型公司在權(quán)衡利弊之下推出小規(guī)模參數(shù)模型的重要原因。在行業(yè)人士看來,通過應(yīng)用與技術(shù)的雙輪驅(qū)動,即大模型應(yīng)用產(chǎn)生的數(shù)據(jù)反哺模型本身,迭代發(fā)展,倒逼底層技術(shù)突破,或許是一條可行路徑。

          整體來看,客觀上承認(rèn)差距、主觀上繼續(xù)追趕仍是2024年AI領(lǐng)域的主題。張鵬表示,技術(shù)層面,OpenAI確實(shí)沒有太多神秘的地方,且有很多原創(chuàng)的技術(shù)也不是OpenAI發(fā)明的,但它把這些技術(shù)發(fā)揚(yáng)光大或做到極致。從技術(shù)工程和落地上來看,這就是一件了不起的事情。ChatGPT從技術(shù)原理、工程化、應(yīng)用到市場,是一個非常緊密的閉環(huán),很難單獨(dú)割裂來看。

          預(yù)計在2024年,張鵬稱,大模型市場將從野蠻生長回歸冷靜,對于大模型的投資與炒作將會告一段落,行業(yè)焦點(diǎn)也將從模型本身轉(zhuǎn)向?qū)ふ覒?yīng)用。

          舉報
          第一財經(jīng)廣告合作,請點(diǎn)擊這里
          此內(nèi)容為第一財經(jīng)原創(chuàng),著作權(quán)歸第一財經(jīng)所有。未經(jīng)第一財經(jīng)書面授權(quán),不得以任何方式加以使用,包括轉(zhuǎn)載、摘編、復(fù)制或建立鏡像。第一財經(jīng)保留追究侵權(quán)者法律責(zé)任的權(quán)利。 如需獲得授權(quán)請聯(lián)系第一財經(jīng)版權(quán)部:021-22002972或021-22002335;banquan@yicai.com。

          文章作者

          一財最熱
          點(diǎn)擊關(guān)閉