亚洲中文字乱码免费播放,精品国产日韩专区欧美第一页,亚洲中文有码字幕青青,亚洲综合另类专区在线

首頁 > 新聞 > 科技

分享到微信

打開微信，點(diǎn)擊底部的“發(fā)現(xiàn)”，
使用“掃一掃”即可將網(wǎng)頁分享至朋友圈。

OpenAI信號燈又亮了 Sora能照亮國內(nèi)AGI前路嗎？

第一財經(jīng) 2024-02-21 18:30:52 聽新聞

作者：呂倩責(zé)編：李娜

作為AGI領(lǐng)域的信號燈，OpenAI推出Sora的成功，輕易掩蓋掉AI視頻創(chuàng)業(yè)公司此前的光芒，給國內(nèi)希冀通過垂直行業(yè)應(yīng)用落地實(shí)現(xiàn)彎道超車的路徑，蒙上了一層陰影。

OpenAI旗下文生視頻Sora爆火之時，國內(nèi)大模型初創(chuàng)企業(yè)頭部之一的月之暗面（Moonshot AI）傳出最新融資消息。

據(jù)稱，月之暗面在完成新一輪融資后，估值已達(dá)約25億美元。這輪融資是由紅杉中國、小紅書、美團(tuán)、阿里等投資方參與，且是國內(nèi)AI大模型公司迄今獲得的單輪最大金額融資。

此次融資動作，阿里與美團(tuán)站到同一陣列。此前，另一家頭部大模型企業(yè)智譜AI最新融資列表中，美團(tuán)、螞蟻、阿里、騰訊在列。王小川創(chuàng)立的百川智能資方中，也有阿里、騰訊、小米的身影。

面對微軟加持OpenAI、亞馬遜與谷歌加持Anthropic的巨頭陣列，以及復(fù)雜的宏觀環(huán)境，國內(nèi)大廠與大廠之間、大廠與大模型創(chuàng)業(yè)公司之間，選擇了牽手的形式，下注人工智能2.0賽道。

作為AGI（通用人工智能）領(lǐng)域的信號燈，此次OpenAI推出Sora的成功，輕易掩蓋掉AI視頻創(chuàng)業(yè)公司此前的光芒，給國內(nèi)希冀通過垂直行業(yè)應(yīng)用落地實(shí)現(xiàn)彎道超車的路徑，蒙上了一層陰影。

Sora拉起新一輪大模型熱潮

Sora的面世將人工智能熱潮再次拉到新高度，360集團(tuán)創(chuàng)始人周鴻祎感嘆：Sora的出現(xiàn)意味著AGI的實(shí)現(xiàn)從十年縮短至一兩年。從OpenAI發(fā)布的樣片來看，Sora不僅展現(xiàn)了視頻畫面的前后一致性，也展現(xiàn)出基本符合現(xiàn)實(shí)世界物理規(guī)律的畫面效果。

興奮之余也需冷靜看到，一方面Sora產(chǎn)出的視頻內(nèi)容仍存在不符合物理規(guī)律的問題。另一方面，文本轉(zhuǎn)視頻模型并非OpenAI首創(chuàng)，該領(lǐng)域中此前已有Google推出的Lumiere、Stability AI推出的SVD、Meta推出的Emu Video等，相關(guān)產(chǎn)品技術(shù)已被影視制作公司使用制作影視特效。

真格基金管理合伙人戴雨森表示，很多人現(xiàn)在對Sora的期待短期會落空，是因?yàn)閷ora直接類比ChatGPT，實(shí)際上類比GPT3更合適。Sora通過學(xué)習(xí)海量視頻使得AI開始涌現(xiàn)對物理規(guī)律的理解，這與GPT3通過學(xué)習(xí)海量文本使得AI開始涌現(xiàn)對語言+知識的理解很像。但需注意，GPT3剛面世時也是一個問題很多、很難用的模型，經(jīng)過了幾次模型和產(chǎn)品的迭代，兩年后才有了一個完整的ChatGPT產(chǎn)品問世。

IDC 中國研究總監(jiān)盧言霞表示，Sora是生成式AI在文生視頻領(lǐng)域真正邁出了第一步，做到生成式AI驅(qū)動生成短視頻。接下來也將刺激其他科技巨頭加快在該領(lǐng)域的技術(shù)攻關(guān)力度以及產(chǎn)品發(fā)布速度。但未來具體哪些公司能在什么時間點(diǎn)推出與 Sora 類似的產(chǎn)品，不可預(yù)測。當(dāng)前Sora生成的是1分鐘的視頻，對于行業(yè)已經(jīng)是重大突破，下一步何時能生成2分鐘或5分鐘以上的視頻，也不可預(yù)測。

但目前最先應(yīng)用落地的領(lǐng)域?qū)⑹嵌桃曨l、廣告、互娛、影視、媒體等。在盧言霞看來，這些領(lǐng)域采用多模態(tài)大模型能力輔助人類員工生成視頻，既可以提高生產(chǎn)速度又可以提高生產(chǎn)數(shù)量，還可以創(chuàng)造全新的視覺感受，能夠幫助企業(yè)真正實(shí)現(xiàn)降本增效、提升用戶體驗(yàn)。

在萬興科技AI創(chuàng)新中心總經(jīng)理齊博看來，OpenAI采用DiT等技術(shù)實(shí)現(xiàn)“世界模擬器”，達(dá)到理解真實(shí)世界的運(yùn)動和物理能力。它用于文生視頻，可以生成超逼真的符合物理和運(yùn)動學(xué)的復(fù)雜場景的視頻，也就是說，可以理解和模擬真實(shí)世界。理解和模擬真實(shí)世界是AGI關(guān)鍵一步，能夠加速通用人工智能的實(shí)現(xiàn)。

此次Sora的成功在齊博看來是因其依然遵循OpenAI的Scaling Law，大力出奇跡，采用了大量數(shù)據(jù)、大模型與大量算力。Sora底層采用了游戲、無人駕駛和機(jī)器人領(lǐng)域驗(yàn)證的世界模型，構(gòu)建文生視頻模型，達(dá)到模擬世界的能力，具體采用DiT（Diffusion Transformer），處理不同持續(xù)時間、分辨率和比例的視頻/圖像。

世界模擬器是AI生成視頻的另一種方式，齊博認(rèn)為，它的成功會帶動視頻生成賽道的發(fā)展，加速視頻生成的創(chuàng)新和成熟。

Sora背后的多模態(tài)趨勢

OpenAI憑借此次Sora的爆火一舉將生成式AI的關(guān)注點(diǎn)從文生文、文生圖拉高至文生視頻。一位行業(yè)人士表示，如果說AIGC（生成式人工智能）是AI領(lǐng)域皇冠，那么文生視頻就是皇冠上的寶石。而Sora的出現(xiàn)意味著大模型的競爭到了比拼多模態(tài)、也是大模型技術(shù)最后一塊拼圖的階段。在國內(nèi)市場從業(yè)者眼中，這是他們正在追趕但尚未達(dá)到的目標(biāo)。

清華系背景的楊植麟在2015年從清華計算機(jī)系畢業(yè)后，前往美國卡內(nèi)基梅隆大學(xué)攻讀博士，師從蘋果AI研究負(fù)責(zé)人Ruslan Salakhutdinov 和谷歌首席科學(xué)家 William Cohen。

雖從2020年開始確定“大模型是未來”的趨勢，但在2023年之前，他認(rèn)為亞洲可能并不存在做大模型公司的機(jī)會。但從2022年年底，楊植麟的判斷開始發(fā)生很大變化，因GPT在美國市場已引發(fā)很大關(guān)注。

如今行業(yè)對大模型的議題已從ChatGPT變?yōu)镾ora，楊植麟表示，多模態(tài)過去幾年卡在架構(gòu)上，缺少真正通用的模型。預(yù)計2024年月之暗面也會推出多模態(tài)產(chǎn)品，但公司的目標(biāo)是在大模型領(lǐng)域做To C超級應(yīng)用。

智譜AI成立于2019年，由清華大學(xué)計算機(jī)系知識工程實(shí)驗(yàn)室的技術(shù)成果轉(zhuǎn)化而來。其創(chuàng)始人張鵬表示，智譜AI可能是國內(nèi)最早開始一批做大模型和技術(shù)研發(fā)的團(tuán)隊(duì)，

談及OpenAI，張鵬表示智譜AI和OpenAI最重要的一個相似之處是目標(biāo)相同，都希望能夠?qū)崿F(xiàn)AGI，且都認(rèn)為大模型是實(shí)現(xiàn)AGI的必經(jīng)之路，因此雙方在發(fā)展路徑有相似性。但智譜AI也并不是完全按照OpenAI的路徑發(fā)展。不同于比較主流的 GPT，智譜AI采用的是全自研的GLM（通用語言模型）預(yù)訓(xùn)練框架，這也是張鵬認(rèn)為有可能超越OpenAI的機(jī)會。

在張鵬看來，從2020年開始，國外的一些頂尖的公司不再選擇開源路線，學(xué)術(shù)界關(guān)于大模型的研究和技術(shù)上的細(xì)節(jié)也不再公開，國內(nèi)研發(fā)團(tuán)隊(duì)相當(dāng)于走進(jìn)了“無人區(qū)”，前方?jīng)]有可供參照的道路，而一個千億參數(shù)規(guī)模的大模型研發(fā)成本動輒上千萬，試錯成本巨大。

談及美國率先進(jìn)行多模態(tài)落地的動作，張鵬對記者表示，首先國外先產(chǎn)生多模態(tài)的概念與技術(shù)。其次，商業(yè)化路徑上，國外會先熱一陣子，國內(nèi)在一定程度上進(jìn)行跟進(jìn)，這與雙方的創(chuàng)新生態(tài)有關(guān)。相較而言，美國市場與投資者更愿意去采納新的技術(shù)，再進(jìn)行孵化，也允許行業(yè)發(fā)生失敗，在更替的循環(huán)中催熟技術(shù)與市場。而國內(nèi)市場更多會選擇尋找一個合適的時機(jī)切入，而非上述創(chuàng)新試錯過程，這屬于雙方在生態(tài)上的差異性。

至于多模態(tài)技術(shù)本身，張鵬表示，對于AGI來說，多模態(tài)這件事情是必須要去解決的，這個能力必須擁有。包括模型本身能力提升所帶來的類似CoT（思維鏈）這樣的高階能力，便根植于底層的基礎(chǔ)模型能力。包括智譜AI在內(nèi)的多家公司已經(jīng)在做了。

面壁智能CEO李大海表示，公司在多模態(tài)結(jié)合方面處于進(jìn)行中狀態(tài)，當(dāng)技術(shù)研究到一定程度后會選擇接入。在清華大學(xué)計算機(jī)系長聘副教授、面壁智能聯(lián)合創(chuàng)始人劉知遠(yuǎn)看來，多模態(tài)大模型方向反而是國內(nèi)與國際差距相對較小的方向，該方向與自然語言處理領(lǐng)域大模型相比，成熟度還不夠，技術(shù)路線也不明確，包括此前各類的模型架構(gòu)尚處于百花齊放的過程。劉知遠(yuǎn)認(rèn)為，未來一兩年內(nèi)可能會形成一個類似于ChatGPT的模式來支持面壁智能將多模態(tài)的工作做得更好。

趕超OpenAI的路徑到底是什么

從文生文的ChatGPT，到文生圖的DALL·E，再到此次文生視頻的Sora，OpenAI每次發(fā)布的產(chǎn)品都將業(yè)界目光吸引。國內(nèi)市場也在不斷追問——距離OpenAI還有多遠(yuǎn)？

談及與OpenAI之間的差距，楊植麟表示，追趕的過程需要時間與技術(shù)創(chuàng)新。一方面后發(fā)優(yōu)勢可以利用OpenAI等先行者已做出的工作與成功。但客觀上需承認(rèn)，雙方差距很大。長期來看，AI是異質(zhì)化的，不同人面對的AI維度不同。另外，AI模型的自建也不存在超越與否的問題，不同工具在不同場景上的優(yōu)勢也不同。

就目前國內(nèi)在大模型領(lǐng)域的布局來看，主要分為兩派——一派是以阿里、百度、騰訊、字節(jié)為代表的互聯(lián)網(wǎng)大廠，其所產(chǎn)出的大模型產(chǎn)品不同于美國自實(shí)驗(yàn)室孵化成熟再推出的路徑，多從產(chǎn)業(yè)角度出發(fā)，如百度文心一言結(jié)合搜索業(yè)務(wù)，騰訊通過混元大模型技術(shù)提升廣告效率，阿里通義千問結(jié)合自身生態(tài)產(chǎn)品進(jìn)行提效，原抖音CEO張楠調(diào)任剪映，將AI技術(shù)應(yīng)用于視頻創(chuàng)作。另一派是從技術(shù)側(cè)入手的創(chuàng)業(yè)公司，尤以清華系為重。

兩大派別雖在通用大模型與垂直行業(yè)模型領(lǐng)域投入力度有所不同，但均對應(yīng)用端寄予厚望。多位投資人對記者表示，目前國內(nèi)市場在大模型領(lǐng)域的最大機(jī)會在于應(yīng)用層面。BV百度風(fēng)投CEO、管理合伙人高雪表示，在目前的市場上，想要找到既能訓(xùn)練出好模型，又有充足的私有數(shù)據(jù)，同時實(shí)現(xiàn)數(shù)據(jù)飛輪的項(xiàng)目，是一件比較有挑戰(zhàn)的事情。針對大模型應(yīng)用層面，由于海外生態(tài)發(fā)展繁榮，大量底層模型已趨成熟，提供了很多可接入的API。而中國剛剛開始，還需要時間去成長。一類是訓(xùn)練AI做個人助理類型，第二類是情感陪護(hù)類型。

渶策資本創(chuàng)始合伙人胡斌認(rèn)為，底層大模型雖然很卷，可中國也有自己的機(jī)會。在人工智能的賦能下，垂直領(lǐng)域會有很多的顛覆出現(xiàn)，它的組織形式和用戶的入口和人機(jī)界面的形式都會發(fā)生革命性的變化。

至于大模型應(yīng)用的具體應(yīng)用，包括百度、騰訊等相關(guān)負(fù)責(zé)人均強(qiáng)調(diào)，是指從大模型原生能力出發(fā)誕生的新應(yīng)用，而不是借助大模型技術(shù)對原有應(yīng)用的升級。這在美國的AI視頻領(lǐng)域已呈活躍態(tài)勢，如Runway宣布其AI視頻生成工具Gen-2更新；Meta 宣布推出兩款 AI 驅(qū)動的生成模型—— Emu Video 和 Emu Edit；靠AI 繪畫走紅的 Stability AI 發(fā)布AI 模型 Stable Video Diffusion；AI 視頻工具 Pika 1.0 發(fā)布，效果媲美 Runway 的 Gen-2。

彼時，不少投資人認(rèn)為Pika是OpenAI經(jīng)歷“政變”后的潛力股，但Sora的面世給應(yīng)用層公司敲響了警鐘，通用大模型的升級一舉打破此前Runway、Pika在該領(lǐng)域的領(lǐng)先優(yōu)勢。Pika創(chuàng)始人郭文景也回應(yīng)稱“已經(jīng)在籌備直接沖，將直接對標(biāo)Sora”?？梢哉f，OpenAI通過Sora的成功，直接證明了通用大模型相較垂直模型的優(yōu)勢。在架構(gòu)與算法明確的前提下，通過大規(guī)模數(shù)據(jù)與大算力加持，便能夠?qū)崿F(xiàn)垂直領(lǐng)域應(yīng)用生成的“暴力美學(xué)”。

張鵬也持有類似觀點(diǎn)，他對記者表示，技術(shù)發(fā)展過程需要分層，這是一件階段性的事情。不做通用大模型，在垂直行業(yè)的落地效果未必能達(dá)到客戶要求。不去做垂直模型，很難知道客戶在想什么，也就不知道技術(shù)能幫助客戶提升的價值到底有多少。

但通用大模型所耗費(fèi)的巨大成本，是限制如今大廠與創(chuàng)業(yè)公司大模型訓(xùn)練的重要因素，也是目前諸多大模型公司在權(quán)衡利弊之下推出小規(guī)模參數(shù)模型的重要原因。在行業(yè)人士看來，通過應(yīng)用與技術(shù)的雙輪驅(qū)動，即大模型應(yīng)用產(chǎn)生的數(shù)據(jù)反哺模型本身，迭代發(fā)展，倒逼底層技術(shù)突破，或許是一條可行路徑。

整體來看，客觀上承認(rèn)差距、主觀上繼續(xù)追趕仍是2024年AI領(lǐng)域的主題。張鵬表示，技術(shù)層面，OpenAI確實(shí)沒有太多神秘的地方，且有很多原創(chuàng)的技術(shù)也不是OpenAI發(fā)明的，但它把這些技術(shù)發(fā)揚(yáng)光大或做到極致。從技術(shù)工程和落地上來看，這就是一件了不起的事情。ChatGPT從技術(shù)原理、工程化、應(yīng)用到市場，是一個非常緊密的閉環(huán)，很難單獨(dú)割裂來看。

預(yù)計在2024年，張鵬稱，大模型市場將從野蠻生長回歸冷靜，對于大模型的投資與炒作將會告一段落，行業(yè)焦點(diǎn)也將從模型本身轉(zhuǎn)向?qū)ふ覒?yīng)用。

舉報

第一財經(jīng)廣告合作，請點(diǎn)擊這里

此內(nèi)容為第一財經(jīng)原創(chuàng)，著作權(quán)歸第一財經(jīng)所有。未經(jīng)第一財經(jīng)書面授權(quán)，不得以任何方式加以使用，包括轉(zhuǎn)載、摘編、復(fù)制或建立鏡像。第一財經(jīng)保留追究侵權(quán)者法律責(zé)任的權(quán)利。如需獲得授權(quán)請聯(lián)系第一財經(jīng)版權(quán)部：021-22002972或021-22002335；banquan@yicai.com。

文章作者

呂倩

相關(guān)閱讀

OpenAI后谷歌又有大動作，DeepSeek“鯰魚效應(yīng)”攪動硅谷科技圈

盡管新模型表現(xiàn)優(yōu)秀，谷歌在昨日晚間美股大跌7%，總市值減少超1800億美元。

Figure AI與OpenAI“分手”，人形機(jī)器人公司與大模型公司重新劃定邊界

一些人形機(jī)器人廠商此前走上與大模型公司合作的道路。

276 昨天 11:40

DeepSeek繁榮了歐洲AI生態(tài)，有初創(chuàng)公司已棄用ChatGPT

DeepSeek的出現(xiàn)正在改變?nèi)斯ぶ悄艿母窬郑尮灸軌蛞詷O低的成本使用該技術(shù)，并可能推動其他人工智能公司改進(jìn)他們的模型并降低價格。

296 02-04 16:13

DeepSeek的“蒸餾模型”超越原創(chuàng)？美國要對“蒸餾技術(shù)”下手

數(shù)據(jù)蒸餾是一種業(yè)內(nèi)常見的技術(shù)做法，是指通過一系列算法和策略，將原始的、復(fù)雜的數(shù)據(jù)進(jìn)行去噪、降維、提煉等操作，從而得到更為精煉、有用的數(shù)據(jù)。

1091 01-30 12:40

OpenAI發(fā)布能訂餐、購物的Operator，高管稱智能體之年來了

OpenAI CEO山姆·奧爾特曼認(rèn)為，2025年人們將會看到第一批AI智能體“加入勞動力大軍”。

171 01-24 11:39

一財最熱

點(diǎn)擊關(guān)閉

<tt id="6lcbg"><center id="6lcbg"></center></tt>

<samp id="6lcbg"></samp>