亚洲中文字乱码免费播放,精品国产日韩专区欧美第一页,亚洲中文有码字幕青青,亚洲综合另类专区在线

首頁 > 新聞 > 科技

分享到微信

打開微信，點擊底部的“發(fā)現(xiàn)”，
使用“掃一掃”即可將網(wǎng)頁分享至朋友圈。

機器人的“數(shù)據(jù)戰(zhàn)爭”：燒錢難解數(shù)據(jù)饑渴，數(shù)據(jù)集需“排毒”

第一財經(jīng) 2025-02-19 11:49:41 聽新聞

作者：喬心怡責編：劉佳

在這場隱形的數(shù)據(jù)戰(zhàn)爭中，高質(zhì)量的數(shù)據(jù)也許會成為將來具身智能企業(yè)的核心壁壘。

當馬斯克正在擔憂AI訓(xùn)練數(shù)據(jù)已經(jīng)耗盡的時候，具身智能企業(yè)正在面臨殘酷的數(shù)據(jù)生死局：訓(xùn)練一個倒水動作需要一臺超算運算千萬億次、第三方的數(shù)據(jù)“有毒”隨時會讓模型崩潰，仿真數(shù)據(jù)成本也正在攀升……

在這場決定未來機器人進化速度和方向的隱形數(shù)據(jù)大戰(zhàn)中，有具身智能企業(yè)正通過“反直覺”的訓(xùn)練方法撕開突破口，讓機器人在不相關(guān)的雜亂任務(wù)中領(lǐng)悟物理法則，試圖建立數(shù)據(jù)護城河。

當AI向物理空間延伸，數(shù)據(jù)極有可能成為重塑技術(shù)權(quán)力的關(guān)鍵。不過，機器人想要跨越臨界值，迎來具身大模型的GPT時刻，還需要解決數(shù)據(jù)質(zhì)量、算法、算力等多方面的問題。畢竟，具身智能的終局不會是單點技術(shù)的勝利，而是軟件、硬件與商業(yè)模式的系統(tǒng)戰(zhàn)爭。

克服“數(shù)據(jù)饑渴”

想要訓(xùn)練一個機器人的大模型，究竟需要多少數(shù)據(jù)？

“通常來講，一臺超級計算機，每秒鐘可以進行千萬億次到數(shù)百億億次浮點運算，而光是想要模擬人晃動杯中的水這一個動作，所涉及的計算量可能就需要一臺超級計算機算十分鐘?！?/p>

具身大模型企業(yè)自變量機器人（X Square）的創(chuàng)始人兼CEO王潛向第一財經(jīng)記者舉了上述例子，來說明想要讓機器人實現(xiàn)物理世界的復(fù)雜交互，需要多少多模態(tài)的真實和仿真數(shù)據(jù)支持?！案匾氖牵瑢τ谝恍?fù)雜的動作，按照此前業(yè)界普遍采用的分層模型邏輯，幾乎是無法實現(xiàn)的事情?！蓖鯘撜f道。

分層模型，曾經(jīng)被認為是機器人領(lǐng)域的黃金法則：先建模、再規(guī)劃、最后執(zhí)行。但在執(zhí)行過程中，王潛發(fā)現(xiàn)，隨著每一層模型的傳遞，模型在某一層產(chǎn)生的微小誤差，將會在后續(xù)的環(huán)節(jié)呈現(xiàn)指數(shù)級的擴散。

每分出一個步驟，就有可能給模型引入噪聲。“如果一開始建模的誤差在1%，那隨著分層模型的傳導(dǎo)，在執(zhí)行的最終結(jié)果中，很有可能會出現(xiàn)幾十倍的誤差?！蓖鯘撜f道。因此，端到端的模型也逐漸成為了下一個發(fā)展方向。在端到端的模型設(shè)計里，直接連接輸入與輸出的“黑箱”特性，讓具身大模型的自我修正成為可能。

技術(shù)路徑更迭，海量的數(shù)據(jù)，始終是橫亙在具身智能大模型面前的天塹。王潛告訴第一財經(jīng)記者，“數(shù)據(jù)饑渴”在行業(yè)中一直存在。“它的底層邏輯是，強化學(xué)習(xí)的路徑需要指數(shù)級增長的數(shù)據(jù)，而仿真數(shù)據(jù)又容易因為物理交互的復(fù)雜性難以遷移到現(xiàn)實?！?/p>

這種數(shù)據(jù)饑渴一直到GPT-3的出現(xiàn)才有所緩解?！癎PT-3的出現(xiàn)，其實帶給我們的是‘反人類直覺’的啟示?！蓖鯘摻忉?，此前訓(xùn)練機器人的某一動作模型，總是喂給其相似的任務(wù)數(shù)據(jù)語料。“但GPT-3的底層邏輯是，通過多任務(wù)學(xué)習(xí)，模型被迫提煉跨任務(wù)的共性規(guī)律，從而具備少樣本甚至零樣本的學(xué)習(xí)能力。”

看似完全不相干的任務(wù)，能夠逼迫具身大模型更快地學(xué)習(xí)物理世界的通用原理。王潛說，當模型同時學(xué)習(xí)倒水、換衣服等任務(wù)時，看似沒有直接關(guān)聯(lián)，但大模型能通過大量的這些任務(wù)，學(xué)習(xí)如何處理類似的摩擦，認識到“抓握”“材質(zhì)”等物理世界通用的邏輯。

一旦這條邏輯得到驗證，那么大語言模型少樣本甚至零樣本的學(xué)習(xí)能力將有機會在具身智能大模型上重現(xiàn)，幫助機器人跨越數(shù)據(jù)的死亡谷。

第三方數(shù)據(jù)需“排毒”

盡管GPT3的出現(xiàn)，給具身智能大模型帶來了“解藥”，但具身智能數(shù)據(jù)場中的隱形戰(zhàn)爭，仍未停止。

Jerry是一家高校的助理教授，也是國際上最早一批研究具身智能數(shù)據(jù)的學(xué)者之一，他告訴第一財經(jīng)記者，相比于大語言模型上的數(shù)據(jù)資源，具身大模型的數(shù)據(jù)成本會高很多。“過去很長時間內(nèi)，互聯(lián)網(wǎng)已經(jīng)完成了人類知識的沉淀，這些資源是一個新的能源，只是過去在底層，AI訓(xùn)練的時候被‘挖’了出來?！?/p>

他告訴記者，大模型的數(shù)據(jù)來源主要分為三塊，第一塊是過去由互聯(lián)網(wǎng)完成了數(shù)字化沉淀的數(shù)據(jù)，它記錄了人類對這個世界的感知；第二塊是嫁接了圖文、3D等多種模態(tài)的數(shù)據(jù)；第三塊則是通過不同傳感器獲取的數(shù)據(jù)。

數(shù)據(jù)標注師正在工作。圖片來源：新華社

“在訓(xùn)練機器人大模型過程當中，我們實際遇到的情況是，這個行業(yè)本來就沒有數(shù)據(jù)資源，所以我們需要冷啟動，將數(shù)據(jù)收集起來，才能實際推動行業(yè)。”王潛說道。

過去幾年，人工智能的火爆，令訓(xùn)練AI模型數(shù)據(jù)添加標簽的Scale AI炙手火熱，在機器人領(lǐng)域是否也會出現(xiàn)類似Scale AI的獨角獸？

隨著機器人行業(yè)的拓展，上游的數(shù)據(jù)供應(yīng)商也不斷涌現(xiàn)。2023年前后，艾歐智能等國內(nèi)第三方的具身智能機器人場景數(shù)據(jù)供應(yīng)商開始出現(xiàn)。2024年年底，智元機器人宣布開源 AgiBot World，智元稱它是一個匯集百萬真實機器人數(shù)據(jù)的開源數(shù)據(jù)集。2025年1月，松靈機器人推出全新通用數(shù)據(jù)采集方案，配備了200°魚眼相機、雙目深度相機等傳感器確保數(shù)據(jù)感知。

不過，另一位使用過第三方提供數(shù)據(jù)的具身智能從業(yè)者告訴第一財經(jīng)記者，就大模型的訓(xùn)練要求來說，第三方的數(shù)據(jù)使用率可能不足1%?！拔覀兘?jīng)常遇到的情況是，買了100萬條數(shù)據(jù)，經(jīng)過嚴格的質(zhì)量篩選后，實際投入使用的數(shù)據(jù)量可能只有1萬條甚至更少?！?/p>

上述從業(yè)者向記者解釋，無用的數(shù)據(jù)，不僅僅是對模型無幫助，更可能是有毒；有毒的數(shù)據(jù)多了，模型就會崩潰。

在這場隱形的數(shù)據(jù)戰(zhàn)爭中，高質(zhì)量的數(shù)據(jù)也許會成為將來具身智能企業(yè)的核心壁壘?！拔磥?，數(shù)據(jù)集的護城河也許比算法更深?！盝erry說道。

模擬數(shù)據(jù)也要講性價比

相比具身智能大模型，大語言模型走得更前也更快，一些數(shù)據(jù)問題已經(jīng)暴露了出來。

馬斯克在今年社交媒體X上的一場直播中提到，人工智能數(shù)據(jù)訓(xùn)練已經(jīng)耗盡。他表示：“我們基本上已經(jīng)用盡了人類知識的累積總和來進行AI訓(xùn)練，這種情況大約在去年就已經(jīng)發(fā)生了?！比ツ?2月，OpenAI 的前首席科學(xué)家 Ilya Sutskever 也在一次分享中提及，盡管現(xiàn)有的數(shù)據(jù)仍能推動人工智能的發(fā)展，但這個行業(yè)里稱得上可用的新數(shù)據(jù)已經(jīng)接近枯竭。

“對于大模型的預(yù)訓(xùn)練來說，我們所用到的數(shù)據(jù)的確已經(jīng)接近峰值?！泵髟拢ɑ┦菄鴥?nèi)頭部大語言模型的數(shù)據(jù)標注師，她認為，人類生成的優(yōu)質(zhì)內(nèi)容占比正在下降?！岸椰F(xiàn)在大語言模型訓(xùn)練已經(jīng)走向了垂直領(lǐng)域，公用數(shù)據(jù)資源更少。以醫(yī)療領(lǐng)域來舉例，合法、公開的數(shù)據(jù)是很有限的?！?/p>

因此，合成數(shù)據(jù)又成為了“救命稻草”。明月告訴第一財經(jīng)記者，合成數(shù)據(jù)在大模型訓(xùn)練中的占比走高，這是行業(yè)中默認的規(guī)則?！暗欠駮苫糜X，會生成多少幻覺，業(yè)內(nèi)也還在討論中?！?/p>

對于具身智能而言，合成數(shù)據(jù)并不一定比真實數(shù)據(jù)“劃算”。王潛告訴第一財經(jīng)記者，模擬不同狀態(tài)物體所需要的數(shù)據(jù)量不同?！耙驗槲覀儾豢赡苡靡粋€超算中心計算10分鐘來精確模擬晃動一杯水這一幾秒鐘的動作。所以模擬器的精度在合成數(shù)據(jù)時，我們常常都會設(shè)置得比較低。”

因此，一般在模擬器中訓(xùn)練出的模型遷移到現(xiàn)實世界會遇到嚴重的障礙，也就是所謂的泛化性不高。要想訓(xùn)練出泛化性高到可以在現(xiàn)實世界中部署的模型，一種常見的做法是在模擬器中模擬出不同物理規(guī)律的世界，并將大模型放在這些環(huán)境中訓(xùn)練。“如果它在這些環(huán)境中都能夠獲得很好的效果，那么理論上，它再轉(zhuǎn)移到現(xiàn)實世界中去就很簡單了?！?/p>

王潛向記者舉例，如果想要訓(xùn)練出一個能夠操作六個自由參數(shù)量的剛體模型，那需要模擬的數(shù)量級可能在十的六次方?！暗绻且粋€柔性的物體，它也許有100個參數(shù)，模擬環(huán)境數(shù)量的量級可能就會大很多，成本和技術(shù)難度都太高了?！蓖鯘撜f道。

“在GPU里跑模擬數(shù)據(jù)也是需要成本的，因此在稍微復(fù)雜一點的任務(wù)上，模擬器其實已經(jīng)有很明顯的劣勢了。”王潛判斷，未來機器人靈巧的手部操作，無法純粹靠模擬器數(shù)據(jù)做出來。

具身智能發(fā)展至今，一些大模型也逐漸浮出水面。星動紀元在去年12月發(fā)布了原生端到端機器人大模型ERA-42；同一時期，靈初智能也發(fā)布了基于強化學(xué)習(xí)的端到端具身模型Psi R0；銀河通用也在今年1月發(fā)布了基于仿真合成大數(shù)據(jù)的具身模型GraspVLA。

大模型demo演示視頻截圖。圖片來源：星動紀元

不過第一財經(jīng)記者注意到，這些大模型在演示中大多都集中突出了一些簡單的手部姿勢，動作集中在拿放，大模型的泛化性和輸出穩(wěn)定性如何均未有明確展示。

舉報

第一財經(jīng)廣告合作，請點擊這里

此內(nèi)容為第一財經(jīng)原創(chuàng)，著作權(quán)歸第一財經(jīng)所有。未經(jīng)第一財經(jīng)書面授權(quán)，不得以任何方式加以使用，包括轉(zhuǎn)載、摘編、復(fù)制或建立鏡像。第一財經(jīng)保留追究侵權(quán)者法律責任的權(quán)利。
如需獲得授權(quán)請聯(lián)系第一財經(jīng)版權(quán)部：banquan@yicai.com

文章作者

喬心怡

相關(guān)閱讀

工信部：持續(xù)推進“人工智能+”行動，培育壯大智能網(wǎng)聯(lián)新能源汽車等新興產(chǎn)業(yè)和未來產(chǎn)業(yè)

擴大5G規(guī)?；瘧?yīng)用，加快6G研發(fā)進程，推動工業(yè)互聯(lián)網(wǎng)創(chuàng)新發(fā)展，推進算力中心建設(shè)布局優(yōu)化，創(chuàng)新行業(yè)監(jiān)管方式，強化網(wǎng)絡(luò)和數(shù)據(jù)安全保障，加強無線電管理，提升頻譜技術(shù)創(chuàng)新能力和頻譜資源開發(fā)利用水平。

115 03-12 17:55

上海具身智能再出代表作，離機器人“打工”更進一步

預(yù)計家庭機器人等將在5年左右完成研發(fā)并投入市場，價格在30萬元以上。

247 03-11 22:48

AI進化速遞丨國家超算互聯(lián)網(wǎng)平臺QwQ-32B API接口服務(wù)上線

①國家超算互聯(lián)網(wǎng)QwQ-32B API接口服務(wù)上線，免費100萬Tokens；②華為已正式組建醫(yī)療衛(wèi)生軍團，重點構(gòu)建AI輔助診斷解決方案體系，推動醫(yī)療大模型在臨床場景的應(yīng)用；③中控技術(shù)與大華股份成立視覺AI聯(lián)合實驗室。

《政府工作報告》首提具身智能和智能機器人，硅基智能“上大分”

當人口紅利逐漸消退，唯有通過“硅基智能”與“硅基制造”，也就是AI和實體產(chǎn)業(yè)的深度融合，才能重構(gòu)經(jīng)濟增長的底層邏輯。

234 03-05 15:50

人形機器人：科技浪潮中的崛起力量

在科技飛速發(fā)展的21世紀，全球正處于智能化變革的浪潮之中。隨著人工智能、物聯(lián)網(wǎng)等前沿技術(shù)的突破，人形機器人應(yīng)運而生，成為世界各國角逐科技高地的焦點。我國人口老齡化加劇、制造業(yè)亟待升級、教育需求多元化，這些社會現(xiàn)實為其發(fā)展提供了沃土。從國際看，科技巨頭紛紛入局，搶占人形機器人市場份額，試圖主導(dǎo)產(chǎn)業(yè)走向；國內(nèi)政策大力扶持，資本涌入，產(chǎn)學(xué)研緊密合作，一場圍繞人形機器人的科技競賽悄然展開，它承載著提升生活品質(zhì)、變革產(chǎn)業(yè)結(jié)構(gòu)、彰顯科技實力的重任。

一財最熱

點擊關(guān)閉