分享到微信打開微信,點擊底部的“發(fā)現(xiàn)”, |
北京亦莊的人形機器人半程馬拉松剛落下帷幕,賽事中機器人的“摸爬滾打”,成為人形機器人從“3歲小孩”邁向成人的成長注腳。
如何解決人形機器人摔倒等問題,成為接下來業(yè)內(nèi)的重點。此外,此次半程馬拉松允許途中更換電池或更換機器人,如何讓機器人未來較為連續(xù)地跑完半馬,也是值得思考的問題。
在業(yè)內(nèi)看來,“摔倒”是一個復雜問題,不僅涉及算法魯棒性,還與機器人系統(tǒng)設計挑戰(zhàn)有關(guān)。第一財經(jīng)記者了解到,為了解決摔倒等問題、加快行業(yè)邁向標準化,人形機器人硬件產(chǎn)業(yè)鏈近期有所行動。
機器人摔倒背后
半程馬拉松中,來自北京人形機器人創(chuàng)新中心的天工Ultra 用時2小時40分鐘率先完賽。比賽中機器人摔倒、摔倒后爬起并不罕見。天工Ultra在賽程過半后也一度摔倒,并在技術(shù)人員維修后繼續(xù)出發(fā)?!皺C器人中途有一次摔跤,是電池失效時出現(xiàn)的故障?!北本┤诵螜C器人創(chuàng)新中心CTO唐劍對第一財經(jīng)表示。
除了電池失效故障,記者從業(yè)內(nèi)人士了解到,人形機器人穩(wěn)定站立和行走一直是業(yè)界難題,摔倒背后還有一些更系統(tǒng)性的原因,例如,系統(tǒng)延遲也可能導致機器人摔倒。
“傳統(tǒng)(具身智能)的大腦和小腦分開,甚至用的芯片系統(tǒng)可能都不一樣,彼此間通信、協(xié)作有系統(tǒng)級別的延遲?!?英特爾中國邊緣計算事業(yè)部行業(yè)解決方案高級總監(jiān)李巖告訴記者,他從一些客戶了解到,由于系統(tǒng)間的通信延遲,會造成機器人摔倒。
具體而言,所謂大小腦分開可理解為大腦和小腦采用不同芯片。這種大小腦分開的設計源于具身智能演進過程中的算力需求增長,又因為大小腦運行工作負載存在差異,而被認為是一種現(xiàn)階段可被接受的設計,但其弊端也逐漸凸顯。
據(jù)英特爾技術(shù)專家介紹,目前主流計算架構(gòu)中,小腦部分以x86(一種CPU主流架構(gòu))芯片為主,如英特爾12、13代酷睿,大腦部分方案以其他廠商的產(chǎn)品為主。有技術(shù)人員告訴記者,人形機器人在推理側(cè)不僅有CPU(中央處理器)+GPU(圖形處理器)的方案,還有CPU+NPU(神經(jīng)網(wǎng)絡處理器)的方案。
以上多芯片組合背后,是算力需求不斷增長。有技術(shù)人員告訴記者,大語言模型和視覺模型增強了具身智能的泛化能力,自去年下半年起,業(yè)界還試圖用統(tǒng)一的大模型解決所有問題,將動作、操作和運動等維度的數(shù)據(jù)納入訓練,催生出了端到端的視覺動作大模型和視覺語言動作大模型。這個過程中,算法由人工設計算法逐漸轉(zhuǎn)向由數(shù)據(jù)驅(qū)動模型,由此帶來的算力需求增長,讓計算平臺由CPU轉(zhuǎn)向CPU、GPU并重乃至云端輔助。
大小腦要解決的問題不同,為避免計算負載過大導致運動協(xié)調(diào)問題,人為將大腦和小腦分開也成為一種現(xiàn)實選擇。英特爾中國邊緣計算事業(yè)部機器人產(chǎn)品資深架構(gòu)師楊洪告訴記者,小腦通常運行底層操作系統(tǒng)、底層實時運動控制等,要求反應快,大腦主要工作負載則是接收并處理傳感器數(shù)據(jù)、生成運動規(guī)劃和決策?!爱敊C身移動或周圍環(huán)境變化較大時,峰值計算負載可能比較大?!睏詈檎f,為應對這個挑戰(zhàn),業(yè)內(nèi)形成將大腦和小腦劃分為兩個不同系統(tǒng)的主流做法。
然而,大小腦分開的弊端逐漸凸顯,機器人容易因延遲而摔倒便成為業(yè)界不得不面對的問題。楊洪說,大腦和小腦兩套系統(tǒng)進行大量數(shù)據(jù)傳遞時,容易出現(xiàn)數(shù)據(jù)傳遞延遲。
在大小腦分開的架構(gòu)下,解決數(shù)據(jù)傳輸延遲的問題并不容易。浙江人形機器人創(chuàng)新中心首席科學家熊蓉告訴記者,大小腦硬件上的分開,讓多種傳感器融合變得困難,“現(xiàn)在小腦不純粹是執(zhí)行控制,我們還希望它能對作業(yè)對象形成控制。如果大小腦分開,一些傳感器放在大腦上,往下傳遞信息會出現(xiàn)信息量過大的情況。”
具體至靈巧手運動,熊蓉向記者舉例,靈巧手有觸、力、視覺傳感器,大小腦分開的情況下,為保證靈巧手實時控制,就需要把觸覺放到底層。然而,大腦決策規(guī)劃也要用到觸覺信息。如果觸覺信息要從小腦傳到大腦,視覺信息要從大腦傳到小腦,期間就存在延遲。
熊蓉表示,加大網(wǎng)絡帶寬可以應對信息傳輸量過大、出現(xiàn)延遲的挑戰(zhàn)。然而,要通過增加網(wǎng)絡帶寬來加快數(shù)據(jù)傳輸并不容易。信步科技副總經(jīng)理葉志輝告訴記者,大小腦可以認為是兩臺獨立的機器,兩者之間目前只能通過網(wǎng)絡通信,而網(wǎng)絡傳輸非常麻煩,“因為涉及數(shù)據(jù)打包、解析,需要上到10G乃至100G網(wǎng)絡帶寬。100G網(wǎng)絡在機器人系統(tǒng)中非常不好處理,會造成空間和成本的巨大開支。”
硬件產(chǎn)業(yè)鏈行動起來
人形機器人大小腦系統(tǒng)分開不僅導致了延遲問題,還可能導致系統(tǒng)設計復雜等一系列問題。有技術(shù)人員向記者解釋,雙系統(tǒng)導致研發(fā)過程需要維護兩套開發(fā)環(huán)境、兩套系統(tǒng),帶來研發(fā)成本上升,雙系統(tǒng)也限制了計算平臺的功耗、尺寸和結(jié)構(gòu),“雙系統(tǒng)下,控制代碼可能跑在ARM架構(gòu)的CPU上,也可能跑在x86架構(gòu)的CPU上,AI算法則跑在GPU等其他芯片上,軟件架構(gòu)和代碼維護都不一樣?!?/p>
“追求大小腦融合的原因,一是將大小腦兩臺機器合二為一,提升機器人設計空間,二是降低成本,三是解決數(shù)據(jù)延遲。”葉志輝表示。
記者了解到,近期業(yè)內(nèi)有一些統(tǒng)一計算平臺的嘗試。信步科技近期推出了新的具身智能開發(fā)平臺HB03,將CPU與GPU/NPU集成于一塊主板。英特爾今年年初推出第二代酷睿Ultra處理器,將CPU、GPU和NPU封裝在一個SoC(系統(tǒng)級芯片)中,并于近期基于該產(chǎn)品線推出一套具身智能解決方案。據(jù)介紹,英特爾酷睿Ultra 200H的CPU AI算力90TOPS,后續(xù)產(chǎn)品算力還將提高,如下一代Panther Lake可達180 TOPS。
此外,業(yè)界也看到了人形機器人續(xù)航時間較短的問題。唐劍表示,天工Ultra在半程馬拉松中換了三次電池,使用的電池是15安時,如果容量增加就能減少換電次數(shù),但同時也會增加機器人重量、影響跑步速度。
就續(xù)航問題的解決途徑,熊蓉告訴記者,模型最好能壓縮、蒸餾和剪枝,從而降低對算力的要求,計算設備則需要小型化、輕量化、易散熱,以降低對電池的要求。因此,增加續(xù)航時間主要依靠三個方面:電池技術(shù)提升、設備功耗降低、算法對算力的需求降低。
葉志輝則看到硬件設計上的其他問題。他表示,開發(fā)具身智能控制器面臨諸多困難,包括標準問題。他的公司新發(fā)布的開發(fā)平臺連接器采用非標準設計,這是因為目前尚無適用標準?!熬呱碇悄懿幌窆I(yè)控制擁有數(shù)十年成熟的應用場景,因此形態(tài)尚未統(tǒng)一。這確實帶來一個問題:行業(yè)有特殊要求,例如常用的USB接口可能不便于使用,但目前許多客戶仍不得不使用USB或Type-C接口?!比~志輝稱。
葉志輝還注意到,傳統(tǒng)USB標準接口和RJ45水晶頭在運動時容易脫落,且有線纜過粗、不易整理等問題,這些問題困擾著行業(yè),他的辦法是將對外接口進行加固。
人形機器人要穩(wěn)定地運行,另有一些技術(shù)挑戰(zhàn)需要解決。有技術(shù)人員告訴記者,目前端到端算法成功率仍較低,機器人動作數(shù)據(jù)在不同構(gòu)型機器人之間的遷移性不足,3D表征也尚未達成共識,此外,如何將多種傳感器的數(shù)據(jù)編碼并輸入端到端大模型中,目前還沒有明確答案。
“現(xiàn)在機器人大腦和身體都處于初級階段,兩者在握手、建立連接,就像身心交融的過程,但身體和心都需要進一步發(fā)展?!毙苋叵蛴浾弑硎尽?/p>
從跑跳到進工廠
業(yè)界通過半程馬拉松檢驗人形機器人運動能力的同時,實際場景落地也在加速。
今年1月,智元機器人第1000臺通用具身機器人量產(chǎn)下線,該公司計劃今年機器人出貨數(shù)千臺。
記者了解到,近日具身智能公司智平方也啟動自有產(chǎn)線建設,計劃2028年實現(xiàn)萬臺場景應用,2033年擴展至百萬臺規(guī)模。智平方的通用智能機器人AlphaBot已進入汽車制造場景,并在吉利科技旗下的晶能微科技電子半導體生產(chǎn)基地執(zhí)行上下料等任務,該公司近日還與華熙生物合作,計劃讓機器人執(zhí)行物料協(xié)同轉(zhuǎn)運等任務,降低微生物污染的風險。
唐劍告訴記者,就人形機器人這一垂直細分領(lǐng)域來看,幾十臺的量已經(jīng)被視作是相對較大規(guī)模的應用了,例如天工的股東之一優(yōu)必選就有約20臺左右的機器人在工廠打工。他透露,天工2.0機器人將很快實現(xiàn)小批量的量產(chǎn)并出貨。
“我們從一二十家人形機器人客戶了解情況,今年春節(jié)后有終端客戶老板下KPI,要求在自己的制造業(yè)工廠中應用DeepSeek和人形機器人。具身智能和人形機器人將首先在工業(yè)領(lǐng)域落地,例如特斯拉,國內(nèi)也主要集中在制造業(yè)。”英特爾中國邊緣計算事業(yè)部高級產(chǎn)品經(jīng)理瞿好聰表示。
工業(yè)成為一些人形機器人公司最先選擇的落地場景。但從另一方面看,要真正在工業(yè)中大規(guī)模應用,挑戰(zhàn)還不少。
高工機器人產(chǎn)業(yè)研究院數(shù)據(jù)顯示,2024年中國市場大約銷售2400臺人形機器人。“根據(jù)我們與客戶的訪談,去年售出的人形機器人主要用于院校、科研機構(gòu)以及接待表演等場景,真正進入具體場景解決實際問題,各方仍在探索?!?瞿好聰表示,經(jīng)過去年,今年機構(gòu)對中國人形機器人的銷售預測有所下調(diào),預計2030年銷量為16.2萬臺,2035年約200萬臺。
“挑戰(zhàn)方面,大家看到很多視頻中機器人完成跑跳等動作,很多都是(為)拍攝(設置)的。我們也購買了一套設備進行模仿學習,使用網(wǎng)上采集的數(shù)據(jù)訓練,發(fā)現(xiàn)成功率很低,例如雙臂機器人模仿人類插筆套的成功率很低。”瞿好聰表示,客戶希望解決的也不是跑跳能解決的問題,而是產(chǎn)線難題,如3C行業(yè)的貼膜、撕膜。
“業(yè)界存在這樣的聲音:當機器人能跑能跳時,還難以穩(wěn)定地站立操作?!毙苋乇硎?,目前能實際作業(yè)的人形機器人還不多,特斯拉作業(yè)很大程度上依賴遠程操控,波士頓動力的可靠性和魯棒性也存在問題。除了通用性挑戰(zhàn),工業(yè)精度和效率也是重點,此前機器人通過專家編程可以實現(xiàn)高精度、高效率的離線作業(yè),而隨著智能技術(shù)引入,現(xiàn)在面臨的問題變成了泛化性提升、精度效率下降,后續(xù)要解決如何兼顧泛化性和精度的問題。
工業(yè)中機器人的形態(tài)也仍待探討。一些在工廠中使用的人形機器人目前沒有人類一般的雙腿,例如智平方的AlphaBot2采用腰腿升降結(jié)構(gòu),搭配可移動的底盤,優(yōu)艾智合等廠商采用輪式、履帶式結(jié)構(gòu)。瞿好聰表示,機器人形態(tài)不一定是雙腿行走,核心技術(shù)是具身智能和AI,而不是硬件上完全的人類形態(tài)。
從近段時間人形機器人的出貨量級看,葉志輝向記者表示,完全人形的機器人產(chǎn)品出貨量可能不會很大,但在技術(shù)驅(qū)動下,相關(guān)技術(shù)有望應用于更廣泛的領(lǐng)域,例如輪式機器人、雙臂機器人等。
人形機器人產(chǎn)業(yè)鏈爆發(fā),消費電子、低空經(jīng)濟、車路云、算力、AI應用題材活躍。黃金股領(lǐng)跌;大消費走弱,食品、零售方向跌幅靠前。
機構(gòu)指出,當前我國人形機器人產(chǎn)業(yè)在關(guān)節(jié)強度、運動控制算法、能耗管理等技術(shù)領(lǐng)域仍存在一定的瓶頸和短板,關(guān)鍵核心技術(shù)尚需進一步優(yōu)化。
機器人的一小步,人類科技發(fā)展的一大步。
來自北京亦莊的“天工Ultra”以2時40分42秒的成績沖線,奪得全球首個人形機器人半程馬拉松賽事桂冠。
天工機器人由北京人形機器人創(chuàng)新中心研發(fā),實測平均時速可以達到10km/h,最高奔跑速度已經(jīng)達到了12km/h。