分享到微信打開微信,點(diǎn)擊底部的“發(fā)現(xiàn)”, |
第一財(cái)經(jīng) 2024-08-25 17:48:46 聽新聞
作者:王媛麗 責(zé)編:錢焜
人形機(jī)器人作為具身智能的優(yōu)質(zhì)載體,受益于AI(人工智能)技術(shù)的快速突破,擁有感知、思考、決策等能力不再遙不可及。這也加速了人形機(jī)器人逐步走向產(chǎn)業(yè)化階段。
2024年世界機(jī)器人大會(huì)以“共育新質(zhì)生產(chǎn)力,共享智能新未來”為主題,于8月底在北京開幕。本屆大會(huì)共有27款人形機(jī)器人整機(jī)亮相,數(shù)量創(chuàng)歷屆之最。這些新品不僅在外觀上更加接近人類,而且在功能上也實(shí)現(xiàn)了重大突破。
2024年被認(rèn)為是人形機(jī)器人產(chǎn)業(yè)化“元年”,人形機(jī)器人已經(jīng)從早期的簡單模型發(fā)展到如今具有高度集成和智能化的階段。未來,人形機(jī)器人將憑借其性能優(yōu)勢在工業(yè)、生活等各領(lǐng)域高速滲透,潛在市場空間達(dá)上百億美元。
根據(jù)Stratistics Market Research Consulting數(shù)據(jù),預(yù)計(jì)2022-2030年全球人形機(jī)器人市場CAGR有望達(dá)到63%,其中國市場規(guī)模從2022年的2.5億美元增長至2030年的105億美元,CAGR為59.4%。
第一財(cái)經(jīng)深度調(diào)研此次參會(huì)人形機(jī)器人本體廠商和核心零部件公司,進(jìn)一步了解人形機(jī)器人的產(chǎn)業(yè)化進(jìn)程和行業(yè)投資機(jī)會(huì)。
1、多場景落地應(yīng)用,小規(guī)模量產(chǎn)在即
人形機(jī)器人產(chǎn)業(yè)正在從概念走向?qū)嵱没?,多場景落地?yīng)用正逐步成為現(xiàn)實(shí)。人形機(jī)器人的產(chǎn)業(yè)投資也從關(guān)注概念走向關(guān)注企業(yè)量產(chǎn)情況。除了B端商業(yè)及工業(yè)場景的應(yīng)用,C端人形陪伴服務(wù)機(jī)器人也逐漸走向現(xiàn)實(shí)。
在B端尤其是工業(yè)場景的應(yīng)用,特斯拉、優(yōu)必選等企業(yè)的人形機(jī)器人在大模型技術(shù)的加持下已經(jīng)實(shí)現(xiàn)在智能生產(chǎn)線的應(yīng)用落地;而C端場景的應(yīng)用上,由于家務(wù)場景多達(dá)一千多項(xiàng)任務(wù),目前家庭服務(wù)人形機(jī)器人能夠?qū)崿F(xiàn)的任務(wù)尚不足十分之一,走進(jìn)千家萬戶仍需要時(shí)間。但家庭陪伴人形機(jī)器人有望在年內(nèi)落地。優(yōu)必選此前就預(yù)計(jì),在2024年年底、2025年年初,會(huì)推出一款家庭陪伴功能的人形機(jī)器人。
需要注意的是,投資人在關(guān)注各大廠商小規(guī)模量產(chǎn)情況的同時(shí),需格外注意各大廠商交付后在實(shí)際應(yīng)用場景的性能情況。某頭部機(jī)器人廠商表示,大規(guī)模量產(chǎn)在技術(shù)上并沒有太大難度,主要難度是下游對產(chǎn)品的需求度,而這取決于目前小規(guī)模試點(diǎn)應(yīng)用的情況。
2、“大腦+小腦”,大模型實(shí)現(xiàn)具身智能
2024年,人形機(jī)器人行業(yè)在具身智能領(lǐng)域取得了顯著的突破,基于通用大模型、數(shù)據(jù)集、高效計(jì)算架構(gòu)、多模態(tài)融合感知等關(guān)鍵技術(shù),為人形機(jī)器人安上聰明的“大腦”,使得人形機(jī)器人具備認(rèn)知和決策能力,推動(dòng)人形機(jī)器人走向?qū)嵱秒A段。
國內(nèi)人形機(jī)器人廠商主要采用分層端到端的方案,即通過“大腦大模型”和“小腦大模型”互相配合完成任務(wù)。“大腦大模型”大多基于多模態(tài)通用大模型,完成對任務(wù)的感知規(guī)劃,再通過API調(diào)度“小腦大模型”驅(qū)動(dòng)關(guān)節(jié)硬件完成執(zhí)行。
例如優(yōu)必選人形機(jī)器人Walker S接入百度文心大模型;智元機(jī)器人與科大訊飛簽署合作戰(zhàn)略協(xié)議,依托訊飛星火大模型進(jìn)行聯(lián)合開發(fā);樂聚機(jī)器人夸父搭載的是華為盤古大模型。
在“小腦大模型”方面:
值得注意的是,特斯拉Optimus使用完全端到端的神經(jīng)網(wǎng)絡(luò)大模型,借助傳感器和計(jì)算機(jī)視覺技術(shù),利用海量數(shù)據(jù)不斷優(yōu)化訓(xùn)練過程,直接生成關(guān)節(jié)控制序列。按照智元機(jī)器人此前定義的G1至G5的具身智能技術(shù)演進(jìn)路線,特斯拉目前進(jìn)入G4階段,國內(nèi)大多人形機(jī)器人廠商目前仍在G3階段。
在“小腦”操作大模型領(lǐng)域,各大廠商剛剛起步,多技術(shù)路徑同步發(fā)展。操作大模型決定了人形機(jī)器人在任務(wù)執(zhí)行側(cè)的準(zhǔn)確度,是大規(guī)模商業(yè)應(yīng)用場景落地的前提,需關(guān)注各大廠商“小腦大模型”技術(shù)進(jìn)展及落地應(yīng)用情況。
3、具身智能訓(xùn)練數(shù)據(jù)仍較為短缺
由于訓(xùn)練機(jī)器人所需的物理數(shù)據(jù)不如文本數(shù)據(jù)量大且易獲得,相較于圖文大模型千億規(guī)模的數(shù)據(jù)訓(xùn)練量,目前機(jī)器人數(shù)據(jù)集量遠(yuǎn)不能滿足機(jī)器人達(dá)到通用大模型的需求。目前解決人形機(jī)器人訓(xùn)練數(shù)據(jù)短缺的問題,一方面通過強(qiáng)化學(xué)習(xí)算法提高模型訓(xùn)練效率,一方面則通過仿真平臺(tái)合成數(shù)據(jù),建立數(shù)據(jù)開放生態(tài)。
銀河通用自研合成了千萬級的場景數(shù)據(jù)以及十億級的抓取數(shù)據(jù),在合成數(shù)據(jù)的訓(xùn)練下,其蓋博特人形機(jī)器人目前已實(shí)現(xiàn)抓取隨機(jī)放置的透明、高光等物體成功率在95%以上,進(jìn)一步掌握類似開柜子、開抽屜、晾衣服等靈巧手泛化操作技能。
智元機(jī)器人構(gòu)建了一套完整、全流程的數(shù)據(jù)采集、應(yīng)用的方案AIDEA,包含AIDEA ML機(jī)器學(xué)習(xí)平臺(tái)和AIDEA Sim仿真平臺(tái)。預(yù)計(jì)智元會(huì)有百臺(tái)以上自由部署機(jī)器人專門用來做端到端的數(shù)據(jù)采集,也將于四季度開源基于AIDEA的百萬條真機(jī)、千萬條仿真數(shù)據(jù)集,以積極建設(shè)開放生態(tài)。
各地人形機(jī)器人創(chuàng)新中心也在積極建設(shè)人形機(jī)器人訓(xùn)練場。上海人形機(jī)器人制造業(yè)創(chuàng)新中心孵化的“開源道場“MiniGym”,2024 年計(jì)劃上海打造100個(gè)人形訓(xùn)練場,2027 年計(jì)劃在各個(gè)城市、各個(gè)場景打造 1000 個(gè)訓(xùn)練場,100臺(tái)采集設(shè)備,構(gòu)建 1PB 數(shù)據(jù)集(每周生產(chǎn) 5TB+)。北京創(chuàng)新中心自主研發(fā)的通用人形機(jī)器人母平臺(tái)“天工”的訓(xùn)練基本都是在虛擬的世界完成的。
數(shù)據(jù)對于訓(xùn)練人形機(jī)器人具有至關(guān)重要的作用,它直接影響到機(jī)器人的感知能力、思考和決策能力以及行動(dòng)執(zhí)行能力。大模型通過大量數(shù)據(jù)學(xué)習(xí),讓機(jī)器人理解任務(wù)意圖,并遷移到下游任務(wù)中,高質(zhì)量訓(xùn)練數(shù)據(jù)能夠有效提升人形機(jī)器人場景泛化能力。除了關(guān)注各大廠商訓(xùn)練數(shù)據(jù)獲取方式,同時(shí)也可以關(guān)注與各大人形機(jī)器人創(chuàng)新中心合作生態(tài)共建情況。
4、觸覺感知是人形機(jī)器人精準(zhǔn)控制的關(guān)鍵
人形機(jī)器人的視覺和聽覺在深度學(xué)習(xí)算法以及人工智能的支持,已經(jīng)發(fā)展較為完善,但在觸覺方向上的技術(shù)進(jìn)展要落后于視覺及聽覺,觸覺傳感器為人形機(jī)器人提供了與環(huán)境進(jìn)行物理交互的能力,是實(shí)現(xiàn)高級機(jī)器人功能和應(yīng)用的關(guān)鍵技術(shù)之一。
觸覺傳感器使機(jī)器人能夠通過接觸來感知周圍環(huán)境,從而實(shí)現(xiàn)更精細(xì)和復(fù)雜的交互。同時(shí)借助觸覺傳感器,人形機(jī)器人能夠進(jìn)行精確的操作,如抓取易碎或形狀不規(guī)則的物體,實(shí)現(xiàn)平穩(wěn)且準(zhǔn)確的握持,同時(shí)可以幫助機(jī)器人感知施加在物體上的力,這對于手術(shù)或精密裝配等需要精確控制力度的場景中至關(guān)重要。
由于觸覺涉及物理量過多難以解耦,觸覺傳感器研發(fā)難度大、精度提升困難,成為人形機(jī)器人急需突破的關(guān)鍵技術(shù)之一。
觸覺傳感器企業(yè)帕西尼感知科技稱,該公司的核心產(chǎn)品已應(yīng)用于國內(nèi)外頭部機(jī)器人企業(yè),且在多維觸覺傳感器領(lǐng)域保持出貨量、市占率領(lǐng)先。該公司在今年世界機(jī)器人大會(huì)上展示了其標(biāo)桿性的第二代多維觸覺人形機(jī)器人TORA-ONE,還推出了第二代多維觸覺靈巧手DexH13以及多維度觸覺傳感器PX-6AX GEN2。
作為人形機(jī)器人精準(zhǔn)控制的關(guān)鍵,觸覺感知的相關(guān)發(fā)展與應(yīng)用將進(jìn)一步推動(dòng)人形機(jī)器人商業(yè)化走深走實(shí)。目前國內(nèi)柔性觸覺傳感器仍處于產(chǎn)業(yè)化早期階段,受益于人形機(jī)器人的需求驅(qū)動(dòng),有望加速國產(chǎn)廠商技術(shù)更迭和市場空間提升。
2025年,浦東重大建設(shè)項(xiàng)目年度投資規(guī)模1692億元,繼續(xù)保持穩(wěn)步增長。其中,科技產(chǎn)業(yè)類投資規(guī)模進(jìn)一步擴(kuò)大,年度投資1212億元,占比71%。
一些人形機(jī)器人廠商此前走上與大模型公司合作的道路。
如果DeepSeek能夠用十分之一的成本達(dá)到GPT-o1級別的表現(xiàn),那一直以來困囿于訓(xùn)練成本高昂的具身智能企業(yè),是否有機(jī)會(huì)用更短的時(shí)間訓(xùn)練出一個(gè)更智能、更通用的具身智能大模型?
重塑AI世界的力量不僅僅在硅谷,更在新一代全球化創(chuàng)業(yè)者的手中。
具身智能機(jī)器人的關(guān)鍵在于具身智能的底層技術(shù),而非機(jī)器人的物理形狀。