分享到微信打開(kāi)微信,點(diǎn)擊底部的“發(fā)現(xiàn)”, |
第一財(cái)經(jīng) 2024-11-05 19:56:33 聽(tīng)新聞
作者:?jiǎn)绦拟?nbsp; 責(zé)編:李娜
“我們對(duì)此很感興趣,也有過(guò)掙扎,希望有朝一日,我們能重拾機(jī)器人的研究。”去年6月,OpenAI的CEO薩姆·奧爾特曼(Sam Altman)在提及機(jī)器人研究時(shí)說(shuō)道。17個(gè)月之后,OpenAI或許已經(jīng)等到了這個(gè)機(jī)會(huì)。
北京時(shí)間11月5日,Caitlin Kalinowski在社交平臺(tái)X官宣自己將加入OpenAI,擔(dān)任機(jī)器人和消費(fèi)硬件領(lǐng)導(dǎo)位。根據(jù)他的個(gè)人介紹,Caitlin Kalinowski曾經(jīng)參與了Orion項(xiàng)目,是Meta AR眼鏡項(xiàng)目的負(fù)責(zé)人。Caitlin Kalinowski的加入也意味著,OpenAI正在重啟自己的機(jī)器人團(tuán)隊(duì)。
與此同時(shí),有消息稱(chēng),OpenAI和亞馬遜首席執(zhí)行官杰夫·貝佐斯(Jeff Bezos)一起投資了一家舊金山機(jī)器人初創(chuàng)公司Physical Intelligence。據(jù)了解,該公司目前已經(jīng)籌集了4億美元,公司估值已達(dá)到了24億美元。
從組建自己的團(tuán)隊(duì),到投資新銳機(jī)器人企業(yè),OpenAI頻頻出手的背后,是其多年以來(lái)對(duì)機(jī)器人領(lǐng)域的野心和不甘。
在OpenAI發(fā)展早期,就有研究機(jī)器人的計(jì)劃,包括制造通用機(jī)器人和使用自然語(yǔ)言的聊天機(jī)器人。2018年,OpenAI宣布自己已經(jīng)訓(xùn)練了一只類(lèi)人機(jī)器人手,能夠“以前所未有的靈巧程度操縱物理物體”。只不過(guò),隨著后期OpenAI陸續(xù)發(fā)布的GTP大模型獲得成功,企業(yè)逐漸決定將自身所有資源都押注在GPT大模型上。
2021年,OpenAI以“缺乏訓(xùn)練機(jī)器人使用人工智能進(jìn)行移動(dòng)和推理所需的數(shù)據(jù)”為由,解散了自己的機(jī)器人團(tuán)隊(duì)。
自此之后,OpenAI在機(jī)器人領(lǐng)域一直打的是“擦邊球”,以合作、投資等方式進(jìn)行了機(jī)器人市場(chǎng)的探索。去年3月,OpenAI投資了挪威人形機(jī)器人公司1X Technologies,今年2月底,OpenAI又宣布和Figure進(jìn)行投資合作。下半年,號(hào)稱(chēng)OpenAI二代機(jī)器人的“Figure 02”問(wèn)世,并已經(jīng)開(kāi)始在寶馬車(chē)廠的場(chǎng)景中投入使用。在OpenAI大模型的加持下,這款機(jī)器人已經(jīng)能夠看、聽(tīng)和遵循人類(lèi)的指令。
與機(jī)器人公司的多次合作,也似乎為OpenAI重啟自己的機(jī)器人團(tuán)隊(duì)打下了基礎(chǔ)。高工機(jī)器人產(chǎn)業(yè)研究所所長(zhǎng)盧瀚宸判斷,在OpenAI重啟機(jī)器人團(tuán)隊(duì)之后,人形機(jī)器人或許是OpenAI的目標(biāo)。“嚴(yán)格來(lái)說(shuō),GPT只能算作是離身智能,與具身智能相對(duì)。”盧瀚宸對(duì)第一財(cái)經(jīng)記者表示,GPT大模型為機(jī)器人的智能要素奠定了基礎(chǔ),但本體、智能、環(huán)境要素的高度耦合才是高級(jí)智能形成的必要條件。OpenAI想要在機(jī)器人領(lǐng)域沿襲自身在大模型領(lǐng)域的優(yōu)勢(shì),亟需找到一個(gè)潛在的、通用的物理身體。
如何將大模型技術(shù)內(nèi)化,并不斷優(yōu)化機(jī)器人的理解能力、拓寬機(jī)器人的落地場(chǎng)景,是包括OpenAI在內(nèi)的多數(shù)機(jī)器人相關(guān)企業(yè)如今面臨的難題。
自變量機(jī)器人(X Square)剛剛連續(xù)完成了Pre-A與Pre-A+輪融資,該公司表示,融資將用于下一代統(tǒng)一具身智能大模型的訓(xùn)練與場(chǎng)景落地。大模型所構(gòu)建的智能能力,一定程度上也是具身機(jī)器人落地的關(guān)鍵。
“OpenAI最大的優(yōu)勢(shì)在于‘智能’的能力,以及自身強(qiáng)大的算力支撐,對(duì)于后續(xù)的機(jī)器人訓(xùn)練、推理等方面能力的提升至關(guān)重要。”盧瀚宸對(duì)記者說(shuō)。
不過(guò),對(duì)于像OpenAI這樣軟件基因過(guò)于強(qiáng)大的團(tuán)隊(duì),硬件能力也是其需要補(bǔ)足的方向。盧瀚宸指出,人形機(jī)器人是軟硬件高度耦合的綜合體,在機(jī)器人的研發(fā)過(guò)程將涉及諸多軟硬件之間的適配和耦合問(wèn)題,這對(duì)OpenAI來(lái)說(shuō)會(huì)是一個(gè)不小的挑戰(zhàn)。
如果能夠利用Align-R1-V的跨模態(tài)穿透能力實(shí)現(xiàn)機(jī)器人Action領(lǐng)域的穿透,或許機(jī)器人端到端大模型板塊的最后一塊拼圖,將會(huì)被很快補(bǔ)齊。
2025年,浦東重大建設(shè)項(xiàng)目年度投資規(guī)模1692億元,繼續(xù)保持穩(wěn)步增長(zhǎng)。其中,科技產(chǎn)業(yè)類(lèi)投資規(guī)模進(jìn)一步擴(kuò)大,年度投資1212億元,占比71%。
如果DeepSeek能夠用十分之一的成本達(dá)到GPT-o1級(jí)別的表現(xiàn),那一直以來(lái)困囿于訓(xùn)練成本高昂的具身智能企業(yè),是否有機(jī)會(huì)用更短的時(shí)間訓(xùn)練出一個(gè)更智能、更通用的具身智能大模型?
重塑AI世界的力量不僅僅在硅谷,更在新一代全球化創(chuàng)業(yè)者的手中。
這款智能體可以處理重復(fù)的瀏覽器任務(wù),比如填寫(xiě)表格、訂購(gòu)雜貨、創(chuàng)建表情包等。