分享到微信打開(kāi)微信,點(diǎn)擊底部的“發(fā)現(xiàn)”, |
第一財(cái)經(jīng) 2024-04-16 16:03:14 聽(tīng)新聞
作者:鄭栩彤 責(zé)編:李娜
去年3月,百度發(fā)布文心一言,大約一年后,百度再召開(kāi)Create百度AI開(kāi)發(fā)者大會(huì)。百度創(chuàng)始人、董事長(zhǎng)兼首席執(zhí)行官李彥宏介紹了近一年來(lái)的進(jìn)展,并宣布推出文心大模型4.0工具版。
一年前,隨著ChatGPT掀起的大模型浪潮涌動(dòng),百度成為國(guó)內(nèi)最早入局的一批。彼時(shí)文心一言并不完美,發(fā)布會(huì)期間,百度港股一度跌10%,美股隨后才上漲。相較比拼參數(shù)和商業(yè)化能力,搶占大語(yǔ)言模型坐席似乎是當(dāng)時(shí)更重要的事情。
大模型能力一年后則更為業(yè)界關(guān)注。百度文心大模型一年間從3.0迭代至3.5,又迭代至4.0。李彥宏在會(huì)上表示,文心大模型算法訓(xùn)練效率已提升至原來(lái)的5.1倍,周均訓(xùn)練有效率達(dá)98.8%,推理性能提升了105倍,推理成本則降到了原來(lái)的1%。“也就是說(shuō),客戶原來(lái)一天調(diào)用1萬(wàn)次,同樣成本下現(xiàn)在一天能調(diào)用100萬(wàn)次。”
文心大模型變強(qiáng)的同時(shí),市場(chǎng)環(huán)境也在變化。2023年下半年開(kāi)始,有業(yè)界人士向第一財(cái)經(jīng)記者表示,“百模大戰(zhàn)”開(kāi)始收斂,不再有很多公司搶奪入場(chǎng)券。與此同時(shí),一些留在場(chǎng)上的初創(chuàng)公司則逐漸顯露銳氣。例如,發(fā)力長(zhǎng)文本的初創(chuàng)公司月之暗面今年3月曾掀起一波kimi概念股漲停潮。此外,以O(shè)penAI、百度為代表的閉源大模型廠商還遇到大模型開(kāi)源潮,開(kāi)閉源之爭(zhēng)成為新話題。李彥宏會(huì)上談及相關(guān)話題時(shí)仍堅(jiān)持他此前的看法,稱“開(kāi)源模型會(huì)越來(lái)越落后”。
應(yīng)對(duì)市場(chǎng)的挑戰(zhàn),百度則發(fā)力大模型應(yīng)用。李彥宏介紹,百度已將大模型能力應(yīng)用至代碼生成,并將視覺(jué)感知大模型應(yīng)用到百度地圖制圖領(lǐng)域。
文心大模型怎么樣了?
百度是BAT(百度、阿里、騰訊)中最早推出大模型的一家。文心一言一年前發(fā)布時(shí),李彥宏稱,文心一言在內(nèi)測(cè)體驗(yàn)中并不完美,發(fā)布是因?yàn)橛惺袌?chǎng)需求,百度各個(gè)產(chǎn)品線、客戶都在等待這樣的技術(shù)。隨后,百度推動(dòng)文心大模型迭代并向社會(huì)開(kāi)放。去年8月,文心一言向全社會(huì)開(kāi)放。10月,文心大模型4.0版本發(fā)布,李彥宏稱該模型在綜合水平“與GPT-4相比毫不遜色”。
李彥宏此次透露了文心大模型的最新數(shù)據(jù),包括用戶數(shù)據(jù)超2億、API日均調(diào)用量超2億、服務(wù)客戶達(dá)8.5萬(wàn)、利用千帆平臺(tái)開(kāi)發(fā)的AI原生應(yīng)用數(shù)超19萬(wàn)。文心大模型推理成本下降至原來(lái)的1%,是因?yàn)榘俣仍谛酒?、框架、模型、?yīng)用四層架構(gòu)上有全棧布局,通過(guò)端到端優(yōu)化打下成本。
此次百度還發(fā)布了文心大模型4.0工具版,工具版有代碼解釋器,可通過(guò)自然語(yǔ)音交互實(shí)現(xiàn)對(duì)復(fù)雜數(shù)據(jù)和文件的處理與分析,并生成圖表或文件。李彥宏介紹,百度在MoE(混合專家模型)、小模型、智能體三個(gè)方向都推出了工具,包括智能體開(kāi)發(fā)工具AgentBuilder、AI原生應(yīng)用開(kāi)發(fā)工具AppBuilder、各種尺寸模型定制工具M(jìn)odelBuilder,利用工具,智能體可以批量生成,開(kāi)發(fā)AI原生應(yīng)用可用自然語(yǔ)言,尺寸模型可根據(jù)開(kāi)發(fā)者需求定制。百度還有三個(gè)輕量級(jí)模型Speed、Lite和Tiny。
“未來(lái)大型的AI原生應(yīng)用基本都是MoE架構(gòu),指大小模型的混用,不依賴一個(gè)模型來(lái)解決所有問(wèn)題。小模型推理成本低、響應(yīng)速度快,在一些特定場(chǎng)景中,經(jīng)過(guò)精調(diào)后的小模型,使用效果可以媲美大模型。通過(guò)大模型壓縮蒸餾出基礎(chǔ)模型,比從頭開(kāi)始訓(xùn)練小模型,效果好很多。”關(guān)于AI原生應(yīng)用的思路,李彥宏表示。
此外,他判斷,隨著智能體能力提升,還會(huì)催生大量新應(yīng)用,智能體機(jī)制包括理解、規(guī)劃、反思和進(jìn)化,可讓機(jī)器像人一樣思考和行動(dòng),自主完成復(fù)雜任務(wù)并在環(huán)境中學(xué)習(xí)、自我迭代。
文心大模型近期已展示了應(yīng)用于人形機(jī)器人場(chǎng)景的能力。優(yōu)必選人形機(jī)器人接入文心大模型并發(fā)布了一段演示視頻, 視頻中人形機(jī)器人Walker S接到語(yǔ)音任務(wù)后能用手疊衣服并回答關(guān)于衣服搭配的問(wèn)題,還自主進(jìn)行物體分揀。優(yōu)必選董事會(huì)主席兼行政總裁周劍稱,大模型最好的接入載體是人形機(jī)器人。但優(yōu)必選管理層同時(shí)向記者指出,大模型與人形機(jī)器人的融合更多處于研發(fā)階段。
再評(píng)論開(kāi)源大模型
相比一年前文心一言剛推出時(shí),大模型業(yè)態(tài)已發(fā)生明顯改變。文心大模型是國(guó)內(nèi)主要的幾個(gè)大模型之一,其他主流大模型還包括阿里通義千問(wèn)、騰訊混元、智譜清言、百川、kimi等。不變的是,業(yè)內(nèi)仍在追趕OpenAI,變化的是,創(chuàng)業(yè)企業(yè)也分化出頭部,與互聯(lián)網(wǎng)巨頭同臺(tái)競(jìng)技,其中創(chuàng)業(yè)企業(yè)月之暗面的kimi發(fā)力長(zhǎng)文本能力,已引起資本市場(chǎng)關(guān)注,3月曾因過(guò)多流量涌入導(dǎo)致kimi宕機(jī)。
閉源還是開(kāi)源,大模型公司的路線也在分化。目前,OpenAI、百度走閉源路線,字節(jié)、騰訊、華為也未公布開(kāi)源大模型。海外的谷歌和Meta,國(guó)內(nèi)的阿里通義千問(wèn)、百川智能、360、昆侖萬(wàn)維、智譜AI等企業(yè)則發(fā)布了不同參數(shù)的開(kāi)源大模型,其中不少企業(yè)同時(shí)做開(kāi)源和閉源大模型。
開(kāi)源的力量越發(fā)難以忽視。去年谷歌一份內(nèi)部文件便曾在網(wǎng)上傳開(kāi),該文件提到開(kāi)源大模型正在侵蝕OpenAI和谷歌的陣地,除非改變閉源的立場(chǎng),否則開(kāi)源替代品終將使這兩家公司黯然失色。谷歌隨后也在推動(dòng)大模型開(kāi)源,包括Gemma 2B、Gemma 7B。
原本,很多公司開(kāi)源的大模型參數(shù)量都在70億參數(shù)、130億參數(shù)左右甚至更小,但今年3月,特斯拉CEO馬斯克旗下xAI公司開(kāi)源了3140億參數(shù)大模型Grok-1,將現(xiàn)有開(kāi)源大模型參數(shù)量提拉至千億以上。只要自己部署算力,開(kāi)源目前基本指向免費(fèi)。開(kāi)源大模型對(duì)閉源大模型的“狙擊”,似乎更猛烈了。
作為閉源的陣營(yíng),面對(duì)使用成本可能更低的開(kāi)源模型,李彥宏的答案是將閉源模型尺寸裁剪得更小,以兼顧成本和效果。
“有了強(qiáng)大的基礎(chǔ)模型文心4.0,我們可以根據(jù)需要兼顧效果、響應(yīng)速度、推理成本等各種考慮,裁剪出適合各種場(chǎng)景的更小尺寸模型,且支持精調(diào)和post pretrain(預(yù)訓(xùn)練)。通過(guò)降維裁剪出的模型,比直接拿開(kāi)源調(diào)出來(lái)的模型,同等尺寸下效果更好,同等效果下成本明顯更低。”李彥宏表示,大家以前用開(kāi)源覺(jué)得便宜,其實(shí)在大模型場(chǎng)景下,開(kāi)源是最貴的,所以開(kāi)源模型會(huì)越來(lái)越落后。
此前李彥宏對(duì)于開(kāi)源落后列舉的理由還包括,有商業(yè)模式的閉源模型才能聚集人力和財(cái)力。不過(guò)。李彥宏關(guān)于開(kāi)閉源的觀點(diǎn)并未獲得業(yè)界的一致認(rèn)同,有業(yè)界人士認(rèn)為,開(kāi)源不僅免費(fèi)靈活,還在數(shù)據(jù)安全性上有優(yōu)勢(shì),目前閉源更偏向To C,面向個(gè)人消費(fèi)者,開(kāi)源更偏向To B,面向企業(yè),不過(guò),開(kāi)源商業(yè)化當(dāng)前確實(shí)是個(gè)問(wèn)題。
此外,雖然業(yè)界有分析認(rèn)為“AI原生”的創(chuàng)業(yè)企業(yè)基于組織靈活等優(yōu)勢(shì),或許可比科技巨頭走得更遠(yuǎn),但與這些“拿著技術(shù)找應(yīng)用”的初創(chuàng)公司不同,百度這類互聯(lián)網(wǎng)企業(yè)客觀上在推動(dòng)商業(yè)化具備一定先發(fā)優(yōu)勢(shì)。正如一年前李彥宏所稱的“各產(chǎn)品線、客戶等待這樣的技術(shù)”,目前百度不少業(yè)務(wù)正在推進(jìn)大模型應(yīng)用。
李彥宏稱,百度每天新增代碼中,已經(jīng)有27%是由智能代碼助手Comate自動(dòng)生成的,該代碼助手基于文心大模型。此外,李彥宏表示,多模態(tài)是通往AGI(通用人工智能)的必經(jīng)之路,視覺(jué)大模型最大的應(yīng)用場(chǎng)景將是自動(dòng)駕駛,在這方面,百度已訓(xùn)練出Apollo視覺(jué)感知大模型。
李彥宏表示,百度地圖率先將視覺(jué)感知大模型應(yīng)用到制圖領(lǐng)域,全球最大規(guī)模的車道級(jí)地圖數(shù)據(jù)已上線全國(guó)360座城市。百度旗下的自動(dòng)駕駛出行服務(wù)商蘿卜快跑則在武漢部分地區(qū)實(shí)現(xiàn)全天候運(yùn)營(yíng),計(jì)劃年內(nèi)在武漢部署1000臺(tái)無(wú)人駕駛車輛。
“如果一個(gè)廠家有太多的學(xué)界、權(quán)威、層級(jí)很多,它的研發(fā)效率多半是比較慢的。”
五大應(yīng)用為AI+機(jī)器人、AI+汽車、AI+PC/服務(wù)器、AI+手機(jī)、AI+眼鏡
Manus目前使用的是Claude與阿里旗下Qwen微調(diào)模型。
換股價(jià)較攜程現(xiàn)價(jià)溢價(jià)約40%,類似發(fā)行7年期限的認(rèn)購(gòu)權(quán)證。
今年兩會(huì)期間提出的國(guó)家設(shè)立創(chuàng)業(yè)投資引導(dǎo)基金,旨在通過(guò)長(zhǎng)期的資本支持,促進(jìn)科技創(chuàng)新和戰(zhàn)略新興產(chǎn)業(yè)的發(fā)展。