分享到微信打開微信,點擊底部的“發(fā)現(xiàn)”, |
3月16日,在文心一言正式發(fā)布兩周年后,百度發(fā)布了多模態(tài)大模型文心4.5和對標DeepSeek的文心X1。
今日文心大模型4.5在百度智能云千帆大模型平臺上線,輸入價格為0.004元/千tokens;文心大模型X1輸入價格0.002元/千tokens,為DeepSeek R1一半。
百度曾是國內(nèi)最早一批發(fā)布大模型的廠商之一,在過去兩年時間里,大模型領域國內(nèi)大模型賽道競爭異常激烈,DeepSeek-R1以顛覆性姿態(tài)“殺”了進來,其開源+低價策略引發(fā)的"鲇魚效應",迫使全球大模型廠商重新校準競爭維度。第一財經(jīng)記者了解到,李彥宏在今年內(nèi)部講話中透露,百度將于下半年發(fā)布文心大模型的5.0版本,并加大AI應用商業(yè)化實踐。接下來,百度還將在6月30日正式將文心大模型開源。
今日上午記者體驗了百度原生多模態(tài)大模型文心4.5,用戶可上傳包括文檔、圖片、音頻、視頻的文件,讓AI進行解讀。記者上傳了一張《哪吒》電影視頻截圖,就此詢問文心4.5,但AI沒能給出正確答案,而是稱這是來自迪士尼動畫電影《公主與青蛙》中的場景。不過在邏輯測試中,AI能準確識別腦筋急轉(zhuǎn)彎的陷阱并給出回答,針對數(shù)學物理題、益智問答基本能給出準確回答。
文心大模型X1為深度思考模型,運用到的關(guān)鍵技術(shù)包括遞進式強化學習、基于思維鏈和行動鏈的端到端訓練、多元統(tǒng)一的獎勵系統(tǒng)等,百度稱在性能上對標DeepSeek-R1,具備“長思維鏈”。記者體驗看到,除了聯(lián)網(wǎng)搜索外,增加了多模態(tài)能力和多工具調(diào)用,能理解和生成圖片,調(diào)用工具生成代碼、圖表等。目前DeepSeek-R1支持上傳的附件僅識別文字。
在文本創(chuàng)作上,過去文心4.0的觀點較為“端水”,4.5擅長寫“銳評”;在圖片理解方面,當記者再次拿出《哪吒》電影截圖考考X1時,AI給出的答案是《快樂池塘》。記者在進一步的對話中告訴X1答錯了,這是電影《哪吒》 場景后,AI表示感謝指正,經(jīng)過分析后表示提供的圖片場景確實出自電影《哪吒》。事實上AI每次錯誤都在拓寬技術(shù)邊界,它的視覺理解也將在"犯錯-修正"的螺旋中不斷改進。
隨著人工智能技術(shù)從基礎問答向復雜推理躍遷,除了百度外,近期包括阿里旗下AI應用夸克、字節(jié)旗下豆包、騰訊混元等都陸續(xù)上線了“深度思考”功能。這也意味著生成式AI的競爭已從早期的信息整合、簡單邏輯推導轉(zhuǎn)向“認知重構(gòu)”,試圖讓AI突破表層語義匹配,建立因果推理、價值判斷及跨領域知識遷移能力。這種競爭不僅體現(xiàn)在模型性能上,各家更通過云計算捆綁、行業(yè)解決方案等生態(tài)卡位爭奪B端市場。
OpenAI創(chuàng)始人Sam Altman:將在幾周內(nèi)發(fā)布o3、o4-MINI;谷歌宣布一個新的實驗性人工智能模型Sec-Gemini V1。
“應用為王”這一理念在大模型技術(shù)發(fā)展與落地中尤為重要,已經(jīng)成為產(chǎn)業(yè)界、企業(yè)界最迫切解決的一個課題。
螞蟻自研2900億大模型用國產(chǎn)AI芯片完成高效訓練;京東入局具身智能,已成立多支團隊進行前沿研發(fā)。
下一步,張江集團和智譜將通過共建平臺構(gòu)建孵化生態(tài),鏈接技術(shù)創(chuàng)新與市場需求,促進垂類模型成果轉(zhuǎn)化。
數(shù)據(jù)風控是當務之急。