分享到微信

打開微信，點擊底部的“發(fā)現(xiàn)”，
使用“掃一掃”即可將網(wǎng)頁分享至朋友圈。

百度發(fā)布兩款大模型，對標DeepSeek、聚焦多模態(tài)

第一財經(jīng) 2025-03-16 12:07:37 聽新聞

作者：劉佳責編：胡軍華

百度還將在6月30日正式將文心大模型開源。

3月16日，在文心一言正式發(fā)布兩周年后，百度發(fā)布了多模態(tài)大模型文心4.5和對標DeepSeek的文心X1。

今日文心大模型4.5在百度智能云千帆大模型平臺上線，輸入價格為0.004元/千tokens；文心大模型X1輸入價格0.002元/千tokens，為DeepSeek R1一半。

百度曾是國內(nèi)最早一批發(fā)布大模型的廠商之一，在過去兩年時間里，大模型領域國內(nèi)大模型賽道競爭異常激烈，DeepSeek-R1以顛覆性姿態(tài)“殺”了進來，其開源+低價策略引發(fā)的"鲇魚效應"，迫使全球大模型廠商重新校準競爭維度。第一財經(jīng)記者了解到，李彥宏在今年內(nèi)部講話中透露，百度將于下半年發(fā)布文心大模型的5.0版本，并加大AI應用商業(yè)化實踐。接下來，百度還將在6月30日正式將文心大模型開源。

今日上午記者體驗了百度原生多模態(tài)大模型文心4.5，用戶可上傳包括文檔、圖片、音頻、視頻的文件，讓AI進行解讀。記者上傳了一張《哪吒》電影視頻截圖，就此詢問文心4.5，但AI沒能給出正確答案，而是稱這是來自迪士尼動畫電影《公主與青蛙》中的場景。不過在邏輯測試中，AI能準確識別腦筋急轉(zhuǎn)彎的陷阱并給出回答，針對數(shù)學物理題、益智問答基本能給出準確回答。

文心大模型X1為深度思考模型，運用到的關(guān)鍵技術(shù)包括遞進式強化學習、基于思維鏈和行動鏈的端到端訓練、多元統(tǒng)一的獎勵系統(tǒng)等，百度稱在性能上對標DeepSeek-R1，具備“長思維鏈”。記者體驗看到，除了聯(lián)網(wǎng)搜索外，增加了多模態(tài)能力和多工具調(diào)用，能理解和生成圖片，調(diào)用工具生成代碼、圖表等。目前DeepSeek-R1支持上傳的附件僅識別文字。

在文本創(chuàng)作上，過去文心4.0的觀點較為“端水”，4.5擅長寫“銳評”；在圖片理解方面，當記者再次拿出《哪吒》電影截圖考考X1時，AI給出的答案是《快樂池塘》。記者在進一步的對話中告訴X1答錯了，這是電影《哪吒》場景后，AI表示感謝指正，經(jīng)過分析后表示提供的圖片場景確實出自電影《哪吒》。事實上AI每次錯誤都在拓寬技術(shù)邊界，它的視覺理解也將在"犯錯-修正"的螺旋中不斷改進。

隨著人工智能技術(shù)從基礎問答向復雜推理躍遷，除了百度外，近期包括阿里旗下AI應用夸克、字節(jié)旗下豆包、騰訊混元等都陸續(xù)上線了“深度思考”功能。這也意味著生成式AI的競爭已從早期的信息整合、簡單邏輯推導轉(zhuǎn)向“認知重構(gòu)”，試圖讓AI突破表層語義匹配，建立因果推理、價值判斷及跨領域知識遷移能力。這種競爭不僅體現(xiàn)在模型性能上，各家更通過云計算捆綁、行業(yè)解決方案等生態(tài)卡位爭奪B端市場。

舉報

第一財經(jīng)廣告合作，請點擊這里

此內(nèi)容為第一財經(jīng)原創(chuàng)，著作權(quán)歸第一財經(jīng)所有。未經(jīng)第一財經(jīng)書面授權(quán)，不得以任何方式加以使用，包括轉(zhuǎn)載、摘編、復制或建立鏡像。第一財經(jīng)保留追究侵權(quán)者法律責任的權(quán)利。
如需獲得授權(quán)請聯(lián)系第一財經(jīng)版權(quán)部：banquan@yicai.com