亚洲中文字乱码免费播放,精品国产日韩专区欧美第一页,亚洲中文有码字幕青青,亚洲综合另类专区在线

          首頁(yè) > 新聞 > 科技

          分享到微信

          打開(kāi)微信,點(diǎn)擊底部的“發(fā)現(xiàn)”,
          使用“掃一掃”即可將網(wǎng)頁(yè)分享至朋友圈。

          一個(gè)向左一個(gè)向右, OpenAI與DeepSeek 誰(shuí)能主導(dǎo)AI競(jìng)爭(zhēng)格局?

          第一財(cái)經(jīng) 2025-02-28 13:40:50 聽(tīng)新聞

          作者:劉曉潔 ? 鄭栩彤    責(zé)編:李娜

          OpenAI 發(fā)布了昂貴的GPT-4.5,而DeepSeek進(jìn)行著最后一天的代碼開(kāi)源分享。

          北京時(shí)間2月28日凌晨,OpenAI發(fā)布GPT-4.5。“這是我們迄今為止最大、最好的聊天模型,是在擴(kuò)大預(yù)訓(xùn)練和后訓(xùn)練道路上邁出的一步。” OpenAI介紹,這款新模型面向GPT Pro用戶(hù),下周起將向Plus用戶(hù)和Team用戶(hù)推出。

          OpenAI CEO山姆·奧爾特曼(Sam Altman)因?yàn)?ldquo;在醫(yī)院照顧孩子”并沒(méi)有出現(xiàn)在發(fā)布現(xiàn)場(chǎng),但他在X上發(fā)布了帖子造勢(shì),強(qiáng)調(diào)GPT-4.5是一個(gè)“高情商”更像人的模型,不會(huì)超越基準(zhǔn)測(cè)試,是一種“不同類(lèi)型的智能”。

          從目前業(yè)界的反應(yīng)來(lái)看,這一代模型的能力提升并不算大,但令人驚訝的是GPT-4.5的價(jià)格,每百萬(wàn)Tokens輸入為75美元,相比GPT-4o的2.5美元上漲30倍,同時(shí),OpenAI表示,GPT-4.5無(wú)法完全替代GPT-4o。

          與此同時(shí),DeepSeek 26日剛在海內(nèi)外宣布了API 錯(cuò)峰時(shí)間段的降價(jià),V3模型和 R1模型的每百萬(wàn)Tokens輸入只要0.035美元,相比原價(jià)分別下調(diào)50%和75%,GPT-4.5是這個(gè)價(jià)格的2000多倍。就在28日,DeepSeek還放出了“開(kāi)源周”最后一個(gè)代碼庫(kù),將開(kāi)源進(jìn)行到底,這一攪動(dòng)AI圈的“鯰魚(yú)”,正在改寫(xiě)AI競(jìng)爭(zhēng)格局。

          好消息和壞消息

          GPT-4.5是奧爾特曼此前預(yù)告將“在幾周內(nèi)”發(fā)布的模型。奧爾特曼彼時(shí)稱(chēng),除了發(fā)布GPT-4.5,幾個(gè)月時(shí)間內(nèi)OpenAI還將發(fā)布下一代基座模型GPT-5。如此看,GPT-4.5很可能是GPT-5面世前的最后一個(gè)過(guò)渡模型。

          與OpenAI此前發(fā)布新模型時(shí)的慣常做法不同,此前OpenAI通常會(huì)強(qiáng)調(diào)新模型在各領(lǐng)域的基準(zhǔn)測(cè)試分?jǐn)?shù),此次OpenAI則表示,學(xué)術(shù)基準(zhǔn)并不總是反映現(xiàn)實(shí)世界的有用性,OpenAI轉(zhuǎn)而強(qiáng)調(diào)了GPT-4.5的“情商”。

          奧爾特曼在發(fā)帖中提到了“好消息”和“壞消息”,前者是,“這是第一個(gè)讓人感覺(jué)像是在跟一個(gè)有思想的人說(shuō)話(huà)的模型。”他表示,曾多次驚訝地發(fā)現(xiàn)能從人工智能那里得到很好的建議。

          壞消息則是,“這是一個(gè)龐大而昂貴的模型”,甚至沒(méi)辦法同時(shí)推到plus用戶(hù)那里,奧爾特曼表示,“GPU已經(jīng)不夠了”,下周將添加數(shù)萬(wàn)個(gè)GPU,然后將其推廣到plus。

          奧爾特曼還特別提到,GPT-4.5不是一個(gè)推理模型,也不會(huì)在基準(zhǔn)測(cè)試中取得壓倒性?xún)?yōu)勢(shì)。它是一種“不同類(lèi)型的智能”。在新模型發(fā)布前不久,OpenAI首席研究官M(fèi)ark Chen接受播客采訪(fǎng)稱(chēng),新模型并未被命名為GPT-5,這是因?yàn)镺penAI內(nèi)部對(duì)這款模型的評(píng)估還沒(méi)有到達(dá)整整一代的性能提升。

          OpenAI表示,早期測(cè)試表明,用戶(hù)與GPT-4.5交互更自然,該模型有更廣泛的知識(shí)基礎(chǔ)、理解用戶(hù)意圖的更強(qiáng)能力和更強(qiáng)大的“情商”,這使得GPT-4.5在寫(xiě)作、編程、解決實(shí)際問(wèn)題等任務(wù)上很有用。在訓(xùn)練過(guò)程中,OpenAI則使用了擴(kuò)大(Scaling)無(wú)監(jiān)督學(xué)習(xí)和推理的方法。

          OpenAI特別強(qiáng)調(diào)了GPT-4.5幻覺(jué)率降低、與人類(lèi)協(xié)作表現(xiàn)更佳。OpenAI通過(guò)用簡(jiǎn)單但具有挑戰(zhàn)性的知識(shí)問(wèn)題測(cè)試模型,結(jié)果顯示,GPT-4.5的幻覺(jué)率為37.1%,低于GPT-4o的61.8%、o1的44%、o3-mini的80.3%。在與人類(lèi)協(xié)作的能力方面,OpenAI稱(chēng),GPT-4.5在日常查詢(xún)、專(zhuān)業(yè)查詢(xún)、創(chuàng)造性智能這3個(gè)方面表現(xiàn)都比GPT-4o更強(qiáng),GPT-4.5能更好地理解人類(lèi)微妙的暗示或隱含的期望。

          為了展示GPT-4.5的能力,OpenAI舉了個(gè)例子。問(wèn)GPT-4.5“世界上第一種語(yǔ)言是什么”,GPT4.5的回答是“我們不知道確切的第一種語(yǔ)言是什么,科學(xué)家認(rèn)為我們可能永遠(yuǎn)不知道確切的答案,因?yàn)榭谡Z(yǔ)的出現(xiàn)遠(yuǎn)早于書(shū)面記錄”,并解釋了沒(méi)有單一的第一種語(yǔ)言、口語(yǔ)可能最早在非洲出現(xiàn)。

          同樣的問(wèn)題問(wèn)GPT-4的4T版本,回答則是“確定人類(lèi)使用的第一種語(yǔ)言極具挑戰(zhàn)性”,并解釋稱(chēng),語(yǔ)言學(xué)家假設(shè)有許多語(yǔ)言的共同祖先,但這種祖先不是第一種語(yǔ)言。直觀(guān)感受上,GPT-4.5的表達(dá)更接近人類(lèi),GPT-4T的語(yǔ)言表達(dá)顯得有些機(jī)械。

          此外,OpenAI還強(qiáng)調(diào)了GPT-4.5與o1這類(lèi)長(zhǎng)思維鏈推理模型不同。例如,GPT-4.5在做出反應(yīng)前不需要經(jīng)過(guò)思考,因此更通用,也更智能。不過(guò),OpenAI也說(shuō)明,推理仍將是未來(lái)模型的核心能力,更強(qiáng)的推理能力即將出現(xiàn)。

          在附錄部分,OpenAI才放出GPT-4.5的基準(zhǔn)測(cè)試分?jǐn)?shù)。在反映科學(xué)、數(shù)學(xué)、多語(yǔ)言、編碼的GPQA、AIME’24、MMMLU、SWE-Lancer基準(zhǔn)測(cè)試上,GPT-4.5得分分別為71.4%、36.7%、85.1%、32.6%,超過(guò)GPT-4o的53.6%、9.3%、81.5%、23.3%,但部分得分低于o3-mini。

          這一代的能力提升并不明顯,而與此相對(duì)的是,能力定價(jià)上,GPT-4.5預(yù)覽版的API調(diào)用價(jià)格為每百萬(wàn)Tokens輸入(input)75美元,輸出(output)150美元,分別是GPT-4o價(jià)格的30倍、15倍。

          即便相比自家模型,這個(gè)價(jià)格也過(guò)于昂貴,而進(jìn)一步與 DeepSeek 進(jìn)行對(duì)比,差距更大。近期非波峰時(shí)間段,V3 模型和 R1 模型的每百萬(wàn)Tokens輸入為0.035美元(原價(jià)分別是0.07美元/0.14美元),每百萬(wàn) token Tokens輸出只需要 0.55 美元(原價(jià)分別是1.1美元/2.19美元),GPT-4.5分別是上述價(jià)格的2000多倍和270多倍。

          OpenAI說(shuō)明,由于GPT-4.5是一個(gè)非常大且計(jì)算密集的模型,所以?xún)r(jià)格比GPT-4o更貴。同時(shí),OpenAI提到GPT-4.5 還無(wú)法完全替代 GPT-4o。考慮到要在支持現(xiàn)有功能和開(kāi)發(fā)未來(lái)的模型之間取得平衡,OpenAI還在評(píng)估是否長(zhǎng)期在A(yíng)PI(接口)使用該模型。

          “鯰魚(yú)”攪動(dòng)AI圈

          除了拼性?xún)r(jià)比,DeepSeek另一個(gè)方向是堅(jiān)定開(kāi)源路線(xiàn)。

          就在OpenAI新品發(fā)布的這一天,DeepSeek正進(jìn)行著本周第五項(xiàng)代碼開(kāi)源——Fire-Flyer文件系統(tǒng)(3FS)。它是“所有 DeepSeek 數(shù)據(jù)訪(fǎng)問(wèn)的動(dòng)力引擎”,一個(gè)高性能的并行文件系統(tǒng),專(zhuān)門(mén)優(yōu)化AI數(shù)據(jù)訪(fǎng)問(wèn),為 AI 工作負(fù)載提供卓越的存儲(chǔ)基礎(chǔ)設(shè)施。

          據(jù)DeepSeek,3FS是專(zhuān)為AI場(chǎng)景設(shè)計(jì)的高性能存儲(chǔ)解決方案,通過(guò)架構(gòu)創(chuàng)新和硬件適配顯著提升了數(shù)據(jù)處理效率,與傳統(tǒng)的云存儲(chǔ)掛載工具(如s3fs)在目標(biāo)場(chǎng)景和技術(shù)實(shí)現(xiàn)上存在顯著差異。

          除了3FS,DeepSeek本周陸續(xù)開(kāi)源了讓大模型在GPU上跑得更快的MLA解碼核FlashMLA,用于MoE模型訓(xùn)練和推理的DeepEP通信庫(kù),可支持MoE的FP8 GEMM代碼庫(kù)DeepGEMM,一系列優(yōu)化并行策略等底層代碼,在GitHub上,DeepSeek詳細(xì)展開(kāi)了DeepSeek-V3和R1模型背后的優(yōu)化技術(shù),教社區(qū)如何最大限度利用GPU能力。

          “相當(dāng)于以前DeepSeek是直接給一輛車(chē),告訴大家這輛車(chē)?yán)m(xù)航900公里,但是現(xiàn)在DeepSeek在深挖,用什么方式能夠開(kāi)到900公里。”大模型生態(tài)社區(qū)OpenCSG(開(kāi)放傳神)創(chuàng)始人陳冉此前對(duì)第一財(cái)經(jīng)舉例表示。

          陳冉認(rèn)為,DeepSeek現(xiàn)在發(fā)布的算法某種意義上屬于“腳手架”, 這些“腳手架”的開(kāi)源有利于之后的生態(tài)搭建。社區(qū)和開(kāi)發(fā)者可以基于DeepSeek的技術(shù)路線(xiàn)繼續(xù)往前走,最終行業(yè)能基于此將生態(tài)做起來(lái)。

          長(zhǎng)期來(lái)看,DeepSeek這一開(kāi)源動(dòng)作的意義在于,有模型標(biāo)準(zhǔn),也有工具標(biāo)準(zhǔn),也有生態(tài)基石,生態(tài)就能長(zhǎng)起來(lái)。也有從業(yè)者認(rèn)為,如果把大模型比作更底層的操作系統(tǒng),那OpenAI可能是相對(duì)封閉的IOS生態(tài),而DeepSeek就是開(kāi)放的安卓。

          DeepSeek或許改寫(xiě)了AI圈的競(jìng)爭(zhēng)格局和方向。奧爾特曼在2月o3-mini發(fā)布當(dāng)天表示,OpenAI的開(kāi)源政策站在了“歷史錯(cuò)誤的一邊”,需要想出一個(gè)不同的開(kāi)源策略。

          在國(guó)內(nèi),一貫堅(jiān)持閉源路線(xiàn)的百度也“倒戈”向開(kāi)源。去年,百度董事長(zhǎng)李彥宏還表示,大模型開(kāi)源的意義不大,閉源模型在能力上會(huì)持續(xù)領(lǐng)先。今年2月14日,百度就宣布將在未來(lái)幾個(gè)月陸續(xù)推出文心大模型4.5系列,并于6月30日正式開(kāi)源。

          從開(kāi)源的沖擊看,能力不如開(kāi)源模型的閉源模型面臨尷尬境地。既然開(kāi)源模型可以被開(kāi)發(fā)者自行下載、微調(diào)乃至私有化部署,就不需要為了使用閉源大模型付費(fèi)了。

          DeepSeek將算力用到極致,在低成本的基礎(chǔ)上進(jìn)行模型的訓(xùn)練和推理,此前也一度帶崩芯片股,將壓力給到海外大廠(chǎng),規(guī)模越來(lái)越大的數(shù)據(jù)中心相關(guān)資本支出是否合理?這成為投資人對(duì)大廠(chǎng)的疑慮。

          1月以來(lái),海外AI巨頭近期新品發(fā)布密集,谷歌發(fā)布了Gemini2.0系列,xAI發(fā)布了馬斯克口中“地球上最聰明的人工智能”Grok 3,OpenAI緊接著拿出了GPT-4.5。

          從全球知名AI模型評(píng)測(cè)平臺(tái)Chatbot Arena(大模型競(jìng)技場(chǎng))的最新榜單來(lái)看,最新發(fā)布的Gemini2.0系列旗艦?zāi)P团cGrok 3確實(shí)排在前列,但與排在第5位的DeepSeek-R1并沒(méi)有拉開(kāi)實(shí)質(zhì)性的差距,以大模型競(jìng)技場(chǎng)的評(píng)分來(lái)看,差距在15分-40分之間。

          在2025年達(dá)沃斯論壇上,AI科技初創(chuàng)公司Scale AI創(chuàng)始人亞歷山大·王(Alexandr Wang)公開(kāi)表示, DeepSeek的AI大模型性能大致與美國(guó)最好的模型相當(dāng)。他認(rèn)為,過(guò)去十年來(lái),美國(guó)可能一直在人工智能競(jìng)賽中領(lǐng)先于中國(guó),但DeepSeek的AI大模型發(fā)布可能會(huì)“改變一切”。

          在國(guó)內(nèi),DeepSeek同樣給大模型廠(chǎng)商不小的壓力。去年C端大模型應(yīng)用做得聲量最大的國(guó)內(nèi)廠(chǎng)商中,一定有豆包和Kimi。但如果最近再看蘋(píng)果中國(guó)區(qū)免費(fèi)版APP排行,會(huì)發(fā)現(xiàn),第一名是DeepSeek,騰訊元寶搭載DeepSeek并大方投流后,也沖到了榜單第二名。

          AI業(yè)內(nèi)人士表示,DeepSeek的技術(shù)實(shí)力過(guò)硬且選擇開(kāi)源,這對(duì)一些閉源公司造成了沖擊,一些大模型團(tuán)隊(duì)需要反思自身的做法。

          DeepSeek-R1不是大模型競(jìng)爭(zhēng)的終局,有消息稱(chēng),DeepSeek正尋求鞏固自身優(yōu)勢(shì),盡早推出R2模型,消息提到DeepSeek原本計(jì)劃在5月初發(fā)布R2模型,目前會(huì)加快這一速度。DeepSeek目前并未對(duì)此回應(yīng)。

          此前DeepSeek在R1論文中提到,R1的性能將在下一個(gè)版本得到改善,因?yàn)橄嚓P(guān)的RL(強(qiáng)化學(xué)習(xí))訓(xùn)練數(shù)據(jù)還很少。隨著RL數(shù)據(jù)的增加,模型解決復(fù)雜推理任務(wù)的能力持續(xù)穩(wěn)定提升,且會(huì)自然涌現(xiàn)出一些復(fù)雜行為能力。

          同時(shí),OpenAI的下一代推理模型o3計(jì)劃融入GPT-5并在幾個(gè)月內(nèi)推出。雖然OpenAI還在持續(xù)推出GPT-4o、GPT-4.5這類(lèi)帶有過(guò)渡色彩的模型,但目前距離GPT-4推出已有近兩年時(shí)間。發(fā)布GPT-4.5之后,OpenAI還需盡快證明自己仍是全球最先進(jìn)的大模型公司,接下來(lái)推出GPT-5將是重要一步。

          DeepSeek能否贏(yíng)得下一局對(duì)弈仍存變數(shù),但可以確定的是,它為行業(yè)競(jìng)爭(zhēng)帶來(lái)了更深遠(yuǎn)的影響,在2025年初以壓倒性的聲勢(shì)冒頭,打亂了AI圈的格局,競(jìng)爭(zhēng)對(duì)手或許需要思考,如何走贏(yíng)下一步棋。

          舉報(bào)
          第一財(cái)經(jīng)廣告合作,請(qǐng)點(diǎn)擊這里
          此內(nèi)容為第一財(cái)經(jīng)原創(chuàng),著作權(quán)歸第一財(cái)經(jīng)所有。未經(jīng)第一財(cái)經(jīng)書(shū)面授權(quán),不得以任何方式加以使用,包括轉(zhuǎn)載、摘編、復(fù)制或建立鏡像。第一財(cái)經(jīng)保留追究侵權(quán)者法律責(zé)任的權(quán)利。
          如需獲得授權(quán)請(qǐng)聯(lián)系第一財(cái)經(jīng)版權(quán)部:banquan@yicai.com

          文章作者

          一財(cái)最熱
          點(diǎn)擊關(guān)閉