分享到微信

打開微信，點(diǎn)擊底部的“發(fā)現(xiàn)”，
使用“掃一掃”即可將網(wǎng)頁分享至朋友圈。

DeepSeek新模型“火”到海外，Meta首席AI科學(xué)家稱“開源在超越閉源了”

第一財(cái)經(jīng) 2025-01-26 13:57:32 聽新聞

作者：鄭栩彤責(zé)編：李娜

當(dāng)開源模型能力趕上最新的閉源模型，閉源模型是否還有競爭力？

DeepSeek上周發(fā)布開源的DeepSeek-R1，并稱該模型性能對標(biāo)OpenAI o1正式版之后，海外AI業(yè)界對該模型的討論還在持續(xù)。

熱議的焦點(diǎn)在于，當(dāng)開源模型能力趕上最新的閉源模型，可能改變大模型的競爭格局。

據(jù)DeepSeek介紹，DeepSeek-R1在Codeforces、GPQA Diamond、MATH-500、MMLU、SWE-bench Verified等測試中，得分與o1正式版接近，部分測試中得分還超過o1正式版。該模型在后訓(xùn)練階段大規(guī)模使用了強(qiáng)化學(xué)習(xí)技術(shù)，在只有極少標(biāo)注數(shù)據(jù)的情況下提升了模型推理能力。

AI業(yè)界人士已經(jīng)在討論開源的影響。Meta首席AI科學(xué)家Yann Lecun表示，DeepSeek-R1面世與其說意味著中國公司在AI領(lǐng)域正在超越美國公司，不如說意味著開源大模型正在超越閉源?！癉eepSeek會從開放研究和開源中獲利，可能會類似Meta的PyTorch和Llama。他們提出新想法，并在別人的工作基礎(chǔ)上實(shí)現(xiàn)。因?yàn)樗麄兊墓ぷ魇枪_和開源的，每個人都能從中獲利，這就是開放研究和開源的力量?！盰ann Lecun表示。

“我們生活在這樣一個時代，一家非美國公司正在讓OpenAI的初衷得以延續(xù)，即做真正開放、為所有人賦能的前沿研究?！庇ミ_(dá)高級研究科學(xué)家Jim Fan表示，DeepSeek-R1可能是第一個展示了RL（強(qiáng)化學(xué)習(xí)）飛輪可發(fā)揮作用且能帶來持續(xù)增長的OSS（開源軟件）項(xiàng)目。加利福尼亞大學(xué)伯克利分校教授Alex Dimakis則稱，DeepSeek似乎是奔赴OpenAI最初使命的“最佳人選”，其他公司需要迎頭趕上。

硅谷風(fēng)投A16Z創(chuàng)始人Marc Andreessen也發(fā)表評論稱，DeepSeek-R1是他見過的最令人驚嘆且令人印象深刻的一個突破，作為開源的模型，它的面世給世界帶來了一份禮物。

對比也走開源路線的Meta，新浪微博新技術(shù)研發(fā)負(fù)責(zé)人張俊林表示，DeepSeek和阿里在開源方面已經(jīng)領(lǐng)先Meta，國內(nèi)的開源風(fēng)氣越來越好，這是被DeepSeek和阿里帶動起來的。得益于DeepSeek開源出的眾多R1版本模型，業(yè)界可以低成本快速復(fù)制出邏輯推理能力更強(qiáng)大的模型。

用戶可以在自己的服務(wù)器上或使用云算力部署開源模型，并用自己的數(shù)據(jù)微調(diào)大模型，使用開源模型在數(shù)據(jù)安全方面可能優(yōu)于調(diào)用閉源大模型的API接口，且用戶不需要向大模型廠商支付API調(diào)用費(fèi)用。在開源大模型能力超過或比肩閉源大模型能力時，開源對閉源將造成沖擊。

DeepSeep-R1推出前，開源領(lǐng)域的標(biāo)桿是Meta的Llama系列模型，MiniMax副總裁劉華此前接受第一財(cái)經(jīng)記者采訪時表示，比開源模型更好是一個最基本的門檻，如果基礎(chǔ)模型做不到這一點(diǎn)就可以轉(zhuǎn)而做AI應(yīng)用了。在國內(nèi)做商業(yè)化一個最基本的前提就是比Meta的Llama模型更好。“否則別人可以用Llama，為什么花錢用你的模型？這很現(xiàn)實(shí)?！眲⑷A說。

DeepSeek是幻方量化旗下的AI公司，創(chuàng)立于2023年，幻方量化創(chuàng)始人梁文峰在量化投資和高性能計(jì)算領(lǐng)域有深厚背景。該公司走開源、性價(jià)比路線，也被冠以“AI界拼多多”的名號。去年5月，DeepSeek發(fā)布DeepSeek-V2，價(jià)格是GPT-4-Turbo的近百分之一，打響了大模型價(jià)格戰(zhàn)的先聲。此次發(fā)布的DeepSeek-R1也提供了API調(diào)用方式，API輸入（緩存命中）、輸出定價(jià)分別為每百萬tokens1云、6元，低于o1的55元、438元。去年12月，DeepSeek還發(fā)布了大模型DeepSeek-V3，因該模型“2048個GPU、2個月、近600萬美元”的極低訓(xùn)練預(yù)算受到關(guān)注。

不過，從最新消息看，DeepSeek的產(chǎn)品更新并未改變海外巨頭向大模型投入巨額資金、大舉建設(shè)算力基礎(chǔ)設(shè)施的做法。近日OpenAI、甲骨文和軟銀宣布將成立一家合資企業(yè)“星際之門計(jì)劃”，計(jì)劃未來四年投資高達(dá)5000億美元用于建設(shè)AI相關(guān)基礎(chǔ)設(shè)施，該計(jì)劃得到了剛上任的美國總統(tǒng)特朗普的力挺。

當(dāng)?shù)貢r間1月24日，Meta CEO扎克伯格則表示，為了實(shí)現(xiàn)公司在AI領(lǐng)域的目標(biāo)，公司正在建設(shè)一個2吉瓦以上的數(shù)據(jù)中心，占地面積“能夠覆蓋紐約曼哈頓的很大一部分”，公司預(yù)期到今年年底擁有130萬塊GPU，今年的資本支出將達(dá)到600億~650億美元的規(guī)模。

舉報(bào)

第一財(cái)經(jīng)廣告合作，請點(diǎn)擊這里

此內(nèi)容為第一財(cái)經(jīng)原創(chuàng)，著作權(quán)歸第一財(cái)經(jīng)所有。未經(jīng)第一財(cái)經(jīng)書面授權(quán)，不得以任何方式加以使用，包括轉(zhuǎn)載、摘編、復(fù)制或建立鏡像。第一財(cái)經(jīng)保留追究侵權(quán)者法律責(zé)任的權(quán)利。如需獲得授權(quán)請聯(lián)系第一財(cái)經(jīng)版權(quán)部：021-22002972或021-22002335；banquan@yicai.com。

文章作者

鄭栩彤

相關(guān)閱讀

DeepSeek引發(fā)多國政府審查，為何“禁用”這招不靈了？

DeepSeek的技術(shù)創(chuàng)新已經(jīng)重要到很難被禁用，因?yàn)槿虻膶?shí)驗(yàn)室都在爭相復(fù)刻DeepSeek的成功。

104 3小時前

DeepSeek引爆科技行情！

農(nóng)歷25年開盤，AI應(yīng)用領(lǐng)域迎來開門紅！截至13:06，計(jì)算機(jī)指數(shù)漲7.00%、軟件服務(wù)指數(shù)漲8.53%，計(jì)算機(jī)指數(shù)成分股衛(wèi)寧健康漲20.06%、金山辦公漲19.68%、潤和軟件漲14.70%。

22 99 4小時前