分享到微信打開微信,點(diǎn)擊底部的“發(fā)現(xiàn)”, |
第一財(cái)經(jīng) 2025-01-26 13:57:32 聽新聞
作者:鄭栩彤 責(zé)編:李娜
DeepSeek上周發(fā)布開源的DeepSeek-R1,并稱該模型性能對標(biāo)OpenAI o1正式版之后,海外AI業(yè)界對該模型的討論還在持續(xù)。
熱議的焦點(diǎn)在于,當(dāng)開源模型能力趕上最新的閉源模型,可能改變大模型的競爭格局。
據(jù)DeepSeek介紹,DeepSeek-R1在Codeforces、GPQA Diamond、MATH-500、MMLU、SWE-bench Verified等測試中,得分與o1正式版接近,部分測試中得分還超過o1正式版。該模型在后訓(xùn)練階段大規(guī)模使用了強(qiáng)化學(xué)習(xí)技術(shù),在只有極少標(biāo)注數(shù)據(jù)的情況下提升了模型推理能力。
AI業(yè)界人士已經(jīng)在討論開源的影響。Meta首席AI科學(xué)家Yann Lecun表示,DeepSeek-R1面世與其說意味著中國公司在AI領(lǐng)域正在超越美國公司,不如說意味著開源大模型正在超越閉源?!癉eepSeek會從開放研究和開源中獲利,可能會類似Meta的PyTorch和Llama。他們提出新想法,并在別人的工作基礎(chǔ)上實(shí)現(xiàn)。因?yàn)樗麄兊墓ぷ魇枪_和開源的,每個人都能從中獲利,這就是開放研究和開源的力量?!盰ann Lecun表示。
“我們生活在這樣一個時代,一家非美國公司正在讓OpenAI的初衷得以延續(xù),即做真正開放、為所有人賦能的前沿研究?!庇ミ_(dá)高級研究科學(xué)家Jim Fan表示,DeepSeek-R1可能是第一個展示了RL(強(qiáng)化學(xué)習(xí))飛輪可發(fā)揮作用且能帶來持續(xù)增長的OSS(開源軟件)項(xiàng)目。加利福尼亞大學(xué)伯克利分校教授Alex Dimakis則稱,DeepSeek似乎是奔赴OpenAI最初使命的“最佳人選”,其他公司需要迎頭趕上。
硅谷風(fēng)投A16Z創(chuàng)始人Marc Andreessen也發(fā)表評論稱,DeepSeek-R1是他見過的最令人驚嘆且令人印象深刻的一個突破,作為開源的模型,它的面世給世界帶來了一份禮物。
對比也走開源路線的Meta,新浪微博新技術(shù)研發(fā)負(fù)責(zé)人張俊林表示,DeepSeek和阿里在開源方面已經(jīng)領(lǐng)先Meta,國內(nèi)的開源風(fēng)氣越來越好,這是被DeepSeek和阿里帶動起來的。得益于DeepSeek開源出的眾多R1版本模型,業(yè)界可以低成本快速復(fù)制出邏輯推理能力更強(qiáng)大的模型。
用戶可以在自己的服務(wù)器上或使用云算力部署開源模型,并用自己的數(shù)據(jù)微調(diào)大模型,使用開源模型在數(shù)據(jù)安全方面可能優(yōu)于調(diào)用閉源大模型的API接口,且用戶不需要向大模型廠商支付API調(diào)用費(fèi)用。在開源大模型能力超過或比肩閉源大模型能力時,開源對閉源將造成沖擊。
DeepSeep-R1推出前,開源領(lǐng)域的標(biāo)桿是Meta的Llama系列模型,MiniMax副總裁劉華此前接受第一財(cái)經(jīng)記者采訪時表示,比開源模型更好是一個最基本的門檻,如果基礎(chǔ)模型做不到這一點(diǎn)就可以轉(zhuǎn)而做AI應(yīng)用了。在國內(nèi)做商業(yè)化一個最基本的前提就是比Meta的Llama模型更好。“否則別人可以用Llama,為什么花錢用你的模型?這很現(xiàn)實(shí)?!眲⑷A說。
DeepSeek是幻方量化旗下的AI公司,創(chuàng)立于2023年,幻方量化創(chuàng)始人梁文峰在量化投資和高性能計(jì)算領(lǐng)域有深厚背景。該公司走開源、性價(jià)比路線,也被冠以“AI界拼多多”的名號。去年5月,DeepSeek發(fā)布DeepSeek-V2,價(jià)格是GPT-4-Turbo的近百分之一,打響了大模型價(jià)格戰(zhàn)的先聲。此次發(fā)布的DeepSeek-R1也提供了API調(diào)用方式,API輸入(緩存命中)、輸出定價(jià)分別為每百萬tokens1云、6元,低于o1的55元、438元。去年12月,DeepSeek還發(fā)布了大模型DeepSeek-V3,因該模型“2048個GPU、2個月、近600萬美元”的極低訓(xùn)練預(yù)算受到關(guān)注。
不過,從最新消息看,DeepSeek的產(chǎn)品更新并未改變海外巨頭向大模型投入巨額資金、大舉建設(shè)算力基礎(chǔ)設(shè)施的做法。近日OpenAI、甲骨文和軟銀宣布將成立一家合資企業(yè)“星際之門計(jì)劃”,計(jì)劃未來四年投資高達(dá)5000億美元用于建設(shè)AI相關(guān)基礎(chǔ)設(shè)施,該計(jì)劃得到了剛上任的美國總統(tǒng)特朗普的力挺。
當(dāng)?shù)貢r間1月24日,Meta CEO扎克伯格則表示,為了實(shí)現(xiàn)公司在AI領(lǐng)域的目標(biāo),公司正在建設(shè)一個2吉瓦以上的數(shù)據(jù)中心,占地面積“能夠覆蓋紐約曼哈頓的很大一部分”,公司預(yù)期到今年年底擁有130萬塊GPU,今年的資本支出將達(dá)到600億~650億美元的規(guī)模。
DeepSeek的技術(shù)創(chuàng)新已經(jīng)重要到很難被禁用,因?yàn)槿虻膶?shí)驗(yàn)室都在爭相復(fù)刻DeepSeek的成功。
農(nóng)歷25年開盤,AI應(yīng)用領(lǐng)域迎來開門紅!截至13:06,計(jì)算機(jī)指數(shù)漲7.00%、軟件服務(wù)指數(shù)漲8.53%,計(jì)算機(jī)指數(shù)成分股衛(wèi)寧健康漲20.06%、金山辦公漲19.68%、潤和軟件漲14.70%。
截至發(fā)稿,安凱微、安恒信息、每日互動等9股漲停,昆侖萬維、海光信息、萬興科技跟漲。
本周A股、人民幣開市在即,將迎來美國非農(nóng)就業(yè)報(bào)告、科技巨頭財(cái)報(bào)和持續(xù)的關(guān)稅擾動。
數(shù)十場路演“暢聊”DeepSeek