亚洲中文字乱码免费播放,精品国产日韩专区欧美第一页,亚洲中文有码字幕青青,亚洲综合另类专区在线

          首頁 > 新聞 > 科技

          分享到微信

          打開微信,點(diǎn)擊底部的“發(fā)現(xiàn)”,
          使用“掃一掃”即可將網(wǎng)頁分享至朋友圈。

          DeepSeek新模型“火”到海外,Meta首席AI科學(xué)家稱“開源在超越閉源了”

          第一財(cái)經(jīng) 2025-01-26 13:57:32 聽新聞

          作者:鄭栩彤    責(zé)編:李娜

          當(dāng)開源模型能力趕上最新的閉源模型,閉源模型是否還有競爭力?

          DeepSeek上周發(fā)布開源的DeepSeek-R1,并稱該模型性能對標(biāo)OpenAI o1正式版之后,海外AI業(yè)界對該模型的討論還在持續(xù)。

          熱議的焦點(diǎn)在于,當(dāng)開源模型能力趕上最新的閉源模型,可能改變大模型的競爭格局。

          據(jù)DeepSeek介紹,DeepSeek-R1在Codeforces、GPQA Diamond、MATH-500、MMLU、SWE-bench Verified等測試中,得分與o1正式版接近,部分測試中得分還超過o1正式版。該模型在后訓(xùn)練階段大規(guī)模使用了強(qiáng)化學(xué)習(xí)技術(shù),在只有極少標(biāo)注數(shù)據(jù)的情況下提升了模型推理能力。

          AI業(yè)界人士已經(jīng)在討論開源的影響。Meta首席AI科學(xué)家Yann Lecun表示,DeepSeek-R1面世與其說意味著中國公司在AI領(lǐng)域正在超越美國公司,不如說意味著開源大模型正在超越閉源?!癉eepSeek會從開放研究和開源中獲利,可能會類似Meta的PyTorch和Llama。他們提出新想法,并在別人的工作基礎(chǔ)上實(shí)現(xiàn)。因?yàn)樗麄兊墓ぷ魇枪_和開源的,每個人都能從中獲利,這就是開放研究和開源的力量?!盰ann Lecun表示。

          “我們生活在這樣一個時代,一家非美國公司正在讓OpenAI的初衷得以延續(xù),即做真正開放、為所有人賦能的前沿研究?!庇ミ_(dá)高級研究科學(xué)家Jim Fan表示,DeepSeek-R1可能是第一個展示了RL(強(qiáng)化學(xué)習(xí))飛輪可發(fā)揮作用且能帶來持續(xù)增長的OSS(開源軟件)項(xiàng)目。加利福尼亞大學(xué)伯克利分校教授Alex Dimakis則稱,DeepSeek似乎是奔赴OpenAI最初使命的“最佳人選”,其他公司需要迎頭趕上。

          硅谷風(fēng)投A16Z創(chuàng)始人Marc Andreessen也發(fā)表評論稱,DeepSeek-R1是他見過的最令人驚嘆且令人印象深刻的一個突破,作為開源的模型,它的面世給世界帶來了一份禮物。

          對比也走開源路線的Meta,新浪微博新技術(shù)研發(fā)負(fù)責(zé)人張俊林表示,DeepSeek和阿里在開源方面已經(jīng)領(lǐng)先Meta,國內(nèi)的開源風(fēng)氣越來越好,這是被DeepSeek和阿里帶動起來的。得益于DeepSeek開源出的眾多R1版本模型,業(yè)界可以低成本快速復(fù)制出邏輯推理能力更強(qiáng)大的模型。

          用戶可以在自己的服務(wù)器上或使用云算力部署開源模型,并用自己的數(shù)據(jù)微調(diào)大模型,使用開源模型在數(shù)據(jù)安全方面可能優(yōu)于調(diào)用閉源大模型的API接口,且用戶不需要向大模型廠商支付API調(diào)用費(fèi)用。在開源大模型能力超過或比肩閉源大模型能力時,開源對閉源將造成沖擊。

          DeepSeep-R1推出前,開源領(lǐng)域的標(biāo)桿是Meta的Llama系列模型,MiniMax副總裁劉華此前接受第一財(cái)經(jīng)記者采訪時表示,比開源模型更好是一個最基本的門檻,如果基礎(chǔ)模型做不到這一點(diǎn)就可以轉(zhuǎn)而做AI應(yīng)用了。在國內(nèi)做商業(yè)化一個最基本的前提就是比Meta的Llama模型更好。“否則別人可以用Llama,為什么花錢用你的模型?這很現(xiàn)實(shí)?!眲⑷A說。

          DeepSeek是幻方量化旗下的AI公司,創(chuàng)立于2023年,幻方量化創(chuàng)始人梁文峰在量化投資和高性能計(jì)算領(lǐng)域有深厚背景。該公司走開源、性價(jià)比路線,也被冠以“AI界拼多多”的名號。去年5月,DeepSeek發(fā)布DeepSeek-V2,價(jià)格是GPT-4-Turbo的近百分之一,打響了大模型價(jià)格戰(zhàn)的先聲。此次發(fā)布的DeepSeek-R1也提供了API調(diào)用方式,API輸入(緩存命中)、輸出定價(jià)分別為每百萬tokens1云、6元,低于o1的55元、438元。去年12月,DeepSeek還發(fā)布了大模型DeepSeek-V3,因該模型“2048個GPU、2個月、近600萬美元”的極低訓(xùn)練預(yù)算受到關(guān)注。

          不過,從最新消息看,DeepSeek的產(chǎn)品更新并未改變海外巨頭向大模型投入巨額資金、大舉建設(shè)算力基礎(chǔ)設(shè)施的做法。近日OpenAI、甲骨文和軟銀宣布將成立一家合資企業(yè)“星際之門計(jì)劃”,計(jì)劃未來四年投資高達(dá)5000億美元用于建設(shè)AI相關(guān)基礎(chǔ)設(shè)施,該計(jì)劃得到了剛上任的美國總統(tǒng)特朗普的力挺。

          當(dāng)?shù)貢r間1月24日,Meta CEO扎克伯格則表示,為了實(shí)現(xiàn)公司在AI領(lǐng)域的目標(biāo),公司正在建設(shè)一個2吉瓦以上的數(shù)據(jù)中心,占地面積“能夠覆蓋紐約曼哈頓的很大一部分”,公司預(yù)期到今年年底擁有130萬塊GPU,今年的資本支出將達(dá)到600億~650億美元的規(guī)模。

          舉報(bào)
          第一財(cái)經(jīng)廣告合作,請點(diǎn)擊這里
          此內(nèi)容為第一財(cái)經(jīng)原創(chuàng),著作權(quán)歸第一財(cái)經(jīng)所有。未經(jīng)第一財(cái)經(jīng)書面授權(quán),不得以任何方式加以使用,包括轉(zhuǎn)載、摘編、復(fù)制或建立鏡像。第一財(cái)經(jīng)保留追究侵權(quán)者法律責(zé)任的權(quán)利。 如需獲得授權(quán)請聯(lián)系第一財(cái)經(jīng)版權(quán)部:021-22002972或021-22002335;banquan@yicai.com。

          文章作者

          一財(cái)最熱
          點(diǎn)擊關(guān)閉