亚洲中文字乱码免费播放,精品国产日韩专区欧美第一页,亚洲中文有码字幕青青,亚洲综合另类专区在线

          首頁 > 新聞 > 科技

          分享到微信

          打開微信,點(diǎn)擊底部的“發(fā)現(xiàn)”,
          使用“掃一掃”即可將網(wǎng)頁分享至朋友圈。

          DeepSeek砸開裂縫,國產(chǎn)算力奔涌而出 | 萬有AI力

          第一財(cái)經(jīng) 2025-02-07 15:16:52 聽新聞

          作者:彭海斌    責(zé)編:李娜

          中國市場會(huì)慢慢演變,屆時(shí)英偉達(dá)會(huì)是一部分算力底座,其他國產(chǎn)芯片是另一部分算力底座。

          DeepSeek是國產(chǎn)算力企業(yè)在春節(jié)看到的最大煙花。

          2025年春節(jié)前,DeepSeek發(fā)布大模型;春節(jié)期間,國內(nèi)GPU企業(yè)以及云計(jì)算廠商等,紛紛披露適配DeepSeek模型的進(jìn)展。為此,不少科技從業(yè)人員度過了一個(gè)無休的假期。DeepSeek大模型的訓(xùn)練是基于英偉達(dá)的GPU,目前后者是全球大模型的算力底座(占比九成以上)。不過,DeepSeek也指向重大轉(zhuǎn)變的可能:訓(xùn)練一款性能優(yōu)異的大模型,不需要那么高的算力投入。

          DeepSeek震蕩科技圈,國產(chǎn)算力搭配國產(chǎn)大模型的機(jī)會(huì)出現(xiàn)。沐曦CTO楊建認(rèn)為,今年年底部分大模型的預(yù)訓(xùn)練可能會(huì)轉(zhuǎn)入非英偉達(dá)的卡,明年這種趨勢會(huì)更加明顯。“中國市場會(huì)慢慢演變,屆時(shí)英偉達(dá)會(huì)是一部分算力底座,其他國產(chǎn)芯片是另一部分算力底座。全球算力供應(yīng)變成兩條并行的線路了。”

          國產(chǎn)算力搭配國產(chǎn)模型

          春節(jié)前后,國產(chǎn)芯片密集適配DeepSeek。

          2月1日,大模型云服務(wù)平臺Silicon Cloud上線了DeepSeek-V3、DeepSeek-R1。Silicon Cloud背后的公司硅基流動(dòng)特別強(qiáng)調(diào),“在自研推理加速引擎加持下,硅基流動(dòng)團(tuán)隊(duì)基于華為云昇騰云服務(wù)部署的DeepSeek 模型可獲得持平全球高端GPU部署模型的效果。”

          硅基流動(dòng)CEO袁進(jìn)輝春節(jié)沒能休息一天。產(chǎn)品上線之后,一度需要限流。他調(diào)侃說:“DeepSeek需求量太大了,我原本以為我們能接住。”

          2月2日,Gitee AI表示在春節(jié)期間上線四個(gè)較小尺寸的DeepSeek模型,均部署在國產(chǎn)的沐曦曦云GPU上,面向開發(fā)者市場。

          據(jù)沐曦CTO楊建向第一財(cái)經(jīng)介紹,從雙方協(xié)商到部署完成,整個(gè)過程不過兩天時(shí)間。“模型大小決定了使用場景,比如1.5B模型可以用到手機(jī)上,7B及以上模型都可以用在云端或者私有化部署上。”

          2月4日,摩爾線程宣布完成了小尺寸的DeepSeek模型在其自主設(shè)計(jì)的夸娥(KUAE)GPU集群上的部署,并表示即將開放夸娥智算集群,支持DeepSeek V3、R1模型及新一代蒸餾模型的分布式部署。

          “DeepSeek V3和R1模型的部署需要集群能力。但基于DeepSeek蒸餾的小模型,不需要集群也能部署。摩爾線程基于自研全功能GPU,通過開源與自研雙引擎方案,可以快速實(shí)現(xiàn)對DeepSeek蒸餾模型的推理服務(wù)部署。”摩爾線程AI與云計(jì)算副總裁王華書面回復(fù)第一財(cái)經(jīng)時(shí)表示。

          2月5日,云服務(wù)商優(yōu)刻得宣布基于壁仞科技國產(chǎn)芯片的內(nèi)存架構(gòu)、多模型適配能力,開展包括R1在內(nèi)的DeepSeek全系列模型適配工作。壁仞科技是一家中國GPU廠商。實(shí)際上,在壁仞科技的芯片上部署DeepSeek之前,優(yōu)刻得已經(jīng)在英偉達(dá)芯片上部署了這款大熱的模型。

          “我們應(yīng)該是在除夕那天完成的部署。”優(yōu)刻得計(jì)算產(chǎn)品中心研發(fā)總監(jiān)王曉慧對第一財(cái)經(jīng)表示,很多科技企業(yè)和技術(shù)人員被DeepSeek年前所放的大煙花所震動(dòng),度過了一個(gè)無休的春節(jié)。

          在DeepSeek-V3/R1上線不久,昆侖芯也完成了全版本模型適配,其中包括DeepSeek MoE 模型及其蒸餾的Llama/Qwen等小模型。昆侖芯方面表示,該公司的P800僅需32臺即可支持模型全參訓(xùn)練,完成模型持續(xù)訓(xùn)練和微調(diào)。

          這幾家中國芯片企業(yè)表態(tài)前后,國內(nèi)國際的科技大廠也先后表示已經(jīng)將DeepSeek模型納入其產(chǎn)業(yè)生態(tài),這些大廠包括了國內(nèi)的阿里云、百度云以及騰訊云,美國的亞馬遜云科技、Meta、谷歌等。

          不過,這些科技大廠的算力底座基本都是英偉達(dá)。

          “在大模型訓(xùn)練過程中,我認(rèn)為全球98%的訓(xùn)練是基于英偉達(dá)GPU算力底座的。今天為止,非英偉達(dá)算力底座的訓(xùn)練合在一起可能也就2%的市場份額。”楊建告訴記者。

          王曉慧同樣認(rèn)為,當(dāng)下“云上算力的分布,98% 、99%都是英偉達(dá)。”

          DeepSeek展示了超強(qiáng)的產(chǎn)業(yè)穿透力,不過它并沒有脫離英偉達(dá)生態(tài)。王華認(rèn)為,DeepSeek繞過英偉達(dá)的CUDA是誤讀,本質(zhì)上其技術(shù)實(shí)現(xiàn)仍深度依賴NVIDIA生態(tài)的核心組件(PTX)。即使框架層試圖抽象化CUDA API,只要底層運(yùn)行在英偉達(dá)GPU上,就不可避免與CUDA工具鏈和硬件驅(qū)動(dòng)綁定。這種依賴關(guān)系反映了當(dāng)前AI算力領(lǐng)域“NVIDIA主導(dǎo),開源生態(tài)依附”的現(xiàn)實(shí)格局。

          只是第一步跨出來了”

          “國產(chǎn)算力把DeepSeek模型跑起來,其實(shí)是相對比較容易的?,F(xiàn)在大家都只是第一步跨出來了。”王曉慧表示。

          國產(chǎn)GPU適配主流開源大模型已經(jīng)有幾年時(shí)間,比如支持Meta的LlaMa、阿里的通義千問等。但難點(diǎn)之一在于如何把模型架構(gòu)跟硬件架構(gòu)做比較好地結(jié)合,使其整體性能得到更大提升。

          目前DeepSeek大模型搭配的國產(chǎn)GPU所能展示出來的性能和英偉達(dá)GPU還有一定差距。這背后原因在于DeepSeek模型本身的架構(gòu),它的訓(xùn)練、推理過程,最初都是在英偉達(dá)芯片上跑出來的,針對英偉達(dá)芯片做了高度的調(diào)優(yōu)。“短時(shí)間內(nèi),很難把這些優(yōu)化點(diǎn)匹配到國產(chǎn)芯片上來。我覺得這也是接下來各大國產(chǎn)芯片廠商要去做的一件事情。”

          國產(chǎn)芯片繞過英偉達(dá)抵達(dá)最終用戶,難點(diǎn)更在于英偉達(dá)的護(hù)城河寬且深。

          “比如說他(指用戶)現(xiàn)在跑一個(gè)(英偉達(dá))4090或者跑一個(gè)(英偉達(dá))H100,裝一個(gè)軟件報(bào)錯(cuò)了。他去論壇或者問身邊有經(jīng)驗(yàn)的人,就能非常容易地找到解決方案。大家遇到過類似的問題,能夠在社區(qū)里面找到可以咨詢的人。”楊建對記者說,而很多國產(chǎn)卡的信息不那么開放,社區(qū)活躍度沒有那么高,用戶一旦遇到卡點(diǎn)就很難解決,要花很多時(shí)間在非業(yè)務(wù)上。

          這一點(diǎn)在小型團(tuán)隊(duì)上表現(xiàn)得更加明顯。

          直播、數(shù)字人等小型團(tuán)隊(duì),有時(shí)候只有四五個(gè)人。這些團(tuán)隊(duì)在財(cái)力上缺乏騰挪的空間,在技術(shù)迭代上缺乏騰挪的時(shí)間。“他們做東西一定是一上來就要養(yǎng)活團(tuán)隊(duì)。哪個(gè)更容易上手,哪個(gè)錢更少,他一定是去走這條路徑,而不是一上來就國產(chǎn)化。”王曉慧說,小型公司部署大模型的時(shí)候,優(yōu)先考慮的還是英偉達(dá)的算力,這是最快看到結(jié)果,或者試錯(cuò)成本最低的方式。

          國產(chǎn)芯片往往需要在價(jià)格上給出折扣,才能更好導(dǎo)入私有化部署的企業(yè)。王曉慧認(rèn)為:“國產(chǎn)算力卡的性價(jià)比要達(dá)到20%、甚至30%的提升,否則企業(yè)很少有會(huì)愿意去做主動(dòng)替換。”

          美國在過去幾年實(shí)施的高端算力芯片禁令,使得中國企業(yè)更難以獲得英偉達(dá)產(chǎn)品,而DeepSeek爆火之后,已經(jīng)有些美國企業(yè)開始炒作進(jìn)一步限制中國芯片進(jìn)口。美國禁令倒逼中國芯片企業(yè)發(fā)展。

          “DeepSeek火了之后,美國企業(yè)是非??只诺摹K晕磥韺χ袊懔Φ墓芸匾欢〞?huì)越來越嚴(yán)。我們自身如果沒有任何突破的話,算力就會(huì)成為一個(gè)瓶頸。所以國產(chǎn)算力是必然要去走的一條路。”王曉慧說。

          并行的算力供應(yīng)線

          據(jù)楊建觀察,DeepSeek公開的技術(shù)報(bào)告對芯片設(shè)計(jì)給出了一些建議。

          “它自己在跑H800的過程中,發(fā)現(xiàn)有一些設(shè)計(jì)本身是不太合理的。比如芯片占用大量的算力去做通信,DeepSeek提出能不能把通信抽出來做。英偉達(dá)就很難根據(jù)這種建議去做改進(jìn),但是國產(chǎn)卡是有可能采納這部分意見的。”楊建說。英偉達(dá)生態(tài)龐大而牽一發(fā)動(dòng)全身,國產(chǎn)芯片企業(yè)普遍規(guī)模比較小,也有靈活機(jī)動(dòng)的優(yōu)勢。“國產(chǎn)芯片起步?jīng)]有那么早,技術(shù)棧沒有那么深,想要去做一些調(diào)整,應(yīng)該是比較輕量的。”

          DeepSeek并不比其他國產(chǎn)大模型更容易搭載國產(chǎn)芯片。但王曉慧也認(rèn)為,只要是走在這個(gè)發(fā)展路徑上,一定會(huì)適配的越來越好。

          王曉慧表示:“它不可能一下子把所有在英偉達(dá)上的優(yōu)化,能夠無縫遷移到國產(chǎn)卡上,這是有適配周期和過程的。但你這有了這樣的一個(gè)模型架構(gòu),國產(chǎn)卡可以去出一些軟件升級,一些還在萌芽里的芯片廠在設(shè)計(jì)上可能也會(huì)有一些新的想法,能夠去讓DeepSeek優(yōu)化的更好。”

          騰訊云、優(yōu)刻得這樣的平臺搭載的大模型接近百款,除了使用英偉達(dá)的芯片之外,在幾年前就已經(jīng)適配壁仞科技等國產(chǎn)芯片。

          最早的時(shí)候,優(yōu)刻得為了能讓國產(chǎn)卡跑起來,需要做非常多的適配、調(diào)試。但那時(shí)候的“國產(chǎn)卡可能跑著跑著就掛了”。

          “原先我們測一些機(jī)卡,單卡的性能可能達(dá)到英偉達(dá)的一定程度。一旦到多卡多機(jī)之后,性能就明顯有衰減。”王曉慧從幾年前開始測試一些國產(chǎn)卡,她感覺進(jìn)步明顯,“我們?nèi)ツ觊_始已經(jīng)能看到,這部分已經(jīng)在緩解,有非常大的提升。”

          國產(chǎn)算力也在日新月異地提升。

          蛇年開工當(dāng)天,昆侖芯新一代產(chǎn)品P800萬卡集群點(diǎn)亮。昆侖芯也已適配文心系列、Llama、Qwen、ChatGLM等各類大模型的推理和訓(xùn)練任務(wù);摩爾線程目前已經(jīng)適配并拉起了數(shù)百個(gè)LLM模型的訓(xùn)練,在制造業(yè)、工程機(jī)械、教育、金融、政務(wù)、AI繪畫等眾多行業(yè)得到一定的應(yīng)用。

          楊建認(rèn)為,今年年底部分大模型的預(yù)訓(xùn)練可能會(huì)轉(zhuǎn)入非英偉達(dá)的卡,而明年這種趨勢會(huì)更加明顯。“到了2026年、2027年,我認(rèn)為英偉達(dá)在美國仍然是最主要的預(yù)訓(xùn)練、甚至后訓(xùn)練的算力底座。但中國市場會(huì)慢慢演變,屆時(shí)英偉達(dá)會(huì)是一部分算力底座,其他國產(chǎn)芯片是另一部分算力底座。全球算力供應(yīng)變成兩條并行的線路了。”

          目前英偉達(dá)GPU在算力性能和生態(tài)成熟度上仍具優(yōu)勢,DeepSeek等大模型的技術(shù)迭代短期內(nèi)難以完全脫離其生態(tài)。但長期來看,隨著國產(chǎn)替代的推進(jìn)、算法優(yōu)化能力的提升,以及行業(yè)對供應(yīng)鏈安全的重視,將逐步降低單一依賴風(fēng)險(xiǎn)。

          “這一過程需要時(shí)間和技術(shù)積累,但已是不可逆的趨勢。未來的算力底座更可能呈現(xiàn)‘多元共存’的形態(tài),而非某一廠商的絕對主導(dǎo)。”王華表示。

          舉報(bào)
          第一財(cái)經(jīng)廣告合作,請點(diǎn)擊這里
          此內(nèi)容為第一財(cái)經(jīng)原創(chuàng),著作權(quán)歸第一財(cái)經(jīng)所有。未經(jīng)第一財(cái)經(jīng)書面授權(quán),不得以任何方式加以使用,包括轉(zhuǎn)載、摘編、復(fù)制或建立鏡像。第一財(cái)經(jīng)保留追究侵權(quán)者法律責(zé)任的權(quán)利。
          如需獲得授權(quán)請聯(lián)系第一財(cái)經(jīng)版權(quán)部:banquan@yicai.com

          文章作者

          相關(guān)閱讀

          人的智能與機(jī)器智能

          向老師學(xué)習(xí),老師的智能就是天花板;向自然學(xué)習(xí),就可以突破人類智能的極限。所以AI的優(yōu)勢在可擴(kuò)展性,它發(fā)展的絕對瓶頸常在數(shù)據(jù)和能源。

          358 03-26 20:57

          AI真的有幻覺?會(huì)胡編嗎?

          怎么才能用好如今“百模大戰(zhàn)”之下各種層出不窮的AI模型?關(guān)鍵就是要分清楚它們所處的層次,以匹配你想達(dá)到的目的。

          194 03-21 10:27

          AI熱潮與互聯(lián)網(wǎng)泡沫——跨越25年的對比與啟示

          英偉達(dá)在2025年1月27日經(jīng)歷了單日最大跌幅達(dá)17%,市值蒸發(fā)約6000億美元,創(chuàng)下美國股市歷史紀(jì)錄,主因是中國企業(yè)DeepSeek發(fā)布的低成本、開源大模型DeepSeek-R1。

          429 03-19 10:01

          從虧1.9億到賺5.9億,美圖創(chuàng)始人稱 AI讓美圖“重生”

          DeepSeek帶來行業(yè)共識,未來AI應(yīng)用的競爭會(huì)尤其激烈。

          172 03-19 09:39

          大企業(yè)初煉大模型,數(shù)據(jù)是“攔路虎” | 海斌訪談

          隨著DeepSeek免費(fèi)開源崛起,數(shù)據(jù)問題成為阻礙大模型落地進(jìn)程新的攔路虎。很多央企國等大型企業(yè)業(yè)務(wù)數(shù)據(jù)分散且格式多樣,需解決非結(jié)構(gòu)化數(shù)據(jù)的清洗、標(biāo)注和知識化問題。

          115 03-17 21:22
          一財(cái)最熱
          點(diǎn)擊關(guān)閉