亚洲中文字乱码免费播放,精品国产日韩专区欧美第一页,亚洲中文有码字幕青青,亚洲综合另类专区在线

          首頁 > 新聞 > 科技

          分享到微信

          打開微信,點擊底部的“發(fā)現(xiàn)”,
          使用“掃一掃”即可將網頁分享至朋友圈。

          AI算力股下挫,DeepSeek正在打破“算力為王”行業(yè)規(guī)則

          第一財經 2025-01-27 15:34:39 聽新聞

          作者:薛路皓    責編:李娜

          DeepSeek用更少的成本,訓練出了媲美Open AI o1的性能,這對大規(guī)模的AI算力投入提出了質疑

          今天是農歷龍年A股的最后一個交易日,中國AI大模型DeepSeek讓A股的AI算力概念股“嚇出一身冷汗”。

          1月27日開盤后,AI算力芯片、光通信、AI服務器等概念股下挫明顯。AI算力股中,寒武紀股價一度下探近10%,中興通訊下降超6%。光通信方面,中際旭創(chuàng)、天孚通信下挫超10%。AI服務器方面,工業(yè)富聯(lián)降幅超7%。

          消息面上,中國AI大模型DeepSeek成功出圈讓行業(yè)產生了對于“堆算力”“堆投資”邏輯的懷疑。

          AI算力產業(yè)鏈股價下挫明顯

          從股價行情看,多只位于AI算力產業(yè)鏈公司的股價明顯下挫。

          寒武紀是國內AI算力概念的龍頭企業(yè),股價從上一交易日收盤價612.98元/股下降至551.68元/股,降幅一度逼近10%。中興通訊也在自研AI芯片,屬于AI算力概念的頭部企業(yè),股價下探超6%。

          光通信是提升大規(guī)模AI算力運行效率的技術,在提升萬卡,甚至十萬卡規(guī)模的AI智算中心的效率方面發(fā)揮重要作用。目前,A股多家企業(yè),已經向國外頭部AI算力芯片企業(yè)供應光通信產品。中際旭創(chuàng)面向海外頭部算力客戶提供光模塊產品,同時也是國內大客戶的主力供應商。不過,從股價來看,中際旭創(chuàng)股價一度下降超10%。行業(yè)內另一家企業(yè)天孚通信下挫幅度更大,一度下探超11%。

          除上述兩類公司之外,AI服務器廠商股價下跌同樣明顯。近期以來,工業(yè)富聯(lián)在AI服務器業(yè)務和高速網絡設備業(yè)務大舉發(fā)力,成為AI服務器代工業(yè)務的主要廠商之一。據(jù)了解,工業(yè)富聯(lián)的上游是英偉達為代表的AI算力公司,下游是云計算廠商。今日,工業(yè)富聯(lián)的股價降幅超6%。

          據(jù)了解,上述多支股票在此前經歷了股價異動。寒武紀在近期上漲至歷史最高點777.77元/股,中興通訊也一度登上自2024年7月以來的最高股價43.75元/股,天孚通信也經歷了一波上漲行情,并在1月16日漲停。

          DeepSeek利空算力?

          中國AI大模型DeepSeek成功出圈讓行業(yè)產生了對于大規(guī)模AI算力投資邏輯的懷疑。

          作為目前全球AI大模型的領頭羊OpenAI提出Scaling Law,即計算規(guī)模越大,訓練數(shù)據(jù)量越多,模型越智能。Scaling Law則成為了全球AI大模型廠商所信奉的圭臬。這促使英偉達等算力不斷研發(fā)擁有更加強大算力的產品,微軟等云廠商不斷加大對AI算力的資本投入。

          近期,微軟CEO薩蒂亞·納德拉(Satya Nadella)表示,微軟將在2025年投入800億美元建設AI智算中心,以支持AI大模型的開發(fā)和相關服務。現(xiàn)任美國總統(tǒng)特朗普也公布了“星際之門”計劃,旨在未來4年內投入5000億美元,在美國建設AI基礎設施。

          然而,近期中國AI大模型DeepSeek卻讓行業(yè)看到了不同的發(fā)展路徑。DeepSeek是國內大模型公司深度求索開發(fā),深度求索的母公司是一家名為量化幻方的量化金融公司,在2024年12月推出的DeepSeek-V3,并于近期公布了DeepSeek-R1。

          據(jù)了解,DeepSeek-V3完整訓練只需2.788M H800 GPU小時,其訓練成本僅為557萬美元,卻獲得了媲美OpenAI的最先進模型GPT-4o的性能。當時著名人工智能科學家卡帕西(Andrej Karpathy)就發(fā)文表示,這個模型是在一個非常有限的預算下訓練的(2048個GPU運行2個月,花費600萬美元)。 作為參考,這種級別的能力通常需要接近16000個GPU的集群,而今天正在啟動的集群則更接近100000個GPU。例如,Llama 3 405B使用了3080萬GPU小時,而DeepSeek-V3看起來僅使用了280萬GPU小時。

          此外,DeepSeek-R1的訓練成本還未公布。不過,從API定價可看出,定價是GPT o1的三十分之一。按照每輸出一百萬Token的價格來看,DeepSeek-R1為2.19美元,而GPT-o1為60美元??梢哉f,DeepSeek使用Open AI的一小部分的訓練成本,卻達到了和Open類似的性能。據(jù)了解,R1在數(shù)學、編程等測試中的成績和o1相當。

          這也引發(fā)了一種懷疑,要實現(xiàn)更好性能的AI大模型是否需要堆算力,堆投資才能達到?通過軟件架構及算法的革新,可能也是一條通往更高性能AI大模型的思路。

          對于DeepSeek的火爆是否意味著利空AI算力,韋豪創(chuàng)芯合伙人王智告訴第一財經記者:“短期內,在交易情緒的影響下,這起事件會利空AI算力。長期來看,AI算力仍然必不可少,AI大模型的演進,需要更多新的架構和算法,才能實現(xiàn)長足進步,這些需要AI算力的足夠支持。”他補充道:“這些算法和架構還不得而知,但是必然會出現(xiàn)。”

          舉報
          第一財經廣告合作,請點擊這里
          此內容為第一財經原創(chuàng),著作權歸第一財經所有。未經第一財經書面授權,不得以任何方式加以使用,包括轉載、摘編、復制或建立鏡像。第一財經保留追究侵權者法律責任的權利。
          如需獲得授權請聯(lián)系第一財經版權部:banquan@yicai.com

          文章作者

          一財最熱
          點擊關閉