分享到微信打開(kāi)微信,點(diǎn)擊底部的“發(fā)現(xiàn)”, |
第一財(cái)經(jīng) 2025-04-10 16:56:00 聽(tīng)新聞
作者:鄭栩彤 責(zé)編:李娜
當(dāng)?shù)貢r(shí)間4月9日,谷歌發(fā)布第七代TPU(Tensor Processing Unit,張量處理器),并稱(chēng)該芯片是谷歌目前功能最強(qiáng)大的TPU,且是谷歌首款面向AI推理時(shí)代的TPU。這款芯片名為“Ironwood”,單芯片峰值算力可達(dá)4614 TFLOPs。
谷歌這款新芯片的特點(diǎn)還包括節(jié)能。相比通用的GPU(圖形處理器),TPU等ASIC(專(zhuān)用集成電路)的特點(diǎn)就包括較低功耗。除了TPU,還有其他芯片希望憑借較低功耗等特點(diǎn)搶占AI芯片市場(chǎng),非GPU陣營(yíng)頗為活躍。
谷歌TPU迭代
谷歌在“Google Cloud Next 25”大會(huì)上推出了第七代TPU。“它專(zhuān)為大規(guī)模思考、推理AI模型設(shè)計(jì),是谷歌迄今為止最節(jié)能的TPU。”谷歌表示。Ironwood可擴(kuò)展至9216片芯片集群,性能是第六代TPU Trillium的2倍,能效則比2018年谷歌第一款Cloud TPU高出近30倍。
這款新TPU在內(nèi)存帶寬等方面有所改善,加快了數(shù)據(jù)訪(fǎng)問(wèn)速度。每顆Ironwood芯片的HBM(高帶寬內(nèi)存)容量為192GB,是Trillium的2倍。HBM帶寬也有所提升,單顆Ironwood芯片的內(nèi)存帶寬達(dá)7.2Tbps,是Trillium的4.5倍。Ironwood芯片間互聯(lián)(ICI)帶寬則為1.2Tbps,是Trillium的1.5倍。
谷歌的TPU用于公司內(nèi)部工作負(fù)載,不對(duì)外出售芯片,但谷歌自研的TPU部署量已經(jīng)不小。據(jù)市場(chǎng)研究機(jī)構(gòu)TechInsights數(shù)據(jù),谷歌早在2023年就成為全球第三大數(shù)據(jù)中心處理器設(shè)計(jì)公司,位列CPU霸主英特爾和GPU霸主英偉達(dá)之后。
依托于自研芯片,谷歌在當(dāng)?shù)貢r(shí)間周三重申了今年的資本支出計(jì)劃。谷歌計(jì)劃今年斥資約750億美元建設(shè)數(shù)據(jù)中心,押注生成式AI,這筆投資將用于構(gòu)建改善谷歌核心資產(chǎn)所需的芯片和服務(wù)器,并支持Gemini等AI服務(wù)的開(kāi)發(fā)。
一般來(lái)說(shuō),ASIC芯片的通用性比GPU弱,但適用于高效執(zhí)行特定范圍的功能,能耗和成本可以做到更低,業(yè)界分析人士認(rèn)為這類(lèi)芯片適合用于A(yíng)I推理。
隨著AI應(yīng)用逐漸鋪開(kāi),推理所需的AI芯片需求也有望增加。作為數(shù)據(jù)中心供應(yīng)鏈上的廠(chǎng)商,鎧俠株式會(huì)社首席技術(shù)執(zhí)行官柳茂知告訴記者,市面上出現(xiàn)各種AI服務(wù)器,此前以訓(xùn)練型、學(xué)習(xí)型服務(wù)器為主,近段時(shí)間受DeepSeek等AI模型推動(dòng),出現(xiàn)越來(lái)越多推理型服務(wù)器。
除了谷歌TPU,其他云廠(chǎng)商也在自研這類(lèi)能耗較低的ASIC芯片,例如亞馬遜旗下有Trainium系列芯片,Meta有專(zhuān)為AI訓(xùn)練和推理設(shè)計(jì)的MTIA,微軟有Azure Maia。
非GPU陣營(yíng)活躍起來(lái)
除了ASIC芯片,其他新架構(gòu)芯片也在迎合AI服務(wù)的靈活、低功耗需求,試圖在A(yíng)I時(shí)代分一杯羹。
采用RISC-V指令集架構(gòu)的芯片也具備較低功耗的特點(diǎn),且該指令集開(kāi)源,目前RISC-V廠(chǎng)商也瞄準(zhǔn)了AI服務(wù)的需求。3月,阿里達(dá)摩院的玄鐵最高性能處理器C930開(kāi)啟交付,面向服務(wù)器級(jí)別高性能應(yīng)用場(chǎng)景。這是一款CPU芯片,核內(nèi)AI算力相比前代有所提升,采用RISC-V精簡(jiǎn)指令集,而非x86、ARM這兩種目前被廣泛使用的指令集。同月,睿思芯科也推出一款高性能RISC-V服務(wù)器芯片,面向智算場(chǎng)景。
“AI推理產(chǎn)生的算力需求將指數(shù)級(jí)增長(zhǎng),近期各行各業(yè)本地化部署DeepSeek,產(chǎn)生巨大的算力需求,導(dǎo)致很多智算中心算力供不應(yīng)求,RISC-V芯片能憑借低功耗和靈活定制的優(yōu)勢(shì)改變這個(gè)現(xiàn)狀。” 在近日中科創(chuàng)星發(fā)起的好望角科學(xué)沙龍上,中國(guó)科學(xué)院計(jì)算技術(shù)研究所副所長(zhǎng)、研究員包云崗表示。
芯片廠(chǎng)商奇異摩爾相關(guān)負(fù)責(zé)人告訴記者,RISC-V架構(gòu)具有開(kāi)放性和可定制性,其開(kāi)源和模塊化特性允許開(kāi)發(fā)者根據(jù)特定AI應(yīng)用的需求定制指令集,從而優(yōu)化性能和功耗。AI推理產(chǎn)生算力需求,使RISC-V在A(yíng)I領(lǐng)域變得更加重要。
作為一種年輕的指令集架構(gòu),加州大學(xué)伯克利分校的研究團(tuán)隊(duì)2010年才首次發(fā)布RISC-V。另外兩種主流指令集x86和ARM都較為封閉,x86基本不對(duì)外授權(quán),企業(yè)要使用ARM架構(gòu)需向其所屬公司支付授權(quán)使用費(fèi),RISC-V的路徑則是開(kāi)源免費(fèi)。但相比x86和ARM生態(tài)的成熟,RISC-V生態(tài)仍在完善過(guò)程中。此前RISC-V多應(yīng)用于物聯(lián)網(wǎng)領(lǐng)域,目前則在探索應(yīng)用于高性能計(jì)算,例如用于A(yíng)I服務(wù)。
包云崗表示,國(guó)內(nèi)香山高性能處理器核IP、玄鐵C930服務(wù)器芯片等推出,驗(yàn)證了RISC-V在高性能計(jì)算領(lǐng)域的可行性。市場(chǎng)研究機(jī)構(gòu)Omdia預(yù)計(jì),AI將對(duì)該架構(gòu)芯片擴(kuò)大應(yīng)用有所助力,2030年基于RISC-V的AI處理器出貨量將超過(guò)5億顆。
RISC-V的研究熱度也有所升溫。近日東壁科技發(fā)布的相關(guān)報(bào)告顯示,RISC-V領(lǐng)域研究自2019年起進(jìn)入快速增長(zhǎng)期,2022年進(jìn)一步升溫,目前該領(lǐng)域的研究進(jìn)入穩(wěn)定增長(zhǎng)階段。RISC-V領(lǐng)域的研究熱點(diǎn)就包括人工智能與機(jī)器學(xué)習(xí)、物聯(lián)網(wǎng)與邊緣計(jì)算、拓展高性能計(jì)算應(yīng)用等。國(guó)內(nèi)學(xué)者發(fā)布的RISC-V相關(guān)論文數(shù)已超300篇。
不過(guò),包云崗也指出,RISC-V在應(yīng)用中還需攻克“三座大山”,分別是工具鏈短板、標(biāo)桿案例缺失和人才缺口,尤其是人才缺口。目前該領(lǐng)域從芯片設(shè)計(jì)、驗(yàn)證、解決方案、技術(shù)支持等各個(gè)層次的人才均不足。
a16z擬募資200億美元基金投向人工智能領(lǐng)域;王小川反思百川智能此前戰(zhàn)線(xiàn)拉得太長(zhǎng)。
特朗普關(guān)稅政策正在推高數(shù)據(jù)中心建設(shè)成本,阻礙電網(wǎng)升級(jí),并動(dòng)搖企業(yè)的投資信心。
靈羽處理器的發(fā)布,不僅是一項(xiàng)技術(shù)突破,更是一個(gè)從源頭創(chuàng)新到產(chǎn)業(yè)落地的典范,這種從0到1的探索,正是中國(guó)科技突圍的生動(dòng)寫(xiě)照。
“我們的合作伙伴繼續(xù)投資于下一代前沿模型,需要高性能加速器和有更大集群的AI數(shù)據(jù)中心?!辈┩偛眉鍯EO陳福陽(yáng)稱(chēng)。
AI會(huì)不會(huì)叩響處理器架構(gòu)革命的閘門(mén)?