分享到微信打開(kāi)微信,點(diǎn)擊底部的“發(fā)現(xiàn)”, |
第一財(cái)經(jīng) 2025-03-02 21:40:18 聽(tīng)新聞
作者:程實(shí) ? 徐婕 責(zé)編:任紹敏
DeepSeek的出現(xiàn),不僅為AI的發(fā)展提供了更多技術(shù)路徑的選擇,也為行業(yè)應(yīng)用的多樣化奠定了基礎(chǔ),使人工智能走出了“規(guī)模至上”,擺脫了過(guò)去單一路徑的局限,進(jìn)而拓展了邁向更廣闊空間的可能性。這一變革的意義,恰好可以從杰文斯悖論(Jevons Paradox)的視角加以審視。
杰文斯悖論通常用于描述技術(shù)進(jìn)步提升資源利用效率后,資源消耗量非但未減少,反而進(jìn)一步增長(zhǎng)的現(xiàn)象,其核心邏輯在于需求的價(jià)格彈性。在AI訓(xùn)練、科學(xué)計(jì)算等高彈性場(chǎng)景,算力需求的指數(shù)級(jí)增長(zhǎng)似乎符合這一邏輯。然而,DeepSeek的發(fā)展表明,算力市場(chǎng)的增長(zhǎng)并非無(wú)約束擴(kuò)張,而是受到多重因素的影響。市場(chǎng)分化、數(shù)據(jù)獲取限制、技術(shù)瓶頸以及邊際收益遞減,使得算力市場(chǎng)難以完全復(fù)制工業(yè)時(shí)代煤炭消耗模式。尤其是在AI應(yīng)用從“超大規(guī)模訓(xùn)練”向“高效推理”演進(jìn)的過(guò)程中,單純依賴(lài)算力擴(kuò)張已難以滿足現(xiàn)實(shí)需求。
正因如此,DeepSeek等創(chuàng)新路徑的出現(xiàn),使得多模態(tài)、多場(chǎng)景、多終端的互動(dòng)成為可能,推動(dòng)算力能力進(jìn)一步從“云端推理”向“端側(cè)智能”拓展。未來(lái)的算力增長(zhǎng),或許不再是簡(jiǎn)單的“算力堆砌”,而是依賴(lài)底層模型與上層應(yīng)用的協(xié)同創(chuàng)新,以更高效、更智能的方式實(shí)現(xiàn)AI技術(shù)的躍遷。
算力增長(zhǎng)的內(nèi)在邏輯:模型邊界的階梯式突破與應(yīng)用場(chǎng)景的不斷演進(jìn)
在人工智能發(fā)展的浪潮中,底層模型的邊界正逐漸顯現(xiàn)。盡管近幾年大模型的規(guī)模持續(xù)擴(kuò)張,無(wú)論是文本生成、圖像理解,還是跨模態(tài)能力的拓展,底層模型的發(fā)展始終存在物理和理論上的邊界。這些邊界不僅緣于算力和數(shù)據(jù)的限制,更涉及認(rèn)知能力、泛化性、安全性等多方面的挑戰(zhàn)。換句話說(shuō),算力的提升固然為底層模型的進(jìn)化提供了可能,但并不意味著模型的邊界可以無(wú)限擴(kuò)張,而是受到諸多因素的制約。
算力的增長(zhǎng)并非簡(jiǎn)單的線性積累,而是階梯式突破邊界,并推動(dòng)其在現(xiàn)實(shí)場(chǎng)景中的應(yīng)用落地。每一階段算力的提升,都會(huì)伴隨著底層模型能力的躍升,同時(shí)也意味著上一階段模型的邊界被突破,催生出更廣泛的應(yīng)用場(chǎng)景。例如,在早期的AI時(shí)代,算力的限制使得神經(jīng)網(wǎng)絡(luò)難以訓(xùn)練深層次的特征,直到GPU和TPU等專(zhuān)用芯片的發(fā)展,使得深度學(xué)習(xí)模型在計(jì)算機(jī)視覺(jué)、自然語(yǔ)言處理等領(lǐng)域展現(xiàn)出前所未有的能力,在GPT-4及之后的版本中,算力的提升不僅提升了語(yǔ)言理解和生成能力,還逐步拓展了AI的推理能力、多模態(tài)能力和交互能力。大規(guī)模算力的投入使得長(zhǎng)文本生成、邏輯推理、多輪對(duì)話成為可能。然而,算力需求的持續(xù)增長(zhǎng),并不能僅依賴(lài)于底層模型參數(shù)規(guī)模的無(wú)序擴(kuò)張,而需要建立在應(yīng)用場(chǎng)景的開(kāi)發(fā)。換句話說(shuō),算力的增長(zhǎng)不能僅依賴(lài)“更大模型”,而需要明確的應(yīng)用支撐,尤其是在應(yīng)用場(chǎng)景的拓展與交互方式的創(chuàng)新上。
一方面,應(yīng)用場(chǎng)景演進(jìn)的軟性需求在于同質(zhì)性場(chǎng)景的挖掘。這些場(chǎng)景不僅有較高的算力需求,同時(shí)也能夠大規(guī)模復(fù)用已有的模型能力,從而提高算力投資的回報(bào)率。例如,AI在企業(yè)級(jí)應(yīng)用中的普及,使得從客服自動(dòng)化到市場(chǎng)分析,AI的通用能力可以被反復(fù)利用,從而促進(jìn)更廣泛的算力需求增長(zhǎng)。另一方面,應(yīng)用場(chǎng)景演進(jìn)的硬性輔助在于交互能力的升級(jí)。前期,AI應(yīng)用以文本交互、屏幕顯示為主,再到語(yǔ)音助手的出現(xiàn),現(xiàn)已向智能穿戴設(shè)備(如智能眼鏡)等更加沉浸式的交互方式演進(jìn)。而這些新型交互方式將大幅提升算力需求,因?yàn)樗鼈兩婕案鼜?fù)雜的實(shí)時(shí)計(jì)算、低延遲推理、多模態(tài)融合等技術(shù)要求。
杰文斯悖論的前提假設(shè):算力需求的價(jià)格彈性
杰文斯悖論的核心在于,技術(shù)進(jìn)步所帶來(lái)的資源利用效率提升并不會(huì)減少資源消耗,反而會(huì)導(dǎo)致資源總消耗量的上升。這一現(xiàn)象的邏輯基礎(chǔ)在于需求對(duì)價(jià)格的高度彈性——即當(dāng)某種資源的獲取成本下降時(shí),市場(chǎng)需求的增長(zhǎng)幅度足以抵消技術(shù)進(jìn)步帶來(lái)的節(jié)約效應(yīng)。例如,在19世紀(jì)的英國(guó),蒸汽機(jī)技術(shù)的革新大幅提高了煤炭的燃燒效率,然而,這并未減少煤炭的使用量,反而因工業(yè)規(guī)模擴(kuò)大,推動(dòng)了煤炭需求的急劇上升。類(lèi)似的現(xiàn)象在能源、交通、制造等多個(gè)領(lǐng)域?qū)乙?jiàn)不鮮,成為經(jīng)濟(jì)學(xué)中一個(gè)廣為討論的悖論。
當(dāng)這一理論被應(yīng)用到算力領(lǐng)域時(shí),形成了一個(gè)類(lèi)似的假設(shè)——隨著芯片制造工藝的提升、云計(jì)算的普及以及并行計(jì)算架構(gòu)的優(yōu)化,算力的成本正在持續(xù)下降,理論上,這一趨勢(shì)將刺激更大規(guī)模的算力消耗,進(jìn)而形成“越便宜,越擴(kuò)張”的循環(huán)。例如,近年來(lái)GPU和專(zhuān)用AI加速器(如TPU、Trainium等)的計(jì)算能力不斷提升,單位算力成本大幅降低,而市場(chǎng)上對(duì)AI訓(xùn)練、大規(guī)模模擬計(jì)算、高性能計(jì)算等需求仍在加速增長(zhǎng),表面上看,這一現(xiàn)象似乎印證了杰文斯悖論的存在。
然而,這一悖論能否成立的關(guān)鍵在于,算力需求是否具有足夠的價(jià)格彈性。換言之,如果單位算力的價(jià)格下降,需求必須以足夠快的速度增長(zhǎng),才能抵消單位效率提升所帶來(lái)的節(jié)約效應(yīng)。而現(xiàn)實(shí)情況并非如此簡(jiǎn)單。算力需求的增長(zhǎng)不僅受價(jià)格驅(qū)動(dòng),還受到數(shù)據(jù)可得性、算法復(fù)雜度、行業(yè)適配度等多重因素的制約。例如,GPT-4的訓(xùn)練成本相較于前代GPT-3有所下降,但并未因此導(dǎo)致大規(guī)模企業(yè)和研究機(jī)構(gòu)全面復(fù)制同類(lèi)模型。核心原因在于,AI訓(xùn)練的隱性成本并不只是算力成本,還包括數(shù)據(jù)收集、算法優(yōu)化、工程調(diào)優(yōu)、模型部署等多個(gè)環(huán)節(jié),這些環(huán)節(jié)的成本仍然構(gòu)成企業(yè)使用AI技術(shù)的剛性約束。因此,僅僅依賴(lài)算力成本的下降,并不足以推動(dòng)所有行業(yè)全面進(jìn)入“算力消費(fèi)爆炸”的階段。
算力市場(chǎng)的現(xiàn)實(shí)困境:需求彈性的非對(duì)稱(chēng)性
從實(shí)際市場(chǎng)表現(xiàn)來(lái)看,算力需求的價(jià)格彈性呈現(xiàn)出顯著的非對(duì)稱(chēng)性,不同市場(chǎng)主體的反應(yīng)存在較大分化。一方面,頭部科技公司因業(yè)務(wù)剛需,持續(xù)擴(kuò)大算力投入,例如OpenAI等公司都在推動(dòng)AI模型參數(shù)規(guī)模的快速增長(zhǎng)。這些科技巨頭在人工智能競(jìng)賽中不遺余力地構(gòu)建大規(guī)模數(shù)據(jù)中心和專(zhuān)有計(jì)算集群,以支持更強(qiáng)大的模型訓(xùn)練和推理任務(wù)。近年來(lái),大型預(yù)訓(xùn)練模型的規(guī)模擴(kuò)張極為迅速,從GPT-2(15億參數(shù))發(fā)展到GPT-3(1750億參數(shù)),再到GPT-4上萬(wàn)億參數(shù),這一趨勢(shì)推動(dòng)了全球AI算力需求的飆升,然而,并非所有市場(chǎng)主體都呈現(xiàn)這一現(xiàn)象。
首先,模型參數(shù)數(shù)量并不能無(wú)約束地?cái)U(kuò)張,同時(shí)DeepSeek的發(fā)展也表明,在提升模型性能方面,參數(shù)數(shù)量的增加并非唯一途徑。通過(guò)引入創(chuàng)新的架構(gòu)和訓(xùn)練方法,DeepSeek實(shí)現(xiàn)了高效的計(jì)算和卓越的性能。其次,對(duì)于普通企業(yè)和個(gè)人開(kāi)發(fā)者而言,算力需求的增長(zhǎng)受到諸多限制。
盡管云計(jì)算服務(wù)的價(jià)格不斷下降,但許多企業(yè)的AI應(yīng)用比例仍未大幅提升。主要原因在于,除了算力成本外,AI應(yīng)用還受到以下現(xiàn)實(shí)因素的制約。一是數(shù)據(jù)治理的范式困境。AI模型的訓(xùn)練依賴(lài)于大量高質(zhì)量數(shù)據(jù),而數(shù)據(jù)獲取的成本和合規(guī)風(fēng)險(xiǎn)在許多行業(yè)都極為嚴(yán)峻。例如,醫(yī)療、金融等領(lǐng)域的數(shù)據(jù)合規(guī)要求嚴(yán)格,導(dǎo)致許多企業(yè)難以利用公共算力資源進(jìn)行AI訓(xùn)練。二是技術(shù)躍遷的生態(tài)壁壘。并非所有企業(yè)都具備深度學(xué)習(xí)的專(zhuān)業(yè)能力,許多中小企業(yè)難以建立高效的AI開(kāi)發(fā)流程,即便算力成本下降,也無(wú)法有效利用這些資源。三是創(chuàng)新周期的效益拐點(diǎn)。AI模型的參數(shù)規(guī)模達(dá)到一定閾值后,算力投入的邊際收益遞減。例如,GPT-4相比GPT-3的算力需求增長(zhǎng)了近100倍,但在許多應(yīng)用場(chǎng)景中的用戶體驗(yàn)提升并未達(dá)到相同比例的增長(zhǎng)。這意味著,在超大規(guī)模算力場(chǎng)景下,價(jià)格彈性可能已逼近臨界點(diǎn)。因此,在未來(lái)的算力革命中,技術(shù)創(chuàng)新的重心可能不再是單純擴(kuò)展計(jì)算能力,而是提升算力利用效率。需求彈性也將從“野蠻擴(kuò)張”步入“理性收斂”的新階段,算力市場(chǎng)的發(fā)展邏輯或?qū)l(fā)生深刻變革。
(程實(shí)系工銀國(guó)際首席經(jīng)濟(jì)學(xué)家,徐婕系工銀國(guó)際經(jīng)濟(jì)學(xué)家)
在這場(chǎng)沒(méi)有宏大敘事的變革里,每個(gè)參與者都在盡可能觸摸AI應(yīng)用新的形狀。
安徽省率先在全國(guó)省級(jí)層面完成DeepSeek滿血版(671B)本地化部署,推出無(wú)差別綜窗、公文寫(xiě)作、語(yǔ)音轉(zhuǎn)文字等16個(gè)典型應(yīng)用,并在全省試用推廣。
黨的二十屆三中全會(huì)和今年政府工作報(bào)告強(qiáng)調(diào)了加快數(shù)字經(jīng)濟(jì)發(fā)展體制機(jī)制建設(shè)和完善數(shù)據(jù)要素市場(chǎng)制度規(guī)則的重要性,旨在通過(guò)深化市場(chǎng)化改革,推動(dòng)全國(guó)一體化數(shù)據(jù)市場(chǎng)建設(shè),以激發(fā)企業(yè)創(chuàng)新活力,促進(jìn)數(shù)據(jù)要素的有效流通和價(jià)值實(shí)現(xiàn),進(jìn)而賦能高質(zhì)量發(fā)展和促進(jìn)國(guó)內(nèi)國(guó)際“雙循環(huán)”。
DeepSeek最高日賺346萬(wàn)元?官方稱(chēng)理論收益并非實(shí)際;清華大學(xué)2025年將適度擴(kuò)招本科生,重點(diǎn)培養(yǎng)“AI+”拔尖創(chuàng)新人才。