亚洲中文字乱码免费播放,精品国产日韩专区欧美第一页,亚洲中文有码字幕青青,亚洲综合另类专区在线

          首頁 > 新聞 > 評論

          分享到微信

          打開微信,點(diǎn)擊底部的“發(fā)現(xiàn)”,
          使用“掃一掃”即可將網(wǎng)頁分享至朋友圈。

          程實(shí):算力的杰文斯悖論︱?qū)嵲捠澜?jīng)

          第一財(cái)經(jīng) 2025-03-02 21:40:18 聽新聞

          作者:程實(shí) ? 徐婕    責(zé)編:任紹敏

          DeepSeek等創(chuàng)新路徑的出現(xiàn),使得多模態(tài)、多場景、多終端的互動成為可能,推動算力能力進(jìn)一步從“云端推理”向“端側(cè)智能”拓展。

          DeepSeek的出現(xiàn),不僅為AI的發(fā)展提供了更多技術(shù)路徑的選擇,也為行業(yè)應(yīng)用的多樣化奠定了基礎(chǔ),使人工智能走出了“規(guī)模至上”,擺脫了過去單一路徑的局限,進(jìn)而拓展了邁向更廣闊空間的可能性。這一變革的意義,恰好可以從杰文斯悖論(Jevons Paradox)的視角加以審視。

          杰文斯悖論通常用于描述技術(shù)進(jìn)步提升資源利用效率后,資源消耗量非但未減少,反而進(jìn)一步增長的現(xiàn)象,其核心邏輯在于需求的價(jià)格彈性。在AI訓(xùn)練、科學(xué)計(jì)算等高彈性場景,算力需求的指數(shù)級增長似乎符合這一邏輯。然而,DeepSeek的發(fā)展表明,算力市場的增長并非無約束擴(kuò)張,而是受到多重因素的影響。市場分化、數(shù)據(jù)獲取限制、技術(shù)瓶頸以及邊際收益遞減,使得算力市場難以完全復(fù)制工業(yè)時(shí)代煤炭消耗模式。尤其是在AI應(yīng)用從“超大規(guī)模訓(xùn)練”向“高效推理”演進(jìn)的過程中,單純依賴算力擴(kuò)張已難以滿足現(xiàn)實(shí)需求。

          正因如此,DeepSeek等創(chuàng)新路徑的出現(xiàn),使得多模態(tài)、多場景、多終端的互動成為可能,推動算力能力進(jìn)一步從“云端推理”向“端側(cè)智能”拓展。未來的算力增長,或許不再是簡單的“算力堆砌”,而是依賴底層模型與上層應(yīng)用的協(xié)同創(chuàng)新,以更高效、更智能的方式實(shí)現(xiàn)AI技術(shù)的躍遷。

          算力增長的內(nèi)在邏輯:模型邊界的階梯式突破與應(yīng)用場景的不斷演進(jìn)

          在人工智能發(fā)展的浪潮中,底層模型的邊界正逐漸顯現(xiàn)。盡管近幾年大模型的規(guī)模持續(xù)擴(kuò)張,無論是文本生成、圖像理解,還是跨模態(tài)能力的拓展,底層模型的發(fā)展始終存在物理和理論上的邊界。這些邊界不僅緣于算力和數(shù)據(jù)的限制,更涉及認(rèn)知能力、泛化性、安全性等多方面的挑戰(zhàn)。換句話說,算力的提升固然為底層模型的進(jìn)化提供了可能,但并不意味著模型的邊界可以無限擴(kuò)張,而是受到諸多因素的制約。

          算力的增長并非簡單的線性積累,而是階梯式突破邊界,并推動其在現(xiàn)實(shí)場景中的應(yīng)用落地。每一階段算力的提升,都會伴隨著底層模型能力的躍升,同時(shí)也意味著上一階段模型的邊界被突破,催生出更廣泛的應(yīng)用場景。例如,在早期的AI時(shí)代,算力的限制使得神經(jīng)網(wǎng)絡(luò)難以訓(xùn)練深層次的特征,直到GPU和TPU等專用芯片的發(fā)展,使得深度學(xué)習(xí)模型在計(jì)算機(jī)視覺、自然語言處理等領(lǐng)域展現(xiàn)出前所未有的能力,在GPT-4及之后的版本中,算力的提升不僅提升了語言理解和生成能力,還逐步拓展了AI的推理能力、多模態(tài)能力和交互能力。大規(guī)模算力的投入使得長文本生成、邏輯推理、多輪對話成為可能。然而,算力需求的持續(xù)增長,并不能僅依賴于底層模型參數(shù)規(guī)模的無序擴(kuò)張,而需要建立在應(yīng)用場景的開發(fā)。換句話說,算力的增長不能僅依賴“更大模型”,而需要明確的應(yīng)用支撐,尤其是在應(yīng)用場景的拓展與交互方式的創(chuàng)新上。

          一方面,應(yīng)用場景演進(jìn)的軟性需求在于同質(zhì)性場景的挖掘。這些場景不僅有較高的算力需求,同時(shí)也能夠大規(guī)模復(fù)用已有的模型能力,從而提高算力投資的回報(bào)率。例如,AI在企業(yè)級應(yīng)用中的普及,使得從客服自動化到市場分析,AI的通用能力可以被反復(fù)利用,從而促進(jìn)更廣泛的算力需求增長。另一方面,應(yīng)用場景演進(jìn)的硬性輔助在于交互能力的升級。前期,AI應(yīng)用以文本交互、屏幕顯示為主,再到語音助手的出現(xiàn),現(xiàn)已向智能穿戴設(shè)備(如智能眼鏡)等更加沉浸式的交互方式演進(jìn)。而這些新型交互方式將大幅提升算力需求,因?yàn)樗鼈兩婕案鼜?fù)雜的實(shí)時(shí)計(jì)算、低延遲推理、多模態(tài)融合等技術(shù)要求。

          杰文斯悖論的前提假設(shè):算力需求的價(jià)格彈性

          杰文斯悖論的核心在于,技術(shù)進(jìn)步所帶來的資源利用效率提升并不會減少資源消耗,反而會導(dǎo)致資源總消耗量的上升。這一現(xiàn)象的邏輯基礎(chǔ)在于需求對價(jià)格的高度彈性——即當(dāng)某種資源的獲取成本下降時(shí),市場需求的增長幅度足以抵消技術(shù)進(jìn)步帶來的節(jié)約效應(yīng)。例如,在19世紀(jì)的英國,蒸汽機(jī)技術(shù)的革新大幅提高了煤炭的燃燒效率,然而,這并未減少煤炭的使用量,反而因工業(yè)規(guī)模擴(kuò)大,推動了煤炭需求的急劇上升。類似的現(xiàn)象在能源、交通、制造等多個(gè)領(lǐng)域?qū)乙姴货r,成為經(jīng)濟(jì)學(xué)中一個(gè)廣為討論的悖論。

          當(dāng)這一理論被應(yīng)用到算力領(lǐng)域時(shí),形成了一個(gè)類似的假設(shè)——隨著芯片制造工藝的提升、云計(jì)算的普及以及并行計(jì)算架構(gòu)的優(yōu)化,算力的成本正在持續(xù)下降,理論上,這一趨勢將刺激更大規(guī)模的算力消耗,進(jìn)而形成“越便宜,越擴(kuò)張”的循環(huán)。例如,近年來GPU和專用AI加速器(如TPU、Trainium等)的計(jì)算能力不斷提升,單位算力成本大幅降低,而市場上對AI訓(xùn)練、大規(guī)模模擬計(jì)算、高性能計(jì)算等需求仍在加速增長,表面上看,這一現(xiàn)象似乎印證了杰文斯悖論的存在。

          然而,這一悖論能否成立的關(guān)鍵在于,算力需求是否具有足夠的價(jià)格彈性。換言之,如果單位算力的價(jià)格下降,需求必須以足夠快的速度增長,才能抵消單位效率提升所帶來的節(jié)約效應(yīng)。而現(xiàn)實(shí)情況并非如此簡單。算力需求的增長不僅受價(jià)格驅(qū)動,還受到數(shù)據(jù)可得性、算法復(fù)雜度、行業(yè)適配度等多重因素的制約。例如,GPT-4的訓(xùn)練成本相較于前代GPT-3有所下降,但并未因此導(dǎo)致大規(guī)模企業(yè)和研究機(jī)構(gòu)全面復(fù)制同類模型。核心原因在于,AI訓(xùn)練的隱性成本并不只是算力成本,還包括數(shù)據(jù)收集、算法優(yōu)化、工程調(diào)優(yōu)、模型部署等多個(gè)環(huán)節(jié),這些環(huán)節(jié)的成本仍然構(gòu)成企業(yè)使用AI技術(shù)的剛性約束。因此,僅僅依賴算力成本的下降,并不足以推動所有行業(yè)全面進(jìn)入“算力消費(fèi)爆炸”的階段。

          算力市場的現(xiàn)實(shí)困境:需求彈性的非對稱性

          從實(shí)際市場表現(xiàn)來看,算力需求的價(jià)格彈性呈現(xiàn)出顯著的非對稱性,不同市場主體的反應(yīng)存在較大分化。一方面,頭部科技公司因業(yè)務(wù)剛需,持續(xù)擴(kuò)大算力投入,例如OpenAI等公司都在推動AI模型參數(shù)規(guī)模的快速增長。這些科技巨頭在人工智能競賽中不遺余力地構(gòu)建大規(guī)模數(shù)據(jù)中心和專有計(jì)算集群,以支持更強(qiáng)大的模型訓(xùn)練和推理任務(wù)。近年來,大型預(yù)訓(xùn)練模型的規(guī)模擴(kuò)張極為迅速,從GPT-2(15億參數(shù))發(fā)展到GPT-3(1750億參數(shù)),再到GPT-4上萬億參數(shù),這一趨勢推動了全球AI算力需求的飆升,然而,并非所有市場主體都呈現(xiàn)這一現(xiàn)象。

          首先,模型參數(shù)數(shù)量并不能無約束地?cái)U(kuò)張,同時(shí)DeepSeek的發(fā)展也表明,在提升模型性能方面,參數(shù)數(shù)量的增加并非唯一途徑。通過引入創(chuàng)新的架構(gòu)和訓(xùn)練方法,DeepSeek實(shí)現(xiàn)了高效的計(jì)算和卓越的性能。其次,對于普通企業(yè)和個(gè)人開發(fā)者而言,算力需求的增長受到諸多限制。

          盡管云計(jì)算服務(wù)的價(jià)格不斷下降,但許多企業(yè)的AI應(yīng)用比例仍未大幅提升。主要原因在于,除了算力成本外,AI應(yīng)用還受到以下現(xiàn)實(shí)因素的制約。一是數(shù)據(jù)治理的范式困境。AI模型的訓(xùn)練依賴于大量高質(zhì)量數(shù)據(jù),而數(shù)據(jù)獲取的成本和合規(guī)風(fēng)險(xiǎn)在許多行業(yè)都極為嚴(yán)峻。例如,醫(yī)療、金融等領(lǐng)域的數(shù)據(jù)合規(guī)要求嚴(yán)格,導(dǎo)致許多企業(yè)難以利用公共算力資源進(jìn)行AI訓(xùn)練。二是技術(shù)躍遷的生態(tài)壁壘。并非所有企業(yè)都具備深度學(xué)習(xí)的專業(yè)能力,許多中小企業(yè)難以建立高效的AI開發(fā)流程,即便算力成本下降,也無法有效利用這些資源。三是創(chuàng)新周期的效益拐點(diǎn)。AI模型的參數(shù)規(guī)模達(dá)到一定閾值后,算力投入的邊際收益遞減。例如,GPT-4相比GPT-3的算力需求增長了近100倍,但在許多應(yīng)用場景中的用戶體驗(yàn)提升并未達(dá)到相同比例的增長。這意味著,在超大規(guī)模算力場景下,價(jià)格彈性可能已逼近臨界點(diǎn)。因此,在未來的算力革命中,技術(shù)創(chuàng)新的重心可能不再是單純擴(kuò)展計(jì)算能力,而是提升算力利用效率。需求彈性也將從“野蠻擴(kuò)張”步入“理性收斂”的新階段,算力市場的發(fā)展邏輯或?qū)l(fā)生深刻變革。

          (程實(shí)系工銀國際首席經(jīng)濟(jì)學(xué)家,徐婕系工銀國際經(jīng)濟(jì)學(xué)家)

          舉報(bào)

          文章作者

          一財(cái)最熱
          點(diǎn)擊關(guān)閉