分享到微信打開微信,點擊底部的“發(fā)現(xiàn)”, |
“AI下半場的競爭又回到了傳統(tǒng)的系統(tǒng)領(lǐng)域”,2月26日,阿里云智能集團副總裁、數(shù)據(jù)庫產(chǎn)品事業(yè)部負責人李飛飛在2025阿里云PolarDB開發(fā)者大會上談到對DeepSeek近日開源周相關(guān)發(fā)布的看法,他認為,隨著DeepSeek的火爆,一個背后趨勢是,AI的下半場競爭又回到了傳統(tǒng)的系統(tǒng)領(lǐng)域,是分布式系統(tǒng)工程的事情。
“AI的第一波浪潮來自于做模型、算法、Transformer等機制的研究,但當AI進入下半場,大家會發(fā)現(xiàn)在模型的算法和框架上實際沒有太大的創(chuàng)新和突破,大的模型框架算法過去兩年沒有大的變化。如今花昂貴的錢去招一個很懂算法的人所帶來的收益可能不如去招一幫干數(shù)據(jù)庫、分布式系統(tǒng)干了很多年的人。”李飛飛表示。
對于DeepSeek開源周的相關(guān)發(fā)布,他分析,DeepSeek的一系列優(yōu)化包括FlashMLA的分段配置等,是把Linux、OS、Kernel里的思路放在GPU的緩存上又去實現(xiàn)了一遍。這些東西在數(shù)據(jù)庫系統(tǒng)里已經(jīng)實現(xiàn)了很多年,只不過今天在GPU的新的硬件框架上,DeepSeek的創(chuàng)新產(chǎn)生巨大的價值,它可能帶來的是硬件結(jié)構(gòu)的巨大變化。
2月26日上午,阿里云PolarDB預發(fā)布了新的CXL機型,李飛飛表示,它是在公共云的資源池上去不斷做軟硬結(jié)合的創(chuàng)新,來更好地實現(xiàn)內(nèi)存解耦、數(shù)據(jù)共享,降低TCO(總體擁有成本)。阿里云宣布,阿里云 PolarDB 云原生數(shù)據(jù)庫以每分鐘 20.55 億筆交易(tpmC)和單位成本 0.8 元人民幣(price / tpmC)的成績刷新 TPC-C 性能和性價比雙榜的世界紀錄,登頂全球數(shù)據(jù)庫性能及性價比排行榜。
“一定要做軟硬協(xié)同、上下協(xié)同的創(chuàng)新,DeepSeek證明了這一點,阿里云PolarDB 的突破也證明了這一點。”在李飛飛看來,任何系統(tǒng)再往前演進,都有這樣的必然趨勢。
此外,李飛飛還預測,未來,大模型預訓練一定是中心化和寡頭化的,全世界可能只有幾家。尤其是目前還沒看到世界任何一家大模型商業(yè)模式實現(xiàn)閉環(huán)的情況下,這就是一個燒錢的無底洞,除非有一天它突破了AGI的門檻,自己成為印鈔機。但DeepSeek橫空出世讓開源模型具備了復雜的邏輯推理能力,同時帶來推理成本的大幅下降。目前,阿里云正在GPU加CPU的異構(gòu)資源池上做優(yōu)化,未來,數(shù)據(jù)庫要研發(fā)的關(guān)鍵能力也是要將昂貴的GPU盡可能地省下來做最珍貴的計算和緩存,將次要的計算和緩存推到CPU加內(nèi)存和存儲的三層池化中,讓在線推理變得更低成本。
“買菜無需豪華車”,大模型落地前廠商需要考慮成本和性能的平衡。
向老師學習,老師的智能就是天花板;向自然學習,就可以突破人類智能的極限。所以AI的優(yōu)勢在可擴展性,它發(fā)展的絕對瓶頸常在數(shù)據(jù)和能源。
怎么才能用好如今“百模大戰(zhàn)”之下各種層出不窮的AI模型?關(guān)鍵就是要分清楚它們所處的層次,以匹配你想達到的目的。
DeepSeek帶來行業(yè)共識,未來AI應用的競爭會尤其激烈。
隨著DeepSeek免費開源崛起,數(shù)據(jù)問題成為阻礙大模型落地進程新的攔路虎。很多央企國等大型企業(yè)業(yè)務數(shù)據(jù)分散且格式多樣,需解決非結(jié)構(gòu)化數(shù)據(jù)的清洗、標注和知識化問題。