分享到微信打開微信,點(diǎn)擊底部的“發(fā)現(xiàn)”, |
春節(jié)期間,杭州的80后小伙打破了世界科技舞臺上沉默許久的平靜,也給全球資本市場帶來了巨大擾動,特別是對以英偉達(dá)為代表的美股巨頭造成了直接沖擊。這對靠AI產(chǎn)業(yè)支撐的美股來說,無疑是一只黑天鵝。雖然這幾天英偉達(dá)股價有所修復(fù),但巨大的跳空缺口及被打擊的信心何時能夠完全修復(fù)仍需更多時間觀察。對于投資而言,我們需要了解的是,這到底是一次短暫的技術(shù)沖擊,還是一次具有深遠(yuǎn)意義的技術(shù)相變。
我們之前強(qiáng)調(diào)過9·24新政是一次政策相變——貨幣大放水,顯示了頂層經(jīng)濟(jì)思路的改變,也彰顯了維護(hù)資本市場的信心,推動了一次估值水平的整體修復(fù)。新的政策看跌期權(quán)保證了指數(shù)在3200點(diǎn)左右的新中樞開始運(yùn)行,即使再有波動也不會輕易打破那一次的低點(diǎn)。9·24后,科技板塊已經(jīng)取得非常明顯的上漲,科技股估值中樞大幅上移。目前,我們需要考慮的是科技端是否也存在趨勢性提升的可能,DeepSeek是否正在促發(fā)一場革命性、顛覆性的科技領(lǐng)域相變。
一次重大的工程創(chuàng)新
DeepSeek的影響該如何定義?這需要拋開自媒體“國運(yùn)論”與“鬧劇論”簡單的極端論述,客觀地從技術(shù)研究本身進(jìn)行思考。
先談我的結(jié)論,通過這些天較為深入的調(diào)研,目前我對DeepSeek的最新認(rèn)知與我前些天那篇《DeepSeek是國運(yùn)崛起還是一個奇跡》的觀點(diǎn)仍保持一致。雖然不能說DeepSeek是一次偉大的技術(shù)革命,但它確實是一次里程碑式的工程創(chuàng)新,是中國工程師文化內(nèi)核優(yōu)勢的再一次完美體現(xiàn)。
我們可以把技術(shù)革命分為科學(xué)革命和工業(yè)革命兩個過程去看。人工智能也一樣。人工智能差不多從上世紀(jì)60年代就已經(jīng)正式開始,如果從圖靈提出相關(guān)概念開始算起,時間會更早。真正讓AI被大家所認(rèn)知的是微軟的AlphaGo,與GPT相似他們都采用了強(qiáng)化學(xué)習(xí)(RL)方式,通過大量實際交互在與高手過招的過程中進(jìn)行學(xué)習(xí)。AlphaGo的厲害之處在于它并非完全基于過去的預(yù)訓(xùn)練,而是依靠記憶能力不斷學(xué)習(xí)和強(qiáng)化,是人工智能革命中一次重要的技術(shù)里程碑。
汽車不是中國發(fā)明的,但今天的中國是汽車第一生產(chǎn)大國,新能源汽車的核心技術(shù)也不是中國發(fā)明的,但中國現(xiàn)在的新能源車可以橫掃全球。歐洲中世紀(jì)的圣經(jīng)抄寫工作非常昂貴,而中國的活字印刷術(shù)傳到歐洲后,使得圣經(jīng)變得非常便宜且迅速流行,讓每個人都可以閱讀。知識不再被壟斷,人的價值就被凸顯出來,這直接導(dǎo)致了歐洲的宗教革命、科學(xué)革命和文藝啟蒙等一系列變革,也就是所謂的啟蒙運(yùn)動。真正讓美國人能開得起汽車的是福特流水線,它使流程優(yōu)化、成本降低。究竟是發(fā)明汽車的科學(xué)家偉大,還是讓每個人都開上汽車的工程師偉大?
人工智能也是如此,如果沒有DeepSeek的出現(xiàn),那我們距離大模型應(yīng)用的平民化就還有很長一段距離。許多海外公司,包括硅谷工程師甚至海外傳統(tǒng)的不友好媒體,對DeepSeek的評價都很高,有的甚至贊不絕口。可以說這是一次重大的工程改造,甚至可以認(rèn)為是人工智能領(lǐng)域的一次工業(yè)革命。
從DeepSeek崛起看AI發(fā)展趨勢
2017年,Google推出了一個專門從事機(jī)器翻譯的架構(gòu)模型,它引入了自注意力機(jī)制,能夠更高效地捕捉序列數(shù)據(jù)中的長距離依賴關(guān)系,而且支持并行計算,大大提高了訓(xùn)練和推理的速度,這就是Transformer架構(gòu)。依靠這一優(yōu)勢特點(diǎn),Transformer迅速擴(kuò)展到自然語言處理的其他領(lǐng)域,并逐漸成為大語言模型處理的主流架構(gòu),從實質(zhì)上推動了生成式人工智能的發(fā)展。
人工智能的本質(zhì)是數(shù)學(xué)與物理的運(yùn)用問題,是在電力革命和芯片革命等物理學(xué)革命的基礎(chǔ)上逐漸實現(xiàn)的,而模型的工作原理并不難,是非常典型的數(shù)學(xué)應(yīng)用問題,主要運(yùn)用三個數(shù)學(xué)理論,即線性代數(shù),統(tǒng)計學(xué)與微積分。首先運(yùn)用線性代數(shù)將文字轉(zhuǎn)化為數(shù)字向量,之后使用語言統(tǒng)計學(xué)將文字形成一串?dāng)?shù)字編碼,并進(jìn)行回歸運(yùn)算。人工智能通過海量的數(shù)據(jù)運(yùn)算,利用空間的廣度實現(xiàn)無限可能,如果時間足夠長,空間足夠大,就可能演化出各種運(yùn)算結(jié)果。
硅谷的數(shù)學(xué)家和物理學(xué)家是一批有理想的知識精英,他們引領(lǐng)了這場技術(shù)革命。然而,他們往往忽視工程學(xué)問題,比如如何節(jié)約成本和提高效率。DeepSeek的厲害之處就在于它用Fp8,也就是8位二進(jìn)制數(shù)值的浮點(diǎn)計算能力,解決了國外Fp32運(yùn)算能力所能實現(xiàn)的工作,讓硅谷高傲的精英模型突然變成了“拼多多”,讓更多普通大眾能夠用得起AI。但在追求星辰大海的硅谷科學(xué)家來看,對比先進(jìn)的Fp32浮點(diǎn)格式,使用Fp8是一種倒退,即使Fp8可以大幅降低成本。DeepSeek在訓(xùn)練端和推理端都進(jìn)行了重大的工程優(yōu)化,特別是蒸餾技術(shù)的應(yīng)用。
硅谷科學(xué)家往往專注于前沿技術(shù)的開發(fā),在要錢有錢、要芯片有芯片的優(yōu)渥環(huán)境中,容易忽視成本的問題。但高端芯片價格高昂,大模型訓(xùn)練成本巨大,普通人難以參與。這種分化導(dǎo)致了技術(shù)門檻越來越高,只有少數(shù)人能夠引領(lǐng)技術(shù)發(fā)展。而且隨著歷史可用數(shù)據(jù)的不斷消耗,以及訓(xùn)練成本越來越高,模型預(yù)訓(xùn)練效果難以持續(xù)提升,預(yù)訓(xùn)練時代也可能結(jié)束。所以有的公司開始探索新的訓(xùn)練方法,比如強(qiáng)化學(xué)習(xí)和監(jiān)督微調(diào),以減少對預(yù)訓(xùn)練的依賴,從而在降低成本的同時提高模型效率。還有一些公司采用混合專家模式和多頭注意力機(jī)制,進(jìn)一步優(yōu)化推理過程。通過這種方式,模型可以在推理時只調(diào)用必要的參數(shù),從而節(jié)省大量算力。新技術(shù)的應(yīng)用可能會帶來一場新的工業(yè)革命,推動全球技術(shù)生態(tài)的發(fā)展。
我認(rèn)為這場技術(shù)革命不僅會改變科技行業(yè),還會對整個社會產(chǎn)生深遠(yuǎn)影響。成本的降低可能會使更多人能夠使用這些技術(shù),推動工業(yè)化制造能力的提升和人類認(rèn)知平權(quán)事業(yè)的發(fā)展。同時,也可能會引發(fā)一系列社會和經(jīng)濟(jì)問題,需要我們密切關(guān)注。
最后,我再次做個提示供大家思考,就是這次DeepSeek引發(fā)的大模型工程創(chuàng)新,會不會蓄力9·24以來的A股牛市,從“貨幣牛”轉(zhuǎn)換到“科技牛”,類似2022年11月ChatGpt橫空出世以后的美股。當(dāng)然,美股“科技牛”七成靠七巨頭,中國“科技牛”有沒有這樣的七巨頭支撐呢?我保持著一定程度的樂觀。
(作者系西京研究院院長、中國首席經(jīng)濟(jì)學(xué)家論壇成員)
第一財經(jīng)獲授權(quán)轉(zhuǎn)載自微信公眾號“首席經(jīng)濟(jì)學(xué)家論壇”。
頂級域名ai.com重定向到DeepSeek;比亞迪宣布璇璣架構(gòu)全面接入DeepSeek;OpenAI CEO稱隨著人工智能成本持續(xù)下降,人工智能將得到更頻繁使用。
第一財經(jīng)每日精選最熱門大公司動態(tài),點(diǎn)擊「聽新聞」,一鍵收聽。
投資人期盼該AI平臺能夠成為行業(yè)的顛覆者,對中國包括芯片制造到軟件設(shè)計以及數(shù)據(jù)中心運(yùn)營等更廣泛的科技行業(yè)產(chǎn)生積極影響,從而帶動資本市場新一輪的反彈。
蘇州市公共算力服務(wù)平臺上架基于英偉達(dá)算力部署的DeepSeek R1和V3模型;長城汽車Coffee Agent大模型與DeepSeek完成融合;微軟自主的SWE智能體首次亮相。
DeepSeek成史上最快突破3000萬日活A(yù)PP;商湯大裝置上架DeepSeek系列模型;OpenAI將在慕尼黑開設(shè)其首個德國辦事處。