分享到微信打開(kāi)微信,點(diǎn)擊底部的“發(fā)現(xiàn)”, |
第一財(cái)經(jīng) 2024-12-11 18:17:56 聽(tīng)新聞
作者:劉曉潔 ? 鄭栩彤 責(zé)編:劉佳
大模型這一年有哪些關(guān)鍵詞?
從不同的從業(yè)者那里,第一財(cái)經(jīng)記者收到的回答包括視頻模型Sora、推理模型GPT-o1,年中的Token(詞元)價(jià)格戰(zhàn),以及百花齊放的落地。
2023年,楓清科技(Fabarta)在尋找場(chǎng)景落地,但創(chuàng)始人高雪峰的感受是,去年市場(chǎng)對(duì)落地的關(guān)注度并沒(méi)有那么高,“大家都還是追捧著頭部大模型,推出新的版本,更大的參數(shù)、聊天更好、更順暢等等這件事情上。”他發(fā)現(xiàn),去年大的企業(yè)還都是隨便拿一個(gè)商用大模型來(lái)做嘗試。
但今年風(fēng)向變了,大家發(fā)現(xiàn)大模型得用起來(lái)才有價(jià)值。有大模型企業(yè)傳出放棄做預(yù)訓(xùn)練大模型,轉(zhuǎn)做相應(yīng)的產(chǎn)品。“得讓大家能真正用起來(lái),不論是大B還是C端的場(chǎng)景,一定得用起來(lái)才能知道好壞,才能促進(jìn)迭代,要不然就是供在那,沒(méi)有任何意義和價(jià)值。”高雪峰感受到更多客戶(hù)愿意合作了。
在Scaling Law(尺度定律)這條路線(xiàn)上,行業(yè)開(kāi)始出現(xiàn)分歧,一方面是大規(guī)模預(yù)訓(xùn)練價(jià)格不菲,投入產(chǎn)出比并不確定,另一方面,關(guān)于預(yù)訓(xùn)練“撞墻”、大模型放緩的討論也越來(lái)越多,從24年年初開(kāi)始有論文提出模型能力提升速度隨著參數(shù)規(guī)模的擴(kuò)大而放緩,到11月,OpenAI前首席科學(xué)家伊利亞·蘇茨克維爾(Ilya Sutskever)在公開(kāi)場(chǎng)合表示,簡(jiǎn)單地增加數(shù)據(jù)和計(jì)算能力來(lái)擴(kuò)大當(dāng)前模型規(guī)模的時(shí)代已經(jīng)結(jié)束。
但伊利亞沒(méi)被傳開(kāi)的后半句是,“現(xiàn)在重要的是擴(kuò)大正確的規(guī)模”,有人認(rèn)為OpenAI轉(zhuǎn)向推理模型是迭代放緩的證明,也有行業(yè)人士認(rèn)為這是“Scale”的范式變了,從預(yù)測(cè)下一個(gè)Token到用強(qiáng)化學(xué)習(xí)的方法去“Scale”。
矛盾似乎充斥著AI的2024年,大模型一邊背負(fù)著巨大期望,一邊接受著現(xiàn)實(shí)的拷打。邁過(guò)2024年,我們需要抱著什么樣的信心去看待通往AGI(通用人工智能)的歷程?
大模型慢了嗎
2024年初,大家還在驚嘆于Sora讓“現(xiàn)實(shí)不存在了”,感慨生成式AI改變世界的速度,擔(dān)心自己被AI替代,但到年末,大家開(kāi)始發(fā)現(xiàn)人工智能并不智能,通往AGI的道路受阻,GPT-5沒(méi)有在預(yù)期中出現(xiàn),行業(yè)質(zhì)疑大模型是否走慢了。
回顧這一年,跬智信息(Kyligence)聯(lián)合創(chuàng)始人兼 CTO李揚(yáng)印象最深刻的是,Sora、GPT-o1以及馬斯克大力投入的Grok。“一方面是激烈地爭(zhēng)奪,另一方面整體大模型能力似乎又放緩。”
2023年,馬斯克旗下的xAI推出了Grok系列模型,為了讓其后來(lái)居上,一向激進(jìn)的馬斯克大手筆屯了10萬(wàn)張英偉達(dá)GPU卡建立AI集群,并在年底融了一輪60億美元的資金,用于繼續(xù)購(gòu)買(mǎi)英偉達(dá)顯卡以擴(kuò)大其集群。
過(guò)去幾年,大模型參數(shù)從千億級(jí)到萬(wàn)億級(jí)以至十萬(wàn)億級(jí),預(yù)訓(xùn)練的成本越來(lái)越高,成為資本驅(qū)動(dòng)的游戲。Anthropic創(chuàng)始人達(dá)里奧·阿莫迪(Dario Amodei)曾在播客里談到,正在訓(xùn)練的一些模型的成本接近 10 億美元,且這個(gè)數(shù)字未來(lái)還會(huì)上漲,未來(lái)三年可能會(huì)達(dá)到 100億美元至1000億美元。
在高昂的成本和不確定的投入產(chǎn)出比下,越來(lái)越多公司開(kāi)始衡量預(yù)訓(xùn)練的性?xún)r(jià)比,尤其在預(yù)訓(xùn)練有可能“撞墻”的趨勢(shì)下。
李揚(yáng)認(rèn)為,大模型在放緩是不爭(zhēng)的事實(shí),行業(yè)既有樂(lè)觀也有悲觀派,他們?cè)谀撤N角度上都正確,只是發(fā)言的層次不同。樂(lè)觀派通常表示AI整體大方向正確,沒(méi)有人會(huì)反對(duì)。但針對(duì)GPT和Transformer的技術(shù)路線(xiàn),他認(rèn)為這個(gè)路線(xiàn)有自己的天花板。
“半年或者一年前大家仍然有猶豫,但目前只需要觀察所有大模型廠商目前的產(chǎn)品到哪里,以O(shè)penAI為代表,推出下一代大模型的速度受阻,只關(guān)注這一結(jié)果,可以清楚他們一定遇到了技術(shù)阻力。”李揚(yáng)表示。
在今年6月演講時(shí),金沙江創(chuàng)投主管合伙人朱嘯虎曾談及GPT-5一直“跳票”時(shí)就表示,“硅谷也高度懷疑GPT-5還有沒(méi)有,即使出來(lái)在核心推理能力上還有沒(méi)有顯著的提高,這是很不確定的東西,今年年底是一個(gè)驗(yàn)金石。”他判斷,大模型演化速度有放緩趨勢(shì)。
但在這一點(diǎn)上,行業(yè)尚未達(dá)成共識(shí),不少?gòu)臉I(yè)者并不認(rèn)為迭代速度在放緩。
MiniMax副總裁劉華告訴記者,2024年仍是大模型飛速發(fā)展的一年,目前技術(shù)沒(méi)有看到上限。“我們不太同意大模型‘撞墻’的說(shuō)法,也沒(méi)有感受到Scaling Law放緩。相反,我們今年看到更多模型研發(fā)方向。以往Scaling Law大家認(rèn)為就是訓(xùn)練階段的Scaling Law,今年突然發(fā)覺(jué)大模型推理也有Scaling Law了。”劉華說(shuō)。
另一名頭部大模型廠商研發(fā)人員告訴記者,他感受到近半年來(lái)大模型技術(shù)也沒(méi)有走慢,全世界對(duì)大模型的研發(fā)投入還在高速增長(zhǎng),進(jìn)展也一直有,只不過(guò)不算突破性進(jìn)展。
“之所以有些人認(rèn)為走慢了,是因?yàn)橥黄菩缘倪M(jìn)展不是天天有,即便有突破性進(jìn)展也不是每個(gè)都能出圈。業(yè)界仍然在向上觸摸原本技術(shù)路線(xiàn)的天花板,可能快到瓶頸期了,需要新的突破。”上述研發(fā)人員告訴記者,可以肯定的是,現(xiàn)在大模型進(jìn)化的幅度小于從GPT-3到GPT-4之間的幅度,所以GPT-5才一直沒(méi)有出來(lái)。不過(guò),這不意味著突破性進(jìn)展不會(huì)到來(lái),現(xiàn)在誰(shuí)也說(shuō)不準(zhǔn),是不是GPT-5明年就推出了、突破性進(jìn)展很快就出現(xiàn)了。
此前一家AI初創(chuàng)企業(yè)的創(chuàng)始人也對(duì)第一財(cái)經(jīng)表示,大模型技術(shù)迭代保持著2018年以來(lái)的增速,那一年基于Transformer架構(gòu)的大規(guī)模語(yǔ)言模型預(yù)訓(xùn)練開(kāi)始流行。“大家之所以有這樣的感覺(jué)(技術(shù)迭代放緩)是因?yàn)榇蟊娛窃?022年底、2023年初第一次看到這個(gè)技術(shù),做了很多短時(shí)間的learning和追趕,追趕當(dāng)然比較快。”
“行業(yè)還在飛速發(fā)展,只不過(guò)國(guó)內(nèi)有點(diǎn)滯后。”大模型生態(tài)社區(qū)OpenCSG(開(kāi)放傳神)創(chuàng)始人陳冉對(duì)第一財(cái)經(jīng)表示,模型天天變,不變的是數(shù)據(jù)沉淀,他認(rèn)為,行業(yè)數(shù)據(jù)才是關(guān)鍵,不是預(yù)訓(xùn)練。
行業(yè)大致的共識(shí)是,大模型在數(shù)據(jù)語(yǔ)料上面遇到了瓶頸,“互聯(lián)網(wǎng)上的人類(lèi)語(yǔ)料是基本原料,已經(jīng)耗盡了,雖然模型變大了,但是輸入沒(méi)有變得更多,無(wú)法學(xué)習(xí)新知識(shí)。”李揚(yáng)認(rèn)為。
一名大模型開(kāi)發(fā)人員也告訴記者,現(xiàn)在業(yè)界已經(jīng)在用合成數(shù)據(jù)應(yīng)對(duì)自然數(shù)據(jù)即將用盡的挑戰(zhàn),不過(guò)使用合成數(shù)據(jù)能在多大程度提升模型表現(xiàn),現(xiàn)在業(yè)界并不確定。
在瑞銀證券中國(guó)科技軟件分析師張維璇看來(lái),大模型的scaling law是否變緩,GPT-5什么時(shí)候可以出來(lái),大家都還沒(méi)有很明確的解答。她也認(rèn)為,現(xiàn)在卡點(diǎn)不是在算力上面,而是在數(shù)據(jù)上面。
“所以會(huì)有很多新的技術(shù)方向是如何利用合成數(shù)據(jù),如何在post-training(后訓(xùn)練)這個(gè)階段進(jìn)一步加強(qiáng)模型推理的能力,這是新的金礦。”張維璇認(rèn)為,未來(lái)post-training這個(gè)金礦會(huì)被更多地挖掘,就和最開(kāi)始scaling law在預(yù)訓(xùn)練這個(gè)階段挖金山一樣。
大模型是不是走慢了不能下定論,不過(guò),即便速度放緩,李揚(yáng)也并不認(rèn)為這是一個(gè)問(wèn)題。從技術(shù)人員的角度來(lái)看,所有技術(shù)都具有局限性,基于GPT和Transformer框架技術(shù)的局限性屬于正常且并不意外。“人也不能無(wú)限學(xué)習(xí),為什么我們找到的第一代通用智能就能實(shí)現(xiàn)無(wú)限學(xué)習(xí),我原本就沒(méi)有這個(gè)預(yù)期,我認(rèn)為它并非缺點(diǎn)。”
如果將機(jī)器訓(xùn)練比作人類(lèi)學(xué)習(xí),這個(gè)問(wèn)題可以變成,人能否在無(wú)限的學(xué)習(xí)中變得更聰明,李揚(yáng)認(rèn)為,人也在某個(gè)領(lǐng)域存在知識(shí)上的瓶頸,如果人無(wú)法無(wú)限學(xué)習(xí)并變得更聰明,為什么基于模式識(shí)別的大模型就一定可以?“大模型目前可能在‘大專(zhuān)’遇到了瓶頸,未來(lái)仍然有一定的發(fā)展空間,只是提升的速度沒(méi)有以前快。”
對(duì)國(guó)內(nèi)大模型行業(yè)來(lái)說(shuō),遇到瓶頸、迭代速度放緩是個(gè)好消息,跑得快的人跑得慢了,在一個(gè)很好的時(shí)間窗口中國(guó)內(nèi)可以縮短與海外的差距。從商業(yè)落地中的感受來(lái)看,李揚(yáng)認(rèn)為,現(xiàn)在海內(nèi)外的差距已經(jīng)不如一年前那么大了,追近了不少。
范式變了
在關(guān)于大模型速度放緩的爭(zhēng)論中,一個(gè)關(guān)鍵的點(diǎn)是OpenAI于9月發(fā)布的推理模型GPT-o1,這一模型擅長(zhǎng)處理復(fù)雜的推理任務(wù),尤其是在科學(xué)、技術(shù)、工程和數(shù)學(xué)(STEM)領(lǐng)域,其評(píng)測(cè)分?jǐn)?shù)都遠(yuǎn)遠(yuǎn)超過(guò)GPT-4o。
GPT-5并沒(méi)有出現(xiàn),但出現(xiàn)了GPT-o1,有人認(rèn)為這是迭代速度放緩的信號(hào),也有不少業(yè)內(nèi)人士認(rèn)為,o1是轉(zhuǎn)向了另一個(gè)方向的“Scale”,將計(jì)算資源從大規(guī)模預(yù)訓(xùn)練數(shù)據(jù)集重新分配到訓(xùn)練和推理階段,也就是說(shuō),Scaling Law在大模型推理側(cè)繼續(xù)有效。
GPT-o1的推出沒(méi)有引起像年初Sora那么大的反響,高雪峰認(rèn)為,這是圈內(nèi)和圈外的區(qū)別。Sora的效果更直接,GPT-o1并不那么直觀,但自從GPT-o1這一模型推出來(lái)之后,驗(yàn)證了整個(gè)行業(yè)的發(fā)展趨勢(shì)。在推理與概率預(yù)測(cè)的技術(shù)體系上,已經(jīng)朝著更加綜合和平衡的方向上轉(zhuǎn)移了。
“今年很明顯,已經(jīng)不去從千億模型到萬(wàn)億模型到十萬(wàn)億模型的智能涌現(xiàn)發(fā)展了,而是回過(guò)頭來(lái)改進(jìn)推理模型。很多人會(huì)覺(jué)得這件事,無(wú)外乎是原來(lái)AlphaGO 這種推理能力的剪枝提升,做一些優(yōu)化,技術(shù)上沒(méi)有太大的創(chuàng)新,但是在我看來(lái)這是一個(gè)方向性的變化。”高雪峰表示,之前有人堅(jiān)持Transformer 的Scaling law是未來(lái),是一切,現(xiàn)在不會(huì)有人這么說(shuō)了,接下來(lái)要做推理能力、強(qiáng)化學(xué)習(xí)方向的Scaling law。
行業(yè)有類(lèi)似看法的人不在少數(shù)。月之暗面創(chuàng)始人楊植麟在11月的媒體交流中提到,大模型的范式會(huì)產(chǎn)生一些變化,從原來(lái)的“next-token prediction”(預(yù)測(cè)下一個(gè)詞)到強(qiáng)化學(xué)習(xí),讓AI具備思考的能力。
“今天Scale得差不多的時(shí)候,會(huì)發(fā)現(xiàn)再加更多的算力,并不一定能直接解決問(wèn)題,核心是沒(méi)有高質(zhì)量的數(shù)據(jù),幾十G的Token是人類(lèi)互聯(lián)網(wǎng)積累了20多年的上限。這個(gè)時(shí)候要做的事情,是通過(guò)算法的改變繞過(guò)瓶頸。”楊植麟表示。
現(xiàn)在整個(gè)行業(yè)遇到的問(wèn)題是,加更多的卡也不一定能看到直接的提升,在楊植麟看來(lái),“好算法就是與Scaling做朋友,如果算法能夠釋放Scaling的潛力,它就會(huì)持續(xù)變得更好。”因此,強(qiáng)化學(xué)習(xí)是接下來(lái)很重要的一個(gè)趨勢(shì),它改變大模型學(xué)習(xí)的方式,讓其能持續(xù)“Scale”。
有大模型廠商研發(fā)人員告訴記者,年內(nèi)值得關(guān)注的新路線(xiàn)就是強(qiáng)化學(xué)習(xí)技術(shù)下的Scaling Law和推理階段的Scaling Law,也就是o1提出來(lái)的路線(xiàn)。現(xiàn)在業(yè)界都嘗試在推理階段用更多Token來(lái)搜尋更復(fù)雜問(wèn)題的答案,大家都已經(jīng)知道思路了,只不過(guò)還做不到OpenAI那么好的效果,也還不知道這條新路線(xiàn)后面的天花板有多高。
拋開(kāi)技術(shù)迭代不談,推理模型這一方向也是行業(yè)大勢(shì)所趨。在復(fù)雜行業(yè)的落地中,大模型的幻覺(jué)和思維邏輯能力一直是一個(gè)阻礙,包括此前大模型分不出“9.9和9.11哪個(gè)大”這一典型問(wèn)題。行業(yè)認(rèn)為,AI一定要具備可解釋性、推理能力,再加上盡可能地減少幻覺(jué),疊加數(shù)據(jù)的能力才能解決生產(chǎn)力的問(wèn)題,這是做推理模型的必要性。
追隨OpenAI的腳步,對(duì)標(biāo)o1系列,國(guó)內(nèi)也有眾多廠商和機(jī)構(gòu)在年底發(fā)布數(shù)學(xué)推理模型,包括阿里通義、DeepSeek、月之暗面、上海人工智能實(shí)驗(yàn)室等。
上海人工智能實(shí)驗(yàn)室青年科學(xué)家陳愷此前在接受第一財(cái)經(jīng)采訪(fǎng)時(shí)表示,強(qiáng)大的推理能力是邁向通用人工智能的重要基礎(chǔ)。“目前大模型的頭部機(jī)構(gòu)都有研發(fā)和發(fā)布推理模型的計(jì)劃,因?yàn)橥评砟芰κ谴竽P椭悄芩降闹匾w現(xiàn),也是面向復(fù)雜應(yīng)用場(chǎng)景的必備能力。”
在具體應(yīng)用上,一般的大模型可以在讀完一份財(cái)報(bào)之后幫忙整理其中的關(guān)鍵信息,如果是具備強(qiáng)推理能力的模型,未來(lái)就可以像分析師一樣幫助分析財(cái)報(bào)中的數(shù)據(jù),給出合理的研究和預(yù)測(cè)。
在強(qiáng)調(diào)做數(shù)學(xué)推理模型的重要性時(shí),楊植麟有個(gè)理性又感性的表達(dá),他引用物理學(xué)家伽利略的一句話(huà)表示,“宇宙是由數(shù)學(xué)這門(mén)語(yǔ)言書(shū)寫(xiě)而成的”,宇宙的很多規(guī)律是通過(guò)數(shù)學(xué)來(lái)刻畫(huà)的,數(shù)學(xué)是宇宙的基石。這種遙遠(yuǎn)的相似性或許有助于邁向通用人工智能。
但另一個(gè)思考在于,推理模型也可能出現(xiàn)問(wèn)題。360集團(tuán)創(chuàng)始人周鴻祎就指出, OpenAI用強(qiáng)化學(xué)習(xí)、思維鏈慢思考的方式做o1,“但慢思考也有問(wèn)題,當(dāng)你發(fā)現(xiàn)它跨了一個(gè)專(zhuān)業(yè)學(xué)科后(表現(xiàn)不一樣),o1解數(shù)學(xué)、物理題可以,造航空發(fā)動(dòng)機(jī)不行。”
周鴻祎的判斷是,OpenAI的這條路長(zhǎng)期看目標(biāo)正確,但這像“造原子彈”,只有把大模型變成“茶葉蛋”才能走進(jìn)千行百業(yè),引發(fā)工業(yè)革命。同時(shí),通用AGI可能也是偽命題,AI要再進(jìn)化就要學(xué)習(xí)人類(lèi)掌握的獨(dú)特的知識(shí),走專(zhuān)業(yè)化的道路。
今年“找釘子”
年初有一個(gè)說(shuō)法是,2024年是AI落地的元年,高雪峰不完全認(rèn)可這一觀點(diǎn),此前已經(jīng)有很多AI圖片生成、AI換臉等應(yīng)用出現(xiàn),他認(rèn)為,這些都是生成式人工智能的落地體現(xiàn)。
“我覺(jué)得不是 AI 落地元年,而是行業(yè)精準(zhǔn)場(chǎng)景和人工智能技術(shù)融合的元年。”這一年,高雪峰走訪(fǎng)了各個(gè)大的國(guó)央企,看到越來(lái)越多企業(yè)都在干這件事,企業(yè)在推動(dòng)真正能夠帶來(lái)生產(chǎn)力提升的場(chǎng)景,每個(gè)企業(yè)都在研究,哪些場(chǎng)景能落地,去調(diào)研、嘗試,再推廣、反饋和改進(jìn)。
如果說(shuō)去年廠商在不斷迭代大模型是“造錘子”,今年行業(yè)更重要的是“找準(zhǔn)釘子”。
楓清科技是企業(yè)級(jí)AI平臺(tái)型的初創(chuàng)公司,高雪峰因?yàn)榭吹搅松墒紸I迭代過(guò)程中基礎(chǔ)層的機(jī)會(huì),從阿里云出走創(chuàng)業(yè)。楓清科技對(duì)接的主要是大B端的客戶(hù),去年他們接觸的大企業(yè)還在觀望,隨便做一些嘗試。但今年,愿意洽談合作的客戶(hù)更多了,高雪峰對(duì)記者提到,有頭部央企與楓清科技有較為頻繁地接觸,至少有兩三家有合同已簽約落地。
綜合楓清科技與國(guó)央企的合作經(jīng)驗(yàn),高雪峰觀察到,企業(yè)正在經(jīng)歷從以模型為中心向Data-Centric(以數(shù)據(jù)為中心)的重要轉(zhuǎn)型,更多去處理本地的數(shù)據(jù),將數(shù)據(jù)轉(zhuǎn)化為知識(shí),再結(jié)合模型能力賦能 AI 應(yīng)用。
今年高雪峰有一個(gè)明顯的感受是,聊一個(gè)大型國(guó)央企基本上會(huì)對(duì)他們感興趣,“相比去年,今年已經(jīng)不用先談?lì)A(yù)算了,用兩個(gè)星期嘗試了一下效果,比原來(lái)要好,就可以深入場(chǎng)景討論平臺(tái)落地具體的規(guī)劃。”雖然時(shí)間周期也長(zhǎng),但是很明顯的是,成功率很高。
站在大模型開(kāi)發(fā)商的角度,劉華發(fā)現(xiàn),今年大模型應(yīng)用拓寬了。
劉華表示,去年國(guó)內(nèi)就有AI辦公產(chǎn)品,能寫(xiě)文章、做PPT,如果按滿(mǎn)分100分打分,這種產(chǎn)品創(chuàng)作的文學(xué)作品雖然不到90分,但也有70分了。此外,今年大模型還從一個(gè)只會(huì)寫(xiě)文章的“文科生”變成能力比較全面的模型,以公司的語(yǔ)音服務(wù)產(chǎn)品為例,該產(chǎn)品在中文環(huán)境下已能提供如同GPT-4o一般的即時(shí)服務(wù)。從B端和C端看,大模型也已經(jīng)催生了一些比較好的產(chǎn)品。
劉華以公司大模型目前的應(yīng)用場(chǎng)景舉例:音樂(lè)、視頻模型已被用于制作廣告;與保險(xiǎn)公司合作的智能體能在客戶(hù)來(lái)電時(shí)把保單賠付流程走完;AI藥師助手能在醫(yī)藥零售場(chǎng)景提供用藥建議;公司的大模型驅(qū)動(dòng)了聯(lián)想AI PC的聯(lián)想小天語(yǔ)音;C端的AI內(nèi)容社區(qū)產(chǎn)品在國(guó)外已有付費(fèi)會(huì)員。
不過(guò),從演進(jìn)的進(jìn)程看,目前的大模型并非終局。劉華說(shuō),大模型對(duì)社會(huì)的影響可以類(lèi)比為當(dāng)年電力、蒸汽機(jī)發(fā)明的影響,與電力、蒸汽機(jī)相似,這波大模型技術(shù)迭代、演進(jìn)并非一兩年內(nèi)就能完成。
在這些場(chǎng)景落地背后,今年還有兩個(gè)重要的助推因素,一個(gè)是年中大模型的Token價(jià)格戰(zhàn),另一個(gè)是兩會(huì)期間“AI+”首次寫(xiě)進(jìn)《政府工作報(bào)告》。
今年5月,以幻方量化、智譜開(kāi)篇,首先將模型價(jià)格下降數(shù)倍,隨后云廠商加入迅速掀起價(jià)格戰(zhàn)。字節(jié)豆包主力模型將其在企業(yè)市場(chǎng)的定價(jià)做到0.0008元/千tokens,喊出較行業(yè)平均價(jià)格便宜99.3%。“通義千問(wèn)9款模型齊降價(jià),擊穿全球底價(jià)”,彼時(shí)阿里云宣布。
對(duì)于大模型降價(jià),有行業(yè)人士覺(jué)得這是惡性競(jìng)爭(zhēng),但從客觀結(jié)果來(lái)看,這降低了用戶(hù)對(duì)于大模型的使用成本,帶動(dòng)了更多應(yīng)用的落地。
“從年初幾十元每百萬(wàn)token的定價(jià),到年中價(jià)格的競(jìng)爭(zhēng)潮下,很多主力模型的價(jià)格可以降到1元每百萬(wàn)token的水平。再到今年9月可以看到進(jìn)一步下降,甚至有一些降到了3毛錢(qián)百萬(wàn)token。”張維璇觀察到。
高雪峰認(rèn)為,這一價(jià)格戰(zhàn)有利于大的 AI 場(chǎng)景生態(tài)的發(fā)展,因?yàn)榇蠹腋菀走\(yùn)用公共云的資源,可以做更豐富的場(chǎng)景嘗試,“很多人用得起,可以開(kāi)始自己打造一些場(chǎng)景化應(yīng)用”。
另一方面,從高雪峰的角度看來(lái),更大的事件是“AI+”寫(xiě)進(jìn)《政府工作報(bào)告》,這尚屬首次。在談到“科技創(chuàng)新實(shí)現(xiàn)新的突破”時(shí),報(bào)告中提到“人工智能、量子技術(shù)等前沿領(lǐng)域創(chuàng)新成果不斷涌現(xiàn)”,要深化大數(shù)據(jù)、人工智能等研發(fā)應(yīng)用,開(kāi)展“人工智能+”行動(dòng)。
“這代表了各個(gè)行業(yè)的龍頭企業(yè)一定要做 AI 的轉(zhuǎn)型,包括民企,央企和國(guó)企,要把‘AI+’和場(chǎng)景連接在一起,對(duì)我們來(lái)說(shuō)就是一個(gè)巨大的機(jī)會(huì),因?yàn)槲覀兙褪歉蛇@件事,于是我們開(kāi)始將注意力集中到大B的場(chǎng)景建設(shè)上。”高雪峰對(duì)記者表示。
瑞銀證券在年初發(fā)布了一份關(guān)于中國(guó)AI行業(yè)的大報(bào)告,在其中他們認(rèn)為中國(guó)AI長(zhǎng)期發(fā)展的潛力是被低估的。中國(guó)AI應(yīng)用的滲透率有望從明年起加速,由AI帶動(dòng)的軟件、云服務(wù)市場(chǎng),可能在未來(lái)五年預(yù)估的復(fù)合增長(zhǎng)率可以達(dá)到35%以上。
這一觀點(diǎn)背后的支撐在于,從模型性能方面,基于一些公開(kāi)測(cè)試集benchmark的評(píng)分來(lái)看,中國(guó)的國(guó)產(chǎn)大模型廠商的性能水平已經(jīng)接近了GPT-4的水平,在一些垂直應(yīng)用的領(lǐng)域,如數(shù)學(xué)、AI Agent等能力上,很多大模型廠商通過(guò)監(jiān)督微調(diào)、強(qiáng)化學(xué)習(xí)等等方式,就算不增加大算力的前提下,大模型的準(zhǔn)確度也可以得到不斷地加強(qiáng)。同時(shí)中國(guó)有非常活躍的AI開(kāi)源社區(qū)、開(kāi)發(fā)者,還有廣泛的應(yīng)用場(chǎng)景,這些都在不斷幫助國(guó)內(nèi)大模型性能日拱一卒。
張維璇還分享了一個(gè)數(shù)據(jù)是,瑞銀觀察到中國(guó)前十大C端的AI移動(dòng)應(yīng)用月活加起來(lái)超過(guò)了一個(gè)億,在她看來(lái),這已經(jīng)是很大的月活體量。從6月Token價(jià)格下降開(kāi)始計(jì)算,大模型的API日均調(diào)用量到現(xiàn)在增長(zhǎng)了大概8倍,“確實(shí)看到中國(guó)AI的使用率在不斷地提高”。
站在年底,怎么看明年AI行業(yè)的機(jī)會(huì)?
據(jù)瑞銀的分析,過(guò)去AI最先帶動(dòng)是基礎(chǔ)設(shè)施層面的公司,包括AI加速卡、GPU、存儲(chǔ)、網(wǎng)絡(luò)通信設(shè)備、云的提供商等,接下來(lái)他們認(rèn)為,可能PaaS層(平臺(tái)層)很多工具的軟件廠商會(huì)陸續(xù)受益,包括一些數(shù)據(jù)的中臺(tái)、數(shù)據(jù)工具的提供商、AI應(yīng)用的性能檢測(cè)、安全的服務(wù)提供商等。
張維璇認(rèn)為,上述這些環(huán)節(jié)的企業(yè)可能會(huì)受益于AI從大模型訓(xùn)練往推理端、應(yīng)用端走的過(guò)程。從美國(guó)相關(guān)上市公司最新財(cái)報(bào)看到,這些公司AI收入貢獻(xiàn)明顯獲得了加速。
據(jù)OpenAI介紹,ChatGPT是首次向免費(fèi)用戶(hù)提供推理模型。
特朗普稱(chēng)DeepSeek“給美國(guó)相關(guān)產(chǎn)業(yè)敲響了警鐘”。
技術(shù)的另一面是,學(xué)術(shù)造假越來(lái)越方便,學(xué)術(shù)界近期開(kāi)始擔(dān)憂(yōu),AI垃圾或許會(huì)充斥論文庫(kù)。
進(jìn)行通用大模型訓(xùn)練的大模型公司數(shù)量在減少。
AI制藥行業(yè)正展現(xiàn)出前所未有的廣闊發(fā)展前景,其重要性及影響力在醫(yī)藥領(lǐng)域內(nèi)日益凸顯。通過(guò)整合大數(shù)據(jù)與機(jī)器學(xué)習(xí)算法,AI制藥正全面推動(dòng)藥物研發(fā)流程的加速,為醫(yī)藥產(chǎn)業(yè)的革新與發(fā)展注入了新的活力。