分享到微信打開微信,點擊底部的“發(fā)現(xiàn)”, |
“大模型廠商卷生卷死,開發(fā)者無所適從?!痹诎俣華I開發(fā)者大會上,百度董事長李彥宏這樣描述大模型和應(yīng)用開發(fā)者的生存狀態(tài)。
他援引數(shù)據(jù)稱,開源中國一年新增150萬開發(fā)者,但同時開發(fā)者也充滿焦慮。去年第四季度國內(nèi)有49個大模型更新發(fā)布,到今年一季度這一數(shù)字增長至55個,最多的時候一周有8個模型。大模型迭代速度快,模型能力越來越強(qiáng),有開發(fā)者擔(dān)心所做的應(yīng)用被大模型迭代快速覆蓋掉,因此白費(fèi)功夫,不敢放心大膽地做應(yīng)用。
“這其實是雙刃劍?!崩顝┖暾f,一方面開發(fā)者確實需要理解技術(shù)發(fā)展的趨勢,避開大模型自身發(fā)展的延長線;另一方面,日益強(qiáng)大的模型能力為開發(fā)者打開更多可能性,“只要找對場景,選對基礎(chǔ)模型,有時候還要學(xué)一點調(diào)模型的方法,在此基礎(chǔ)上做出來的應(yīng)用是不會過時的?!?/p>
他強(qiáng)調(diào),“沒有應(yīng)用,芯片、模型都沒有價值。模型會有很多,但未來真正統(tǒng)治這個世界的是應(yīng)用,應(yīng)用才是王者。”
今年以來,當(dāng)DeepSeek掀了大模型的牌桌,進(jìn)攻是百度AI繼續(xù)留在牌桌的唯一機(jī)會。
李彥宏透露,百度已有多個應(yīng)用接入滿血版DeepSeek,產(chǎn)生了不錯的效果,為此百度專門舉辦一場討論DeepSeek的分論壇。但DeepSeek不是萬能的,比如它只能處理文本,還不能理解聲音、圖片、視頻等多媒體內(nèi)容,百度很多客戶需要多模態(tài)能力,此外DeepSeek在一些場景幻覺比較高,“如果數(shù)字人直播幻覺出來一個買一贈一的優(yōu)惠,商家要賠慘了。”此外還有速度慢、價格貴等問題。
當(dāng)天,百度發(fā)布文心大模型4.5 Turbo和深度思考模型X1 Turbo,相比文心4.5和X1 Turbo。二者速度更快,價格分別下降80%和50%。此外,李彥宏發(fā)布高說服力數(shù)字人、通用超級智能體心響APP、內(nèi)容操作系統(tǒng)滄舟OS等多款A(yù)I應(yīng)用,覆蓋AI數(shù)字人、代碼智能體、多智能體協(xié)作等賽道,并宣布百度全自研的3萬卡集群點亮,可同時承載多個千億參數(shù)大模型的全量訓(xùn)練,支持1000個客戶同時做百億參數(shù)的大模型精調(diào)。
圍繞應(yīng)用,去年時李彥宏表示,智能體是他最看好的AI原生應(yīng)用發(fā)展方向,當(dāng)時還是“非共識”,到了今年智能體已成為AI應(yīng)用的代名詞。其中,代碼智能體Coding Agent,是最近半年AI應(yīng)用進(jìn)展最快、最火的賽道。全球陸續(xù)涌現(xiàn)了cursor、devin、lovable等一系列代碼智能體。在百度內(nèi)部,工程師普遍使用的是文心快碼等輔助工具寫代碼,但百度也有好幾萬非技術(shù)人員,他們則會使用無代碼編程工具“秒噠”。
百度今日對“秒噠”進(jìn)行升級, 李彥宏舉例, 基于秒噠無代碼開發(fā)工具,一個陜西的果農(nóng),做了一個能賣蘋果、自動算賬的應(yīng)用;一位退休師傅,創(chuàng)建了一個可以進(jìn)行車位、訪客、維修登記和社區(qū)活動公告的居民服務(wù)應(yīng)用等等。
李彥宏說,全球有近3000萬程序員,有80億人,當(dāng)技術(shù)的門檻逐漸消失,每個人都可以具備程序員的能力。“如果你還像原來那樣天天一行一行地寫代碼,是沒有贏的可能性的。”
朱嘯虎表示,DeepSeek爆火之后,開源生態(tài)將主導(dǎo)基座模型,而騰訊是DeepSeek帶動技術(shù)平權(quán)后的最大受益者。
向老師學(xué)習(xí),老師的智能就是天花板;向自然學(xué)習(xí),就可以突破人類智能的極限。所以AI的優(yōu)勢在可擴(kuò)展性,它發(fā)展的絕對瓶頸常在數(shù)據(jù)和能源。
DeepSeek的廣泛接入引發(fā)了關(guān)于自研大模型必要性的討論,盡管其低成本和開源特性推動了市場熱潮,但自研在滿足特定需求和技術(shù)主導(dǎo)權(quán)方面仍具有重要價值。
怎么才能用好如今“百模大戰(zhàn)”之下各種層出不窮的AI模型?關(guān)鍵就是要分清楚它們所處的層次,以匹配你想達(dá)到的目的。
隨著DeepSeek免費(fèi)開源崛起,數(shù)據(jù)問題成為阻礙大模型落地進(jìn)程新的攔路虎。很多央企國等大型企業(yè)業(yè)務(wù)數(shù)據(jù)分散且格式多樣,需解決非結(jié)構(gòu)化數(shù)據(jù)的清洗、標(biāo)注和知識化問題。