分享到微信打開微信,點擊底部的“發(fā)現(xiàn)”, |
科技圈里最熱的詞是大模型,商業(yè)化渠道最快的是產(chǎn)業(yè)場景。
為了展示言犀大模型落地行業(yè)的領(lǐng)先技術(shù)與應(yīng)用實踐,2024京東云峰會上,發(fā)布了京東云企業(yè)大模型服務(wù)、言犀智能體平臺、智能編程助手JoyCoder、言犀數(shù)字人3.0等三大智能平臺、五大領(lǐng)先技術(shù)產(chǎn)品。
“京東大模型發(fā)展分兩條線,一條線是要解決大模型和產(chǎn)業(yè)結(jié)合最后一公里的問題,我們圍繞著京東自身的業(yè)務(wù)場景,包括零售、物流,健康、金融等,一直在做各種各樣的嘗試,探索大模型在各個場景的落地模式。另外一條線是京東自有大模型的發(fā)展。”京東集團(tuán)技術(shù)委員會主席、京東云事業(yè)部總裁曹鵬說。
產(chǎn)業(yè)實踐出真知
正如曹鵬所言,京東供應(yīng)鏈?zhǔn)谴竽P蛻?yīng)用的超級孵化器。京東供應(yīng)鏈上的長鏈路、復(fù)雜協(xié)同的原生數(shù)據(jù),更適合產(chǎn)業(yè)大模型訓(xùn)練。這些數(shù)據(jù)源自于京東服務(wù)的千萬自營商品SKU,5000萬工業(yè)品SKU,超800萬家活躍企業(yè)客戶,全國超2000個產(chǎn)業(yè)帶的真實需求。
究竟怎么才能扎根產(chǎn)業(yè)沃土,挖掘大模型的產(chǎn)業(yè)價值?
京東探索研究院院長、京東科技人工智能業(yè)務(wù)負(fù)責(zé)人何曉冬認(rèn)為,“言犀大模型始終堅定追求的,不只是基礎(chǔ)模型的能力提升,更要走進(jìn)產(chǎn)業(yè),打造置于商業(yè)化標(biāo)準(zhǔn)之上,可用、好用的端到端產(chǎn)品。”
今年4月誕生的采銷東哥數(shù)字人成為京東大模型落地電商場景最“出圈”的案例。618期間,格力、海信、LG、寶潔等在內(nèi)的21位總裁通過數(shù)字人的方式空降京東直播間,創(chuàng)造了京東史上一日并行規(guī)模最大的數(shù)字人直播事件。目前,京東云言犀數(shù)字人正在支持5000+品牌,日常在各個平臺的穩(wěn)定開播,帶動GMV已超過百億。
在過往的產(chǎn)業(yè)實踐中,京東云言犀數(shù)字人的效果轉(zhuǎn)化指標(biāo)已經(jīng)能達(dá)到真人主播的均值,全新發(fā)布的言犀數(shù)字人3.0平臺,通過更加個性化的角色、豐富的知識、花樣的玩法,正在超越 80%的主播。幫助做好商家店播的長效增長。
“對于言犀數(shù)字人的應(yīng)用,我們有兩個目標(biāo),第一個是希望推動言犀大模型做得更有感情,更有情緒,第二個是交互上應(yīng)該做進(jìn)一步的創(chuàng)新。”何曉冬進(jìn)一步解釋稱,交互不是簡單的一問一答,而是有感情,有知識背景,甚至有個人閱歷的深度多輪交互。
“這兩塊的突破,會讓數(shù)字人真正進(jìn)入未來世界,大家就會真正接納數(shù)字人帶來的各種便利。我個人判斷,這有點像電動車的里程能突破油車?yán)锍桃院?,進(jìn)入真正的拐點。”何曉冬認(rèn)為,在未來,大模型將全方位滲透進(jìn)產(chǎn)業(yè)里,大模型的核心人機(jī)交互介質(zhì)將有三種:在線下物理世界可以通過場景理解、環(huán)境互動并執(zhí)行復(fù)雜任務(wù),以具身智能形態(tài)在物理世界創(chuàng)造價值;在端上將主要以交互型數(shù)字人形式,提供更逼真的交互體驗,創(chuàng)造AI與人之間更真實的情感鏈接;在云上將通過智能體學(xué)習(xí)、適應(yīng)人類的行為模式,做出更個性化的規(guī)劃和決策。
而現(xiàn)在,京東云企業(yè)大模型服務(wù)已經(jīng)支持一站式打造企業(yè)專屬大模型,將垂直領(lǐng)域知識注入到模型的同時,不損失模型的通用能力,且更加經(jīng)濟(jì)適用。京東云言犀AI開發(fā)計算平臺2.0,內(nèi)置20余種開源模型和豐富的數(shù)據(jù)集,并提供100余種算法和工具鏈,為客戶提供低門檻、高性價比的大模型開發(fā)服務(wù)。京東云大模型安全可信平臺,涵蓋超過200種特有的紅藍(lán)對抗攻擊手法,并且覆蓋監(jiān)管合規(guī)要求的全部31類風(fēng)險類型,風(fēng)險分析準(zhǔn)確率高達(dá)95%以上。京東云云艦AI算力云,支持多地域分布式算力的統(tǒng)一調(diào)度,提供高性價比的算力供給。最新升級的新一代分布式存儲云海3.0,在性能層面持續(xù)提升,可支持千億級參數(shù)AI大模型,4K隨機(jī)寫IOPS達(dá)到1000萬級,平均延遲在100微秒級,極致性能更好地支持大模型落地應(yīng)用。
正因為看到了大模型在產(chǎn)業(yè)端落地的可行性,曹鵬堅定地表示自己不認(rèn)可當(dāng)下出現(xiàn)的價格戰(zhàn)。“大模型價值一定是在產(chǎn)業(yè)應(yīng)用中,不管是拿來做用戶營銷、還是做代碼編寫,還是物流配送,只有在實際的應(yīng)用場景中打通了,才能證明這個模型有價值,有了價值以后,才能衡量它的價格。”
前沿探索勇?lián)?dāng)
曹鵬并不諱言落地的過程當(dāng)中存在堵點,“行業(yè)對新的技術(shù)不夠了解,特別是越傳統(tǒng)的行業(yè),可能對于新技術(shù)能夠帶來的提效沒有很清晰的概念。而純粹的技術(shù)提供方,又缺乏對行業(yè)痛點的深刻洞察和理解。”
他認(rèn)為,行業(yè)里面的中小企業(yè)沒有那么多資源做前瞻性的技術(shù)研究和投入,一定是龍頭企業(yè)才有可能有資源做前瞻性的探索和研究,并穿透整個供應(yīng)鏈和產(chǎn)業(yè)鏈上下游,帶動企業(yè)的經(jīng)營提效。
而京東就承擔(dān)了這樣的角色。京東供應(yīng)鏈上的長鏈路、復(fù)雜協(xié)同的原生數(shù)據(jù),更適合產(chǎn)業(yè)大模型訓(xùn)練。
作為技術(shù)研究人員,何曉冬坦言大模型的應(yīng)用仍然存在三個問題,“首先,由于數(shù)據(jù)和算力限制,如果簡單的提升模型規(guī)模,可能很快達(dá)到發(fā)展天花板,導(dǎo)致大模型所產(chǎn)生的價值不足以支撐本身的成本,從而難以持續(xù);其次,目前大模型的商業(yè)化步伐落后于模型的規(guī)模增長,從中長期來看終究會成為一個問題。最后,目前很多模型的幻覺率還是很高,不能為后續(xù)的產(chǎn)業(yè)應(yīng)用提供堅實的保障。”
大模型有很強(qiáng)的冗余度,對參數(shù)量要求很高,但是對于參數(shù)的精度要求不高,為了訓(xùn)練出合適的模型,京東云團(tuán)隊正在探索科學(xué)高效地通過壓縮參數(shù)表征,在壓降參數(shù)精度的同時保證模型效果。
在控制大模型幻覺的問題上,幻覺可以表現(xiàn)成Sora東京街頭女子漫步視頻中一瞬間左腳和右腳的扭曲,在娛樂化場景這是可以接受的,但是真實產(chǎn)業(yè)應(yīng)用時,是不能接受數(shù)字人眼睛突然多一個或者少一個這類幻覺的出現(xiàn)。因此,要清晰地分清楚研究和應(yīng)用。“研究是面向星辰大海,面向未來的,肯定是要探索各種各樣的可能性,包括對抗學(xué)習(xí),包括價值觀對齊這些事情。但是在應(yīng)用的時候,要把這些都翻譯成真正產(chǎn)業(yè)能看到價值的產(chǎn)品。”何曉冬認(rèn)為。
“這個技術(shù)會帶來什么樣的實際價值,是帶來探索性的價值,還是商業(yè)化的價值?當(dāng)你想清楚以后,在安排資源,商業(yè)路線和技術(shù)路線的時候,就很清晰。”何曉冬說,“這才既能夠在技術(shù)上持續(xù)有新的探索和突破,也能夠在商業(yè)上得到閉環(huán),進(jìn)而才能保證更多的資源投入。我們在探索的,也是能夠達(dá)到兩條腿平衡往前走。”
對中國AI企業(yè)來說,一些好的變化正在發(fā)生,也有更多挑戰(zhàn)等待2025年去回答。
自閉癥治療有一個特別突出的痛點,它沒有藥物,全部都要靠人工干預(yù)。而自閉癥的數(shù)字療法主要就是做兩件事,一是重構(gòu)客觀世界,二是重構(gòu)社交場景。
隨著AI技術(shù)的不斷發(fā)展和應(yīng)用場景的不斷拓展,AI玩具市場正逐漸成為一個充滿活力和潛力的新興市場。大模型作為AI玩具的核心技術(shù)支撐,直接決定了玩具的智能化水平、交互體驗和用戶體驗。因此,大模型的競爭和創(chuàng)新成為AI玩具市場發(fā)展的重要推動力。
算力資源充足和愿意大力投入是字節(jié)跳動豆包迅速起量的主要原因。
目前,包括通義To C方向的產(chǎn)品經(jīng)理以及相關(guān)的工程團(tuán)隊,已調(diào)整至阿里智能信息事業(yè)群,通義實驗室仍留在阿里云體系內(nèi)。