分享到微信打開微信,點(diǎn)擊底部的“發(fā)現(xiàn)”, |
第一財(cái)經(jīng) 2024-07-05 13:26:20 聽新聞
作者:劉曉潔 責(zé)編:寧佳彥
7月5日,在商湯舉辦的“大愛無疆·向新力”論壇上,商湯科技董事長徐立在現(xiàn)場發(fā)布了大模型“日日新5o”,交互體驗(yàn)對標(biāo)OpenAI最新發(fā)布的 GPT-4o。
實(shí)時(shí)交互能力背后的支撐來自于商湯最新的基座模型。在會上商湯同時(shí)宣布大模型迭代到“日日新5.5”,其綜合性能較上一代“日日新5.0”平均提升30%,在數(shù)學(xué)推理、英文能力和指令跟隨等能力明顯增強(qiáng)。
據(jù)介紹,通過整合跨模態(tài)信息,基于聲音、文本、圖像和視頻等多種形式,“日日新5o”可以帶來全新的AI交互模式,即實(shí)時(shí)的流式多模態(tài)交互。
對標(biāo)OpenAI和谷歌此前的產(chǎn)品發(fā)布會,商湯也在論壇上搭臺進(jìn)行了模型交互能力的現(xiàn)場演示。商湯工作人員舉起手機(jī)與“日日新5o”打招呼后,它能識別出工作人員脖子佩戴的胸卡,判斷這是一個(gè)大會會場。
工作人員進(jìn)一步測試了“日日新5o”識物能力,將手機(jī)對準(zhǔn)帶有商湯LOGO的安全帽,模型能夠識別出這與某個(gè)品牌或公司有關(guān),將手機(jī)對準(zhǔn)一個(gè)玩偶,模型回復(fù)稱,“小兔玩具超可愛的,像穿著警服的卡通警察,白身子粉耳朵,紫眼珠特靈動,嘴邊紅點(diǎn)點(diǎn)綴,俏皮又逗趣。”
工作人員還將手機(jī)對準(zhǔn)了書,讓模型介紹書名和內(nèi)容,另外對準(zhǔn)某一頁書,模型也能概括這頁大概的內(nèi)容。根據(jù)記者在現(xiàn)場的感受,在交互反饋上,人類與模型問答間隔的時(shí)間大概在2-3秒。
值得一提的是,在7月4日的產(chǎn)業(yè)發(fā)展主論壇上,徐立在發(fā)表演講時(shí)提到,要推動人工智能超級時(shí)刻的到來,大模型需要具備更卓越的思維能力、更自然的交互能力以及更可控的生成能力。
“我一直的觀點(diǎn)是,雖然我們的行業(yè)非常熱,包括像ChatGPT帶來了聊天式的應(yīng)用,Sora帶來了視頻,但它還沒有到超級時(shí)刻,是因?yàn)樗鼪]有真正走進(jìn)到一個(gè)行業(yè)的垂直應(yīng)用中引起廣泛的變化。”徐立認(rèn)為,實(shí)時(shí)的交互性能夠帶來流暢的體驗(yàn),也是帶來超級時(shí)刻以及推動應(yīng)用變化的一個(gè)核心。
針對“日日新5o”背后的基座大模型,商湯介紹,日日新5.5基于超過10 TB tokens數(shù)據(jù)訓(xùn)練,包括大量人工合成數(shù)據(jù),數(shù)據(jù)構(gòu)造從基礎(chǔ)知識轉(zhuǎn)向合成思維鏈,在數(shù)學(xué)、推理、長文本、編程等多個(gè)維度都有大幅提升。此外,模型采用混合端云協(xié)同架構(gòu),可最大限度發(fā)揮云邊端協(xié)同。
在演講最后,徐立在現(xiàn)場特別提到了“大模型0元Go”計(jì)劃,稱凡是“日日新”的新注冊用戶,都可獲得涉及調(diào)用、遷徙、訓(xùn)練等多項(xiàng)免費(fèi)服務(wù)大禮包。同時(shí),商湯表示將免費(fèi)贈送5000萬Tokens包,并且派出專屬搬家顧問,幫助OpenAI用戶實(shí)現(xiàn)零服務(wù)成本遷移。
對中國AI企業(yè)來說,一些好的變化正在發(fā)生,也有更多挑戰(zhàn)等待2025年去回答。
據(jù)了解,這個(gè)項(xiàng)目已幫助了包括沈莉在內(nèi)的全國百余位患者,影響范圍跨越17省20余城。
自閉癥治療有一個(gè)特別突出的痛點(diǎn),它沒有藥物,全部都要靠人工干預(yù)。而自閉癥的數(shù)字療法主要就是做兩件事,一是重構(gòu)客觀世界,二是重構(gòu)社交場景。
徐立提到,商湯過去這段時(shí)間進(jìn)行的組織調(diào)整,是為了更好地應(yīng)對AI 2.0時(shí)代所帶來的機(jī)遇與挑戰(zhàn)。
端到端大模型的加入將加速不同企業(yè)之間的分化。