分享到微信打開(kāi)微信,點(diǎn)擊底部的“發(fā)現(xiàn)”, |
第一財(cái)經(jīng) 2024-09-24 19:25:16 聽(tīng)新聞
作者:呂倩 責(zé)編:寧佳彥
OpenAI發(fā)布的視頻大模型Sora后,國(guó)內(nèi)廠商迅速跟進(jìn),相繼發(fā)布視頻模型產(chǎn)品,包括生數(shù)科技、智譜AI、阿里等。9月24日,字節(jié)跳動(dòng)旗下火山引擎發(fā)布豆包視頻生成-PixelDance、豆包視頻生成-Seaweed兩款大模型,以及豆包音樂(lè)大模型、同聲傳譯模型等產(chǎn)品。
大模型行業(yè)經(jīng)過(guò)2022年年底的震撼、2023年的追趕,2024年的逐漸冷靜,廠商開(kāi)始調(diào)整業(yè)務(wù)方向,由通用型轉(zhuǎn)向應(yīng)用端,由訓(xùn)練側(cè)轉(zhuǎn)向推理側(cè)。對(duì)此,火山引擎總裁譚待對(duì)第一財(cái)經(jīng)記者表示,中國(guó)大模型應(yīng)用之所以沒(méi)有做大,成本是一個(gè)很重要的原因,如今行業(yè)將成本價(jià)格"打"了下來(lái),轉(zhuǎn)向應(yīng)用成為必然。
譚待表示,豆包大模型并不打價(jià)格戰(zhàn),而是讓價(jià)格回歸合理。以豆包大模型為例,截至目前,豆包大模型日均tokens使用量超過(guò)1.3萬(wàn)億,較5月數(shù)據(jù)增長(zhǎng)了10倍。日均生成圖片5000萬(wàn)張,日均處理語(yǔ)音85萬(wàn)小時(shí)。譚待認(rèn)為,當(dāng)大模型價(jià)格不再是阻礙創(chuàng)新的門檻,隨著企業(yè)大規(guī)模應(yīng)用,大模型支持更大的并發(fā)流量正成為行業(yè)發(fā)展的關(guān)鍵因素。
至于降價(jià)帶來(lái)的營(yíng)收壓力,譚待表示,對(duì)To B廠商而言,技術(shù)與產(chǎn)品最重要的是可持續(xù),降價(jià)之后的火山引擎并未負(fù)毛利,至于具體毛利數(shù)據(jù),譚待并未進(jìn)一步披露。
關(guān)于推出視頻大模型的時(shí)間,譚待表示,過(guò)去豆包視頻大模型主要用于集團(tuán)內(nèi)部,內(nèi)部技術(shù)對(duì)外開(kāi)放成為商用業(yè)務(wù)需要時(shí)間,而企業(yè)客戶普遍存在對(duì)安全性與穩(wěn)定性的擔(dān)心。
此前豆包視頻大模型在字節(jié)跳動(dòng)內(nèi)部已配合即夢(mèng)AI與剪映進(jìn)行產(chǎn)品試用,今年7月,全國(guó)首部AIGC生成式連續(xù)性敘事科幻短劇集《三星堆:未來(lái)啟示錄》在抖音上線,由博納影業(yè)(001330.SZ)出品制作,抖音旗下即夢(mèng)AI提供首席技術(shù)支持。此次公開(kāi),技術(shù)層面解決了視頻生成模型大多只能完成簡(jiǎn)單指令的問(wèn)題,可實(shí)現(xiàn)自然連貫的多拍動(dòng)作與多主體復(fù)雜交互。
據(jù)了解,豆包視頻生成模型基于DiT 架構(gòu),通過(guò)DiT融合計(jì)算單元讓視頻在大動(dòng)態(tài)與運(yùn)鏡中自由切換,另外通過(guò)擴(kuò)散模型訓(xùn)練方法攻克了多鏡頭切換的一致性難題,在鏡頭切換時(shí)可同時(shí)保持主體、風(fēng)格、氛圍的一致性。目前豆包視頻大模型落地于電商營(yíng)銷、動(dòng)畫教育、城市文旅、微劇本等企業(yè)場(chǎng)景,也能為專業(yè)創(chuàng)作者和藝術(shù)家們提供創(chuàng)作輔助。
此次豆包大模型發(fā)布產(chǎn)品覆蓋語(yǔ)言、語(yǔ)音、圖像、視頻等全模態(tài),但對(duì)于未來(lái)多模態(tài)AGI的發(fā)展,譚待對(duì)記者表示,現(xiàn)在行業(yè)技術(shù)還需更努力才能勉強(qiáng)摸到AGI的門檻。
作為字節(jié)跳動(dòng)集團(tuán)內(nèi)的產(chǎn)品,此次由火山引擎面向B端客戶推出豆包視頻大模型,也可看出集團(tuán)對(duì)AI2.0時(shí)代下云計(jì)算業(yè)務(wù)的重視。
李飛飛團(tuán)隊(duì)嘗試將模型成本“打下來(lái)”的背后,開(kāi)源、數(shù)據(jù)和技術(shù)的突破都是關(guān)鍵環(huán)節(jié)。
進(jìn)行通用大模型訓(xùn)練的大模型公司數(shù)量在減少。
對(duì)中國(guó)AI企業(yè)來(lái)說(shuō),一些好的變化正在發(fā)生,也有更多挑戰(zhàn)等待2025年去回答。
蘋果正在打破不輕易降價(jià)的傳統(tǒng)。
自閉癥治療有一個(gè)特別突出的痛點(diǎn),它沒(méi)有藥物,全部都要靠人工干預(yù)。而自閉癥的數(shù)字療法主要就是做兩件事,一是重構(gòu)客觀世界,二是重構(gòu)社交場(chǎng)景。