分享到微信打開微信,點(diǎn)擊底部的“發(fā)現(xiàn)”, |
第一財(cái)經(jīng)2024-05-14 14:17:37
作者:李愛琳 責(zé)編:馮迪凡
當(dāng)?shù)貢r(shí)間5月14日,OpenAI發(fā)布最新多模態(tài)大模型GPT-4o。OpenAI首席技術(shù)官穆拉蒂 (Muri Murati) 介紹稱,該模型運(yùn)行速度更快,并具備更強(qiáng)的文本、圖像以及語(yǔ)音處理能力,將免費(fèi)向所有用戶開放。OpenAI還表示,未來(lái)將允許用戶與ChatGPT進(jìn)行視頻聊天。
硅谷連續(xù)創(chuàng)業(yè)者、Traini創(chuàng)始人及CEO孫鄰家在接受第一財(cái)經(jīng)記者采訪時(shí)表示,OpenAI的最新發(fā)布將交互方式進(jìn)行了升級(jí)、變革。“語(yǔ)音正在成為一個(gè)較穩(wěn)定的接口,擴(kuò)寬人類與產(chǎn)品交互的物理邊界。而且與GPT實(shí)時(shí)對(duì)話時(shí),GPT能富有情感地回應(yīng),這個(gè)很酷,之前AGI是缺乏情感的。”他還表示,人工智能(AI)領(lǐng)域正在往AI應(yīng)用方向發(fā)展,將給生活創(chuàng)造真實(shí)價(jià)值。
萬(wàn)眾矚目的視頻生成模型Sora在2024年底正式向用戶開放,而隨著近一年來(lái)DiT技術(shù)的井噴式爆發(fā),大批優(yōu)秀的視頻模型平臺(tái)也在過(guò)去一年紛紛涌現(xiàn)。從物理規(guī)律、語(yǔ)義正確、場(chǎng)景一致等多個(gè)維度,各視頻生成平臺(tái)使用起來(lái)表現(xiàn)如何?業(yè)內(nèi)人士表示,當(dāng)前視頻模型的性能表現(xiàn)各有千秋,而國(guó)產(chǎn)模型則已經(jīng)在過(guò)去近一年的時(shí)間里追平了與全球頂級(jí)產(chǎn)品的代際差。AI視頻生成行業(yè)當(dāng)前處于怎樣的發(fā)展階段?未來(lái)又將面臨怎樣的問(wèn)題和挑戰(zhàn)?