分享到微信打開微信,點擊底部的“發(fā)現(xiàn)”, |
當?shù)貢r間5月14日,OpenAI發(fā)布最新多模態(tài)大模型GPT-4o。OpenAI首席技術(shù)官穆拉蒂 (Muri Murati) 介紹稱,該模型運行速度更快,并具備更強的文本、圖像以及語音處理能力,將免費向所有用戶開放。OpenAI還表示,未來將允許用戶與ChatGPT進行視頻聊天。
硅谷連續(xù)創(chuàng)業(yè)者、Traini創(chuàng)始人及CEO孫鄰家在接受第一財經(jīng)記者采訪時表示,OpenAI的最新發(fā)布將交互方式進行了升級、變革。“語音正在成為一個較穩(wěn)定的接口,擴寬人類與產(chǎn)品交互的物理邊界。而且與GPT實時對話時,GPT能富有情感地回應(yīng),這個很酷,之前AGI是缺乏情感的。”他還表示,人工智能(AI)領(lǐng)域正在往AI應(yīng)用方向發(fā)展,將給生活創(chuàng)造真實價值。
萬眾矚目的視頻生成模型Sora在2024年底正式向用戶開放,而隨著近一年來DiT技術(shù)的井噴式爆發(fā),大批優(yōu)秀的視頻模型平臺也在過去一年紛紛涌現(xiàn)。從物理規(guī)律、語義正確、場景一致等多個維度,各視頻生成平臺使用起來表現(xiàn)如何?業(yè)內(nèi)人士表示,當前視頻模型的性能表現(xiàn)各有千秋,而國產(chǎn)模型則已經(jīng)在過去近一年的時間里追平了與全球頂級產(chǎn)品的代際差。AI視頻生成行業(yè)當前處于怎樣的發(fā)展階段?未來又將面臨怎樣的問題和挑戰(zhàn)?