分享到微信打開微信,點擊底部的“發(fā)現(xiàn)”, |
OpenAI文生視頻AI工具Sora已發(fā)布數(shù)十個視頻,展現(xiàn)了AI文生視頻的新可能。第一財經(jīng)記者了解到,隨著多個文生圖、文生視頻軟件發(fā)布,已有不少視頻制作者開始制作AI視頻。
例如,近日發(fā)布的一個用AI技術(shù)生成的《西游記》近4分鐘動畫短片展現(xiàn)了石猴從降生到拜師學(xué)藝的過程,花果山水簾洞內(nèi)的水流、植物和擺設(shè)錯落,天庭依山而建,視頻還展示了孫悟空乘船前往城鎮(zhèn)、來到靈臺方寸山的過程。畫面中,山巒煙霧繚繞,水面有落葉等細節(jié),街景呈現(xiàn)了古代著裝的行人、門樓和商店。這段視頻發(fā)布在抖音和bilibili上,在bilibili有超70萬觀看。另一個與AI制作的《大鬧天宮》預(yù)告片在bilibili上有超100萬播放量,畫面中,天庭的座椅、服飾透露著莊嚴,鏤空的器皿顯現(xiàn)出設(shè)計細節(jié),人物面部表情自然。
一些AI制作的MV或預(yù)告片、宣傳片也在視頻平臺上獲得數(shù)十萬播放量。例如,一個動物版《恭喜發(fā)財》MV有多個小狗穿著紅色傳統(tǒng)服飾的畫面,并演奏多種樂器、騎自行車、寫毛筆字,畫面細節(jié)豐富,動物毛發(fā)細節(jié)清晰。廣西衛(wèi)視也在網(wǎng)上放出了全AI制作的龍年宣傳片。據(jù)記者觀察,這些AI視頻的共同點是畫面清晰且富有細節(jié),但每個分鏡的時長只有幾秒,人物講話時還未能匹配適合的嘴型,畫面的連貫性和敘事性相比影視仍存在距離,這些特點使目前AI視頻更適合制作預(yù)告片、MV等對敘事要求不高、對畫面沖擊力要求較高的中短視頻。
與視頻創(chuàng)作者已在使用的多個AI視頻制作工具不同,Sora在視頻時長上有明顯優(yōu)勢,可直接生成60秒視頻,但Sora目前還未對外開放使用。記者發(fā)現(xiàn),不少AI制作視頻都使用AI繪圖工具先生成圖片,再使用圖生視頻工具生成AI視頻。例如,以上近4分鐘的《西游記》動畫的創(chuàng)作工具是AI繪圖工具Midjourney和圖生視頻工具Runway,構(gòu)思階段采用了ChatGPT分析原著文字并規(guī)劃分鏡,隨后通過剪映剪輯。以上《大鬧天宮》預(yù)告片也使用Midjourney和Runway制作,劇本設(shè)計使用了大語言模型輔助。
發(fā)布以上《西游記》動畫的博主“AI瘋?cè)嗽?rdquo;從事美術(shù)工作15年,他表示,該視頻如果人工制作至少需要半年,而自己在AI的幫助下一周就完成了。但他同時指出,繪圖和圖片生成視頻的過程還會產(chǎn)生廢稿,AI還很難完全理解創(chuàng)作者的意圖,存在隨機性。發(fā)布《大鬧天宮》預(yù)告片的博主則在評論中稱,AI迭代太快,要做成三個半小時的電影預(yù)計可以在兩年內(nèi)。但也有網(wǎng)友針對AI視頻評論稱,AI生成仍顯得僵硬、像PPT、風格仍不夠貼合主題。
市面上目前可生成AI視頻的工具還包括谷歌Gemini、阿里云12VGen-XL等。阿里云在一個視頻中介紹,生成視頻不需美術(shù)和編導(dǎo)基礎(chǔ),創(chuàng)作者可以在魔搭創(chuàng)空間找到MotionAgent AI應(yīng)用,通過該應(yīng)用,在生成劇本時用到Qwen-7B-Chat大模型,在文生圖時使用Stability的SDXL模型,再由圖片生成視頻,阿里云的視頻生成軟件是開源的12VGen-XL,音樂也可以通過提示詞AI生成。
有影視制作者向第一財經(jīng)記者表示,AI技術(shù)已在視頻制作中應(yīng)用,在平面設(shè)計上效果很好,但在AI視頻中,目前逐幀光影銜接還有問題,從Sora放出的視頻看,也存在逐幀的銜接問題。
2023年至今,與AI視頻、圖片相關(guān)的技術(shù)還在持續(xù)迭代。例如,此前香港科技大學(xué)、螞蟻團隊、浙江大學(xué)CAD&CG實驗室合作的項目CoDeF,其算法能根據(jù)提示詞對視頻進行風格轉(zhuǎn)換,香港大學(xué)、阿里巴巴和螞蟻集團的新成果Anydoor可實現(xiàn)圖片中物體瞬間移動,學(xué)界還有研究團隊探索圖像修復(fù)和還原技術(shù)。
抄底英偉達與否并非核心問題,關(guān)鍵在于技術(shù)的發(fā)展將加速“模型平價”(model parity),這將惠及更多消費者。
OpenAI CEO奧爾特曼于2月3日抵達東京與孫正義會面,他們還將共同與日本首相石破茂會面。
特朗普稱DeepSeek“給美國相關(guān)產(chǎn)業(yè)敲響了警鐘”。
國內(nèi)大模型春節(jié)前迎來密集發(fā)布周;全球手機用戶為AI應(yīng)用支出達12.7億美元。
這款智能體可以處理重復(fù)的瀏覽器任務(wù),比如填寫表格、訂購雜貨、創(chuàng)建表情包等。