亚洲中文字乱码免费播放,精品国产日韩专区欧美第一页,亚洲中文有码字幕青青,亚洲综合另类专区在线

<var id="a5xqz"><ins id="a5xqz"></ins></var>

<dfn id="a5xqz"></dfn><strike id="a5xqz"></strike>

<menuitem id="a5xqz"></menuitem>

首頁 > 新聞 > 科技

分享到微信

打開微信，點擊底部的“發(fā)現(xiàn)”，
使用“掃一掃”即可將網(wǎng)頁分享至朋友圈。

谷歌新技術(shù)可用AI模型為無聲視頻配音

第一財經(jīng) 2024-06-19 09:09:18

作者：一財科技責(zé)編：李娜

該“video-to-audio”模型可以為任何視頻生成無限數(shù)量的音軌。

谷歌DeepMind 近日公布了一項利用 AI 為無聲視頻生成背景音樂的“video-to-audio”技術(shù)。

當(dāng)前 DeepMind 這款 AI 模型依然存在局限性，需要開發(fā)者使用提示詞為模型預(yù)先“介紹”視頻可能的聲音，暫時不能直接根據(jù)視頻畫面添加具體音效。

據(jù)悉，該模型首先會將用戶輸入的視頻進(jìn)行拆解，此后結(jié)合用戶的用戶文字提示，利用擴散模型反復(fù)運算，最終以生成與視頻畫面協(xié)調(diào)的背景聲音，例如輸入一條“在黑暗中行走”的無聲視頻，再添加“電影、恐怖片、音樂、緊張、混凝土上的腳步聲”等文字提示，相關(guān)模型就能生成恐怖風(fēng)格的背景音效。

DeepMind 同時表示，該“video-to-audio”模型可以為任何視頻生成無限數(shù)量的音軌，還能夠通過提示詞內(nèi)容判斷生成的音頻“正向性”或“反向性”，從而令生成的聲音更貼近某些特定場景。

舉報

第一財經(jīng)廣告合作，請點擊這里

此內(nèi)容為第一財經(jīng)原創(chuàng)，著作權(quán)歸第一財經(jīng)所有。未經(jīng)第一財經(jīng)書面授權(quán)，不得以任何方式加以使用，包括轉(zhuǎn)載、摘編、復(fù)制或建立鏡像。第一財經(jīng)保留追究侵權(quán)者法律責(zé)任的權(quán)利。如需獲得授權(quán)請聯(lián)系第一財經(jīng)版權(quán)部：021-22002972或021-22002335；banquan@yicai.com。

文章作者

一財科技

相關(guān)閱讀

因服務(wù)器資源緊張，DeepSeek已暫停API服務(wù)充值

因服務(wù)器資源緊張，DeepSeek已暫停API服務(wù)充值

90 昨天 17:46

獨家對話OpenAI原應(yīng)用負(fù)責(zé)人卡斯： DeepSeek加速AI平價化

抄底英偉達(dá)與否并非核心問題，關(guān)鍵在于技術(shù)的發(fā)展將加速“模型平價”（model parity），這將惠及更多消費者。

369 02-05 21:42

第一財經(jīng)星翼大模型聯(lián)動DeepSeek，財經(jīng)智能體服務(wù)能力再升級

第一財經(jīng)星翼大模型以DeepSeek V2.5為基座模型，結(jié)合多模態(tài)能力和財經(jīng)專業(yè)數(shù)據(jù)，提供智能化財經(jīng)信息服務(wù)。

638 02-01 19:24

谷歌發(fā)布推理模型Gemini 2.0 Flash Thinking

該模型可以通過可視化的方式展示整個思維鏈過程，能持續(xù)輸出全部推理過程，而不是直接給出答案。

41 2024-12-20 08:47

2025年火車票明天起售

2025年火車票明天起售

0 2024-12-17 08:30

一財最熱

點擊關(guān)閉

<track id="imsyc"></track>