亚洲中文字乱码免费播放,精品国产日韩专区欧美第一页,亚洲中文有码字幕青青,亚洲综合另类专区在线

首頁 > 新聞 > 科技

分享到微信

打開微信，點擊底部的“發(fā)現(xiàn)”，
使用“掃一掃”即可將網(wǎng)頁分享至朋友圈。

Sora迎來新競爭者！Luma AI推出視頻生成模型，用戶涌入網(wǎng)站需排隊

第一財經(jīng) 2024-06-13 19:11:53 聽新聞

作者：鄭栩彤責編：寧佳彥

或是因為網(wǎng)站涌入用戶量過多，記者看到，Luma AI網(wǎng)站顯示“因需求量大，請求將排隊”。

Sora還未開放公測，視頻生成領(lǐng)域迎來了新的競爭者。當?shù)貢r間6月12日，AI初創(chuàng)公司Luma AI發(fā)布視頻生成模型Dream Machine，該視頻生成模型支持文生視頻和圖生視頻模式，目前可免費試用?；蚴且驗榫W(wǎng)站涌入用戶量過多，記者看到，其官網(wǎng)顯示“因需求量大，請求將排隊”。

從Luma AI官方放出的視頻看，Dream Machine生成視頻的質(zhì)量頗高。例如，眼部特寫可看清眼球中變幻的色彩，老虎在雪地中行走動作自然，臉部特寫光影斑駁、鏡頭移動自然，人物動作銜接流暢。已有網(wǎng)友在社交平臺上放出用Dream Machine制作的視頻，畫面看上去頗為真實，例如，北極熊在野外行走時毛發(fā)自然，沙漠中的汽車揚起沙粒。

Luma AI官方發(fā)布的視頻截圖

記者將“In Japanese comic style, a girl stands in a train, gazing out at the autumn scenery outside the window”（日本漫畫風格，一個女孩站在列車中望向窗外的秋景）提示詞輸入Pika和Dream Machine，從生成的視頻看，后者更勝一籌。Pika的視頻3秒，視頻中的女孩站在列車外而不是列車內(nèi)，列車經(jīng)過時圖像有所變形，且風格不符合描述。Dream Machine單個視頻時長5秒，人物位于列車內(nèi)，風格更貼切。

Pika生成的列車與女孩視頻

Dream Machine生成的列車與女孩視頻

據(jù)Luma AI官網(wǎng)介紹，Dream Machine可生成120秒120幀的視頻。Luma AI同時指出Dream Machine的限制所在，包括畫面中動作還會變形，主體運動動作不夠合理等，例如一條狗在路上行走時腳不沾地、北極熊的頭更換了位置。目前，免費用戶每個月可生成30次視頻，付費用戶一個月有120~2000次機會生成視頻，一個月收費29.99~499.99美元。

Luma AI成立于2021年，創(chuàng)始人兼CEO Amit Jain曾是蘋果計算機視覺工程師，聯(lián)合創(chuàng)始人Alex Yu畢業(yè)于加州大學伯克利分校。Luma AI經(jīng)歷多輪融資，A輪融資籌集了2000萬美元，英偉達投資部門參與了此輪融資。B輪融資籌集金額4300萬美元，英偉達、風投機構(gòu)Andreessen Horowitz參與了此輪融資。2023年，Luma AI曾推出一款名為Genie的工具，用于將2D圖片生成3D模型。

文生視頻、文生圖領(lǐng)域進展近日有所加快。當?shù)貢r間6月12日，Stability AI開源了Stable Diffusion 3 Medium。Stability AI稱，該模型是Stable Diffusion 3系列中最新、最先進的文本轉(zhuǎn)圖像模型，有20億參數(shù)，在非商業(yè)情況下可免費試用，商用場景下面向藝術(shù)家、設計師等提供創(chuàng)作者許可證。Stable Diffusion 3采用與Sora相同的底層架構(gòu)DiT（融合了Transformer和Diffusion）。

記者了解到，文生圖和視頻生成模型邁向成熟的一個關(guān)鍵是，技術(shù)路線都朝著Transformer+Diffusion的方向演進，相比Diffusion，Transformer+Diffusion可實現(xiàn)較好的擴展性。從文生圖到視頻生成模型則存在一定的演進關(guān)系。

與Luma AI相似，國內(nèi)AI創(chuàng)業(yè)企業(yè)生數(shù)科技在進入視頻生成領(lǐng)域前聚焦的方向也是3D，其選擇的技術(shù)路徑也是融合Transformer和Diffusion的U-ViT框架。除了Stable Diffusion 3 Medium開源，5月騰訊也開源了DiT架構(gòu)的混元文生圖模型Hunyuan-DiT。一名資深視頻生成行業(yè)人士告訴記者，業(yè)內(nèi)Trnsformer+Diffusion的路徑相對比較成熟，但視頻生成算法成熟度仍有限，廠商間技術(shù)方向彼此沒有太大的差別，差別可能在于所能投入的資金。

舉報

第一財經(jīng)廣告合作，請點擊這里

此內(nèi)容為第一財經(jīng)原創(chuàng)，著作權(quán)歸第一財經(jīng)所有。未經(jīng)第一財經(jīng)書面授權(quán)，不得以任何方式加以使用，包括轉(zhuǎn)載、摘編、復制或建立鏡像。第一財經(jīng)保留追究侵權(quán)者法律責任的權(quán)利。
如需獲得授權(quán)請聯(lián)系第一財經(jīng)版權(quán)部：banquan@yicai.com

文章作者

鄭栩彤

相關(guān)閱讀

生數(shù)科技朱軍：視頻模型更期待“ChatGPT時刻”

廠商期待視頻模型更加可控與好用，步入視頻領(lǐng)域的“ChatGPT時刻”。

為Sora氪金200美元后，AI創(chuàng)作者們后悔嗎？

從這次推出的Sora來看，視頻生成賽道還未拉開差距。

508 2024-12-19 10:54

火山引擎推出視覺理解模型，豆包通用模型pro完成新版本迭代

火山引擎除了推出視覺理解模型之外，還發(fā)布、升級了多個其他模型。

99 2024-12-18 13:51

AI周報| OpenAI最大“期貨”Sora開放使用；谷歌發(fā)布量子芯片突破

中央經(jīng)濟工作會議提“人工智能+”，全球首個AI程序員Devin全面開放。

156 2024-12-15 10:28

OpenAI最大“期貨”Sora開放使用，面臨近20個競爭對手挑戰(zhàn)

10個月前掀起視頻生成熱潮的Sora開放使用了，現(xiàn)在它要面對近20個競爭對手。

458 2024-12-10 11:42

一財最熱

點擊關(guān)閉