![]()
現在無論哪一家要發布視頻模型,都免不了要被拉來和 Seedance 2.0 對比。
而最近比較沉寂的 Google,似乎在悄悄憋一個大招,來重奪視頻生成的王座。
今天凌晨,有網友在 Gemini 中意外觸發了一個全新的視頻生成模型——Omni(全能)。
在 Gemini 的聊天頁面,直接顯示著「用 Gemini Omni 來創作,認識一下我們全新的視頻生成模型。重混你的視頻、在對話中直接進行編輯、嘗試豐富的模板,以及更多功能。」
![]()
▲得到意外訪問的 Gemini 截圖
不過,這位網友表示他再次打開 Gemini 應用時,不僅 Omni 功能沒了,Gemini 界面也恢復到了舊版。
從目前泄露的初測結果來看,Gemini Omni 在某些場景下的表現,相當出色,很有當年 Nano Banana 一統圖片生成的感覺。
曝光的兩個測試案例里,就像 Nano Banana 解決文本渲染一樣,Gemini Omni 也解決了此前 AI 視頻生成的兩個痛點:文本連貫性和人物進食的物理邏輯。
![]()
▲ 視頻來源:X@chetaslua|提示詞:A professor writes out a mathematical proof for trigonometric identities on a traditional chalkboard, explaining the step he is currently on in the equation.
這個挑戰復雜數學板書的 10s 視頻,提示詞只有一句話「一位教授在傳統的黑板上寫出三角恒等式的數學證明,并解釋他目前在方程式中執行的步驟。」
盡管在畫面中依然能找到一些 AI 生成的小破綻,但整個視頻完美處理好了黑板上的「文本」內容,這是曾經很多視頻模型的一個大 Bug,此外,視頻整體的真實感也非常強。
網友們對這個視頻的態度是「太瘋狂了」,AI 超創博主@Azed_ai 也在爆料視頻下留言,「如果這是實際輸出,那么文本一致性確實令人難以置信。」
![]()
▲ 視頻文件鏈接:https://gemini.google.com/share/7d5dc678c80a
有網友質疑這個視頻的來源,可能并不是由 Gemini Omni 生成的,爆料的博主直接放上了 Gemini 的官方鏈接。
我們把同樣的提示詞丟給 Seedance 2.0 進行測試,畫面的真實感同樣可圈可點,但是板書的內容,似乎和三角恒等式的關系不是很大,黑板上的一些文字渲染還是有問題。
![]()
▲由 Seedance 2.0 生成
另一個爆料的視頻是致敬「威爾·史密斯吃意大利面」,這個測試案例幾乎成了所有視頻生成模型的必跑提示詞之一。
![]()
▲ 來源:Reddit@Zacatac_391|提示詞:Can you create a scene with two men at a table seaside at an upscale restaurant on outdoor deck seating. They are at a circular table with a nice white table cloth, and all of the fancy accessories, all the spoons forks and knives, fancy napkins, centerpiece. One man is Distinguished: A mature African-American man in his 50s with a short beard and confident posture, wearing a tailored, sophisticated suit, the other is is friend, both approaching the table to eat a plate of spaghetti. In the beginning the men approach the table, exchange brief niceties, and begin to eat the spaghetti calmly In between bites sharing conversation.
獲得提前訪問的測試者表示,當他嘗試輸入威爾·史密斯意大利面測試時,被 Google 的內容生成護欄限制了,所以他描述了一個長相酷似威爾·史密斯的人。
Gemini Omni 生成的這個視頻,雖然比 Google 自家的視頻生成模型 Veo 3.1 更好,從聲音和畫面真實質量上,都更像真人視頻。
但也有網友發現,他們站著的時候,盤子里沒有意大利面,但是坐下來之后就有了,緊接著是吃的時候,根本沒吃,意大利面就沒了。
我們同樣把這套提示詞交給 Seedance 處理,在吃的時候,結果比 Gemini Omni 的表現要自然不少。
![]()
▲ 由 Seedance 2.0 生成|提示詞:你能想象兩個男人在海邊一家高檔餐廳的露天餐桌旁用餐的場景嗎?他們圍坐在鋪著潔白桌布的圓桌旁,桌上擺放著各種精致的餐具,包括勺子、叉子、刀叉、漂亮的餐巾和中心裝飾品。其中一位男士風度翩翩:一位五十多歲、成熟穩重的非裔美國男士,留著短須,身著剪裁合身的精致西裝,姿態自信。另一位是他的朋友,兩人都來到桌邊,準備享用一盤意大利面。一開始,兩人走到桌邊,簡單地寒暄了幾句,然后開始平靜地吃意大利面,并不時地閑聊幾句。
在 Reddit 上有網友質疑他是否有用過最新的視頻生成模型,這位測試博主表示他用過最好的是 Kling 3.0。
網友回復他說,Seedance 2.0 要比 Kling 3.0 好上不少,所以 Gemini Omni 的表現對我(用過 Seedance 2.0 的人)來說一點都不驚訝。
而在 X 上,也有網友認為 Gemini Omni 的表現,要比 Seedance 2.0 更好。
![]()
▲ X 上不少網友轉發這些爆料視頻,表示效果要勝過 Seedance
更讓人意外的時候,Google 這次不只是推出視頻生成的功能,Gemini Omni 還支持視頻的編輯功能。
像是可以把原視頻中的意大利面,直接替換成一碗像是冬陰功的泰式風味湯。
![]()
還能把之前 Sora 生成的帶水印視頻,直接編輯為去掉水印。
![]()
![]()
▲視頻來源:X@Waguri_Kaoruko8
從測試結果來看,Gemini Omni 成功地把原 Sora 視頻中,持續移動的 Sora 水印去掉了,并保持和原視頻基本一致。
還有網友測試了 Gemini Omni 在動漫視頻生成上的表現。
![]()
和初代的 Nano Banana 主打圖片編輯,讓我們制作各種桌面手辦一樣。不少人也認為 Gemini Omni 也會走這樣的路,視頻生成能力較差,但視頻編輯能力會更強,要等到 Gemini Omni 3 代,可能視頻生成能力才是最好的。
在曝光的界面中,還出現了一個使用量(Usage)截圖。數據顯示,僅僅生成了數學板書和吃面兩個視頻,就耗費了該用戶 AI Pro 訂閱計劃每日額度的 86%,他提到自己當天只是使用過一些 Gemini Flash。
![]()
AI 視頻顯然還是一門相當燒錢的生意,但只要效果足夠好,買單的人不會少。
這段時間,一些 AI 視頻在網絡上爆火,不僅有更長的時長、更真實的場景、對話、演技、故事性都比去年爆火的那些 AI 視頻要強。
視頻生成平臺 Runway 的技術美術師 Marko Slavnic 在 X 上發一了段用 Runway 制作的的鴿子視頻,Runway 上可以使用 Seedance 2.0 模型,視頻很快就獲得了百萬次瀏覽。
有網友說,這段 47s 的視頻完全沒發現任何 AI 的痕跡或不自然的動作,迪士尼動畫可能真的需要警惕了。
![]()
▲ 視頻來源:X@Markoslavnic
還有之前在微博熱搜上的話題「AI 短片 量產愛死機」,視頻被轉載到外網后,也直接沖到了 1200 萬次觀看。
轉發這個視頻的是一位生成式 AI 視頻與廣告領域的創作者,同時也是一家 AI 廣告公司的創始人 PJ Ace。他直接說,
這是我近年來看過最好的短片之一。 很快,我們將不再稱其為「AI 電影」,而直接稱其為電影。
![]()
▲ 視頻來源:X@PJaccetturo
而在原視頻的 B 站評論區里,也有網友提到視頻非常火,不僅有國外的 PJ Ace 想發 Offer,也有廣州的 AI+ 創作團隊向他伸出了橄欖枝。
對視頻的好評也是毫不吝嗇地表達,「這是預告片我會去電影院」、「一流的作品,色彩、構圖、劇情都無可挑剔,除了時長稍短,放在任何一季愛死機里都不突兀。」、「幾年前這要一個頂級團隊花費幾個月幾百萬做出來」……
![]()
▲ 視頻來源:【Ai原創短片《喪尸清道夫》-重制版,國產“愛死機”!】https://www.bilibili.com/video/BV1FFRQB2Eqw/
和以前每月推薦幾部電影一樣,現在也有網友開始總結「本月四部不容錯過的 AI 短片」。
![]()
除了那些被詬病為是 AI Slop 的內容,隨著生成質量的提升,AI 視頻開始成為主流的媒介是無法避免的趨勢。
Google 此次曝光的 Gemini Omni 或許也是為了給下周即將舉行的 Google I/O 大會造勢,如果能在今年的大會上,看到 Gemini Omni 開放,新的 AI 視頻生成下半場又將開啟。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.