无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

LiveWorld:視頻世界模型新范式,讓鏡頭之外的世界繼續演化

0
分享至







視頻鏈接:https://mp.weixin.qq.com/s/IBAIk3TPzS_UExnHCtNUwg

  • 論文標題:LiveWorld: Simulating Out-of-Sight Dynamics in Generative Video World Models
  • 項目主頁:https://zichengduan.github.io/pages/LiveWorld/index.html
  • 文章鏈接:https://arxiv.org/abs/2603.07145
  • 代碼鏈接:https://github.com/ZichengDuan/LiveWorld

世界模型正在成為通向通用智能的重要方向。借助視頻生成模型強大的視覺先驗,這類系統可以根據當前觀察、文本提示和相機軌跡,模擬一個能夠被持續探索的虛擬環境,并服務于智能體訓練、交互式仿真、自動駕駛決策和大規模合成數據生成。

然而,當越來越多的研究開始追求更高的畫質和更精確的相機控制時,一個更基礎的問題仍未得到充分回答:這些模型究竟是在模擬持續運行的世界,還是只是在生成相機當前看到的視頻?

來自阿德萊德大學、澳大利亞國立大學、蒙納士大學、浙江大學與奧克蘭大學的研究者重新審視了現有視頻世界模型的建模方式。他們發現,這類方法普遍把「世界自身如何演化」與「相機在某個視角下看到了什么」交給同一個視頻生成器處理。

這種耦合會帶來一個直接后果:一旦某個物體離開相機視野,模型通常就不再更新它的狀態,而是將其停留在最后一次被看到的時刻。例如,一只狗正在吃東西,觀察者轉頭看向別處,過一會兒再回來?,F實中,狗可能已經吃完并走開;現有模型卻往往再次生成「狗仍在吃東西」的畫面,仿佛相機移開的同時,局部世界也被按下了暫停鍵。

研究者將這一缺失的時間進程定義為「視野外動態」(Out-of-Sight Dynamics),并指出現有視頻世界模型實際上隱含著一種「靜態世界假設」:只有進入相機視野的內容才會繼續變化。為打破這一假設,他們提出了LiveWorld,將世界演化與觀察渲染顯式解耦,使事件在離開視野后仍能持續推進。

LiveWorld:解耦世界演化與觀察渲染

LiveWorld 的出發點很簡單:世界如何變化,不應該由相機正在看哪里決定。因此,它不再讓視頻生成器同時猜測「世界發生了什么」和「相機看到了什么」,而是把兩件事明確拆開:先讓世界狀態隨時間演化,再根據相機軌跡渲染當前觀察。





這一分解也帶來了清晰的系統分工:虛擬監視器(Monitor)負責在固定位置持續模擬局部事件,觀察渲染器(Renderer)負責從移動相機的視角呈現更新后的世界。二者雖然職責不同,本質上都屬于「給定狀態與條件生成視頻」,因此 LiveWorld 使用同一個基于 Wan2.1-14B-T2V 的狀態條件視頻擴散骨干實現兩種功能。

方法設計

沿著上述思路,LiveWorld 的運行過程可以理解為一條持續循環的流水線:發現需要跟蹤的動態實體,讓它們在視野外繼續演化,同時積累靜態場景;當相機再次經過時,再把二者組合成最新畫面。具體包含以下四個環節:

  • 為動態事件設置虛擬監視器。每輪生成前,系統使用 Qwen3-VL 和 SAM3 檢查上一段視頻,識別其中可能繼續活動的人、動物或車輛等實體。如果某個新實體所在區域尚未被覆蓋,系統就在該位置注冊一個固定的虛擬監視器(Monitor),并記錄當時的相機位姿與畫面作為錨點。為控制計算開銷,活躍 Monitor 的數量設有上限;超出后,優先移除距離當前觀察者最遠的一個。



  • 在固定視角下推進局部事件。當觀察者轉向別處后,Monitor 仍會繼續工作。它以錨定畫面的靜態背景、裁剪出的實體外觀,以及描述后續動作的文本為條件,生成該區域接下來發生的視頻。例如,狗可以繼續吃完食物并走開,而不是停在最后一次被看到的姿態。生成的前景視頻結合深度信息被還原到三維空間,形成隨時間變化的 4D Monitor 點云。若實體在一輪視頻的中途才出現,系統還會先補齊從出現時刻到當前時刻的狀態,使其與全局時間線同步。
  • 持續積累靜態空間記憶。與動態實體并行,系統會從歷史觀察中分離背景區域,并通過前饋式 SLAM 框架 Stream3R 增量融合為全局 3D 點云。這部分記錄場景中相對穩定的結構,為長期重訪、視角變換和相機控制提供空間基礎。這樣,LiveWorld 不需要反復生成整片世界,只需重點更新真正發生變化的局部區域。
  • 從最新世界狀態渲染觀察。當相機移動或重訪舊區域時,系統先把靜態 3D 點云與已經演化到當前時刻的動態 4D 點云,共同投影到目標相機軌跡上,得到像素級幾何條件。隨后,狀態適配器(State Adapter)將投影結果注入視頻擴散模型,約束物體的位置、結構與運動;外觀 LoRA(Appearance LoRA)則利用檢索到的歷史參考幀補充紋理和身份細節。最終生成的視頻既遵循目標相機運動,也能呈現實體在離開視野期間發生的變化。



由此,LiveWorld 形成了一個閉環:觀察新區域、注冊動態事件、在后臺推進狀態,再從最新狀態生成下一段觀察。它并沒有試圖一次性構建完整的 4D 世界,而是用「靜態場景長期記憶 + 動態實體按需演化」的方式,把視野外動態轉化為一個可計算、可擴展的問題。

實驗驗證



要評估視野外動態,僅比較單段視頻的畫質并不夠。關鍵在于:相機離開后再回來,事件是否已經推進,物體身份是否保持,場景幾何是否仍然一致。為此,研究者構建了首個面向該問題的專門基準LiveBench,包含 100 個場景和 400 條評估序列,并為每個場景配置多輪相機軌跡與文本事件腳本。

LiveBench 包含兩類重訪軌跡:Same-Pose(A→B→A→B→A)要求相機多次回到同一位置,考察長時序狀態變化;Different-Pose(A→B→C)則讓相機從新視角重訪舊區域,同時考察事件演化與三維一致性。研究者將 LiveWorld 與 Matrix-Game-2.0、Hunyuan-GameCraft-1.0 和 Spatia 等開源相機可控世界模型進行了比較。

  • 事件并沒有停在舊畫面里。衡量事件是否按照腳本推進的 VQA-Acc 最能體現這一點。在 Same-Pose 的第二次長時序重訪中,LiveWorld 達到,顯著超過 Spatia(14.655)、GameCraft-1(10.273)和 Matrix-Game-2.0(5.012);在更困難的 Different-Pose 第二次重訪中,LiveWorld 仍達到,而其他方法普遍降至個位數。這表明模型呈現的并非緩存中的舊畫面,而是推進后的事件狀態。
  • 事件變化的同時,物體和空間也能保持一致。第二次重訪時,LiveWorld 的前景 DINO 相似度達到,而 Spatia 為 0.416;動態點云的 Chamfer Distance 降至,優于所有對比方法。背景一致性則與采用顯式 3D 記憶的 Spatia 持平或更優。這說明 LiveWorld 不只會生成符合文本的動作,也能把變化后的實體放回正確的空間位置。



  • 多事件場景進一步檢驗了系統閉環。當多個事件需要在視野外并行推進時,去掉事件演化模塊的版本在最嚴格的 Full Succ. 指標上為0%,完整 LiveWorld 則達到26%。消融實驗還顯示,去掉空間記憶會導致相機控制失效,并在重訪時產生漂移和重影;去掉參考幀后,前景身份和背景外觀都會在長序列中逐漸失穩。性能提升因此并非單純來自更大的生成模型,而是來自動態演化、空間記憶和狀態渲染之間的協同。



  • 消融實驗驗證了各個模塊的作用。移除事件演化后,系統退化為普通的相機可控視頻模型,無法在重訪時呈現已經推進的事件;移除空間記憶后,相機控制和背景幾何明顯惡化,容易出現漂移與重影;移除歷史參考幀后,長序列中的前景身份和背景外觀逐漸失穩。三項結果分別對應時間演化、空間一致性和外觀保持,表明 LiveWorld 的提升來自完整系統設計,而非單純擴大生成模型。

更多可視化結果 —— 多事件重訪與不同位姿重訪



結論與展望

LiveWorld 提出的核心問題是:如果一個世界模型只能更新相機正在觀察的內容,它所建模的仍然只是連續的視頻,而不是持續運行的世界。通過形式化「視野外動態」、顯式拆分世界演化與觀察渲染,并結合靜態 3D 空間記憶和動態 4D 實體狀態,LiveWorld 將視頻世界模型從「記住看過的畫面」推進到「維護看不見時仍在變化的狀態」。

這項工作并非最終答案,而是為持續世界建模提供了一個可實現、可評測的起點:未來仍需探索帶隱式動態記憶的端到端模型、更完整高效的 4D 世界表示、更合理的狀態注入與渲染機制,以及跨區域事件交互和推理成本控制。只有當模型能夠長期維護對象、事件、空間與時間之間的關系,生成式世界模型才可能真正成為可持續運行和交互的世界模擬器。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
韓紅朋友圈曝光:誠懇道歉,將退出公益行業……

韓紅朋友圈曝光:誠懇道歉,將退出公益行業……

麥杰遜
2026-06-29 17:03:35
頭號幫手已被中國鎮住!日高層暴怒,送中國5個字:絕不能容許!

頭號幫手已被中國鎮??!日高層暴怒,送中國5個字:絕不能容許!

趣文說娛
2026-06-30 16:26:06
幾乎下了一夜!北京降雨達中雨,局地大暴雨,今天可能還有雨

幾乎下了一夜!北京降雨達中雨,局地大暴雨,今天可能還有雨

愛上昌平
2026-06-30 11:46:45
一個人到了三四十歲,如果10萬塊存款都沒有,說明已經淪落到底層

一個人到了三四十歲,如果10萬塊存款都沒有,說明已經淪落到底層

舒山有鹿
2026-05-20 00:00:19
巴西最后6分鐘絕殺日本!日網懵了:說好的日本必勝呢?!

巴西最后6分鐘絕殺日本!日網懵了:說好的日本必勝呢?!

日本通
2026-06-30 15:09:30
中國腦梗發病率世界第一!醫生苦勸:罪魁禍首已揪出,這4物少吃

中國腦梗發病率世界第一!醫生苦勸:罪魁禍首已揪出,這4物少吃

醫學科普匯
2026-06-17 18:55:13
五年2.5億!最貴廢合同!NBA躺贏王!最爛操作嗎?

五年2.5億!最貴廢合同!NBA躺贏王!最爛操作嗎?

籃球盛世
2026-06-29 17:18:13
災難面前不要吹牛

災難面前不要吹牛

王才亮律師
2026-06-30 14:21:29
新型出軌太會了:不發消息不打電話,只靠這兩種方式聯系,真藏得太深了

新型出軌太會了:不發消息不打電話,只靠這兩種方式聯系,真藏得太深了

心理觀察局
2026-06-26 07:37:08
這就是大家擠破頭要去央企的原因…

這就是大家擠破頭要去央企的原因…

慧翔百科
2026-06-24 17:21:25
超級富二代的自我毀滅:玩游戲、追網紅,兩年敗光3個億

超級富二代的自我毀滅:玩游戲、追網紅,兩年敗光3個億

小怪吃美食
2026-06-27 14:57:44
心理學上說:如果一個人對家人不耐煩、易發火,對外人卻客客氣氣、夠溫和,不是本性涼薄,根源無外乎有兩點

心理學上說:如果一個人對家人不耐煩、易發火,對外人卻客客氣氣、夠溫和,不是本性涼薄,根源無外乎有兩點

心理觀察局
2026-05-12 09:06:23
6月29日,人社部和財政部關于2026年上調基本養老金通知發布了嗎

6月29日,人社部和財政部關于2026年上調基本養老金通知發布了嗎

鯨探所長
2026-06-29 22:03:54
夠狠!王勵勤終于動真格的了,直接砍掉前主席的后花園

夠狠!王勵勤終于動真格的了,直接砍掉前主席的后花園

以茶帶書
2026-06-21 16:00:21
隊報:門迪返回吉達國民做檢查,對陣比利時前歸隊但不一定能首發

隊報:門迪返回吉達國民做檢查,對陣比利時前歸隊但不一定能首發

畫夕
2026-06-29 17:58:11
和奧運冠軍分手后,他娶近2米體育美女,今35歲仍在山東男籃效力

和奧運冠軍分手后,他娶近2米體育美女,今35歲仍在山東男籃效力

攬星河的筆記
2026-06-30 13:44:49
凡爾賽啊!參加女兒清華大學畢業典禮,廣東一門店歇業通知引爭議

凡爾賽啊!參加女兒清華大學畢業典禮,廣東一門店歇業通知引爭議

火山詩話
2026-06-30 07:07:30
金價一夜回到解放前!海外民眾瘋狂搶金,內行提醒3件事千萬別做

金價一夜回到解放前!海外民眾瘋狂搶金,內行提醒3件事千萬別做

戶外釣魚哥阿旱
2026-06-30 07:24:14
達美樂比薩禮品卡寫著“激活后三年內有效”,顧客首次使用即過期 客服:給你那天就激活了

達美樂比薩禮品卡寫著“激活后三年內有效”,顧客首次使用即過期 客服:給你那天就激活了

信網
2026-06-29 15:39:36
CCTV5美國大滿貫!王曼昱戰日本削球手佐藤瞳 世界杯女單亞軍一輪游!30日賽程出爐

CCTV5美國大滿貫!王曼昱戰日本削球手佐藤瞳 世界杯女單亞軍一輪游!30日賽程出爐

好乒乓
2026-06-29 15:48:03
2026-06-30 17:40:49
機器之心Pro incentive-icons
機器之心Pro
專業的人工智能媒體
13398文章數 142684關注度
往期回顧 全部

科技要聞

iPhone18 Pro遭泄密!印度代工商惹禍

頭條要聞

無人機攻防正酣 烏克蘭卻在此時給俄羅斯出了個難題

頭條要聞

無人機攻防正酣 烏克蘭卻在此時給俄羅斯出了個難題

體育要聞

大熱倒灶壓力給到法國 王楚揭法國隊隱患

娛樂要聞

韓紅稱要退出公益,多位名人挽留

財經要聞

韓國萬億"芯"基建:存儲能否成AI時代油田

汽車要聞

誰懂啊家人們!爹味和班味一點都沒,這臺底盤最硬國產大獵裝太上頭!

態度原創

教育
手機
藝術
健康
時尚

教育要聞

一張“小紙條”撬動的教學變革

手機要聞

中興暢行70 Plus手機發售:展銳T9100 + 8G + 256G售2099元

藝術要聞

喬治·莫蘭迪簡潔的靜物畫,色彩看著太舒服了!

狂吃“糯嘰嘰”小心腸梗阻!

“復古波點”又流行回來了!夏天簡單穿就很時髦

無障礙瀏覽 進入關懷版