網易首頁 > 網易號 > 正文 申請入駐

Information Shapes Koopman Representation:信息如何決定模擬

0
分享至



英國University College London (UCL) 博士程小遠、新加坡Nanyang Technological University (NTU) 博士元文瑄(master project),為本文共同第一作者;法國Institut Polytechnique De Paris 程思博教授、美國Santa Fe Institute 施密特學者章元肇等,為本文合作者,上海財經大學助理教授孫卓,為本文通訊作者。



圖1:軟體機器人的模擬以及控制

大多數世界模型工作默認:只要學到一個好的 latent dynamics,問題就解決了。 但這個假設本身是可疑的——什么樣的信息,才足以支撐一個可預測、可傳播的動力學?本文從信息論出發,重新審視這一前提。

一個自然的思路是:如果非線性動力學難以建模,能否把它轉化為線性問題?Koopman 算子正是這樣一種誘人的框架,它試圖將復雜系統嵌入潛空間,使其演化近似線性。這一思路在物理表示、天氣預測和流體控制中具有極強吸引力。 然而,這種線性化并不是免費的,它依賴于一個精心構造的表示空間,而這個空間本身才是最難學習的部分。

因此,真正的核心問題不是如何學習一個隱變量表征,而是:在有限維表示中,究竟哪些信息必須被保留,才能支撐穩定的動力學傳播與長期預測?

為此,UCL、ICL、Santa Fe Institute、Institut Polytechnique De Paris、上海財經大學最新聯合提出Information Shapes Koopman Representation。這項工作從動態信息瓶頸的角度重新審視 Koopman 表征學習,明確 Koopman learning 真正所需要的信息,并據此構造出一個可優化的目標。



  • 論文地址:
  • https://openreview.net/forum?id=Szh0ELyQxL
  • 代碼地址:
  • https://github.com/Wenxuan52/InformationKoopman

目前,該成果已被 ICLR 2026 Oral 接收。

動機:

世界模型在Koopman表征下難的,不只是「學一個 latent」

Koopman表征學習問題在于,Koopman 表征并不只是像傳統潛空間學習方法,比如Autoencoder、Variational Autoencoder,一樣「學一個能重建輸入的 latent」。相比較而言,它還需要同時滿足三個更強的性質:

  • Temporal Coherence:潛空間表示要能穩定地隨時間傳播;
  • Structural Consistency:潛空間中的演化要盡量符合 Koopman 的線性結構;
  • Predictive Sufficiency:表征里要保留足夠多、足夠關鍵的動力學模式,才能支撐長期預測。

這就帶來了兩個需要權衡的問題:

1、如果 latent 保留的信息太多,表征會更豐富,但很難維持簡單穩定的線性結構;

2、如果壓縮得太狠,又容易丟掉長期預測真正需要的關鍵模態。

所以,該論文真正想回答的問題不是 "再加一個模塊",而是順著這個Trade-off:

在有限容量下,一個好的 Koopman 表征,到底該保留什么信息?



圖2:信息論 Koopman 框架。(a) 帶有 Information-shaped 優化目標的 Koopman 表征學習結構總覽;(b) Koopman 模態與互信息項對應關系;(c) 互信息(MI)和馮·諾依曼熵(VNE)對模態中信息分配的水填充效應。

關鍵視角:

從信息瓶頸角度看待學習動力學的問題

這篇論文的切入點,是把這個問題重新放回到信息瓶頸(Information Bottleneck, IB)框架下理解。

經典的信息瓶頸強調:一個好的表征,并不是盡量把輸入中的所有信息都搬進 latent,而是在壓縮的同時,保留對下游任務最重要的信息。

對應到 Koopman learning,這里形成了一個動態的信息瓶頸公式



那么核心目標就變成:學習一種 Koopman representation ,使其對未來狀態具有最大的線性可預測性(Relevance),同時保持盡可能結構緊湊(Complexity)。

理論分析:

為什么互信息重要,但只靠互信息還不夠?

圍繞這個目標,論文給出了三個相互銜接的理論結論。

1、長期預測誤差,本質上來自逐步累積的信息損失

論文首先從信息傳播的角度分析了 Koopman 潛空間傳播的誤差來源。結論很直觀:

當原始非線性系統被 Koopman 表征近似時,每一步傳播都會損失一部分預測相關的信息,而長時間預測誤差,就是這些小損失一步步累積起來的結果。



這意味著,Mutual Information(互信息,MI)直接關系到 Koopman 表征能夠保住多少預測能力。

2、不是所有信息都一樣重要

但只能通過互信息來量化error還不夠,因為這只能告訴我們損失了多少,卻不能告訴我們損失的是哪一類信息。



3、只最大化 MI,會導致 mode collapse

那么,一個很自然的想法是:既然temporal-coherentinformation最重要,那是不是只要盡量增大這部分互信息就夠了?

答案是否定的。

論文發現,MI的確會優先把信息分配給最穩定、最有收益的少數模態,但這也會帶來副作用:信息過度集中到幾個 dominant modes 上,導致潛空間有效維度下降,出現mode collapse

為了緩解這個問題,論文又引入了von Neumann entropy(VNE)。它的作用,不是簡單再加一個正則項,而是盡量避免模態信息過度集中,讓潛空間保持必要的模態多樣性。

簡單來說,這篇論文的核心洞察就是:MI 負責保住「對的模態」,VNE 負責保住「足夠多的模態」(圖2(c))。

從理論走向算法:一個真正「information-shaped」的 Koopman 目標

基于上面的分析,論文進一步構造了一個信息論驅動的 Lagrangian 目標,把互信息、結構一致性項、重建項以及 von Neumann entropy 統一到一個可優化框架中(圖2(a))。



圖3:提出的Information-shaped Koopman 目標及其可優化形式。上方為從理論分析得到的統一 Lagrangian:由互信息項、von Neumann entropy項、重構項共同構成;下方為對應的可訓練目標,進一步對應到 Koopman 表征學習中的三個性質。

更重要的是,這個目標和 Koopman learning 的三個核心性質是一一對應的(圖3):

  • MI 項對應于Temporal Coherence,強調時間上的穩定傳播;
  • 線性 forward 一致性項對應于Structural Consistency,保證潛空間演化與 Koopman 線性結構一致;
  • VNE 項對應于Predictive Sufficiency,幫助模型保留足夠豐富的有效模態;
  • 再結合 reconstruction / ELBO 項,使整個模型能夠在實際訓練中穩定優化。

也就是說,該論文將 "一個好的 Koopman 表征該保留什么信息" 這個問題,轉換成了一個可優化的訓練目標

實驗結果:不僅更準,而且更穩

實驗部分,論文在三類任務上驗證了這套方法:

  • 物理動力系統預測:如 Lorenz 63、Kármán vortex、Dam flow、ERA5 天氣預測;
  • 高維視覺輸入下的控制與表征學習:如 Planar、Pendulum、Cartpole;
  • 圖結構動力學預測:如 Rope 和 Soft Robotics(如圖1)。

結果表明,這套方法在短期和長期預測誤差上優于多種 Koopman baseline(圖4和5)。



圖4:全球天氣場包括地球重力勢能、溫度、濕度和風速。最左列為真實物理場,最右列為本文方法的預測結果。



圖5:在其余兩類圖結構和視覺輸入動力學系統上的泛化表現。左為圖結構動力學場景,以帶有噪聲的 Rope 和 Soft Robotics 兩個任務為例;右為視覺輸入場景,以 Planar、Pendulum 和 Cartpole 控制任務為例。

尤其是在 Kármán vortex 的可視化中,在譜性質和manifold 結構上,論文展示了一個很有說服力的現象(圖6):



圖6: Kármán vortex 任務上的 latent space 幾何分布與 Koopman 譜結構可視化。上排比較了不同 baseline 方法在 latent space 中的軌跡分布,論文方法的 rollout 軌跡更接近單步預測,也更符合真實動力學的極限圓演化結構;下排展示了 Koopman 譜分布,論文方法學到的特征值更多分布在單位圓附近,形成了更穩定的幾何結構。

相比容易出現譜退化和軌跡漂移的 baseline,加入 MI 與 VNE 后,模型學到的特征模態更加穩定,長期軌跡也更接近真實動力學結構。

總結與展望

這篇工作的重要性,在于它把 Koopman 表征學習從一個技巧性方法,重新嵌入到世界模型的基本問題之中。世界模型關心的從來不是表示本身,而是一個表示是否包含足夠的信息去支持動力學的預測與控制。在這一視角下,Koopman 方法中的 simplicity 與 expressiveness 不再是調參經驗,而是被明確為一個信息論上的優化目標。因而問題發生了轉變。關鍵不再是能否找到一個線性化的潛空間,而是在有限維約束下,哪些信息是必須被保留的,才能使動力學既可傳播又可預測。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
王維當選蘇州市市長,原市長已任鎮江市委書記

王維當選蘇州市市長,原市長已任鎮江市委書記

上觀新聞
2026-04-23 16:19:04
浪胃仙整容失敗!在昆明被網友偶遇,真人又壯又老,差點認出是他

浪胃仙整容失敗!在昆明被網友偶遇,真人又壯又老,差點認出是他

離離言幾許
2026-04-22 07:06:44
無才無德、裝瘋賣傻、一肚子草包,是誰捧紅了這些跳梁小丑?

無才無德、裝瘋賣傻、一肚子草包,是誰捧紅了這些跳梁小丑?

蹲坑看世界
2026-04-22 23:00:21
再見了,開拓者,賽季離隊第一人,楊瀚森更難了!

再見了,開拓者,賽季離隊第一人,楊瀚森更難了!

體育新角度
2026-04-23 15:51:56
40000 人陣亡,100 艘戰艦會被擊沉?

40000 人陣亡,100 艘戰艦會被擊沉?

小馬姨
2026-04-21 09:49:45
“撞車啦”! 中超第8輪CCTV直播北京國安 海港都是同個時間段

“撞車啦”! 中超第8輪CCTV直播北京國安 海港都是同個時間段

80后體育大蜀黍
2026-04-23 11:04:00
1979年打越南,高層其實吵翻了天?葉劍英粟裕為何反對出兵?

1979年打越南,高層其實吵翻了天?葉劍英粟裕為何反對出兵?

勇哥讀史
2026-04-21 07:52:13
“東鵬0糖特飲”是商標,客服:商標注冊為品牌保護,原罐裝0糖特飲已暫停售賣

“東鵬0糖特飲”是商標,客服:商標注冊為品牌保護,原罐裝0糖特飲已暫停售賣

界面新聞
2026-04-22 21:43:04
河北一轎車斑馬線撞飛2人后掉頭再次沖撞傷者,周邊商家:肇事司機未逃離當場被控制

河北一轎車斑馬線撞飛2人后掉頭再次沖撞傷者,周邊商家:肇事司機未逃離當場被控制

極目新聞
2026-04-22 15:36:21
蔣萬安壓倒性勝利,政治人物好感度第一,臺名嘴:2028他若選即贏

蔣萬安壓倒性勝利,政治人物好感度第一,臺名嘴:2028他若選即贏

尋墨閣
2026-04-22 16:11:52
隊史首次闖進季后賽!寧波男籃官宣:與NBL場均20+8內線完成簽約

隊史首次闖進季后賽!寧波男籃官宣:與NBL場均20+8內線完成簽約

狼叔評論
2026-04-23 16:08:07
有些事實,不知道更好

有些事實,不知道更好

我是歷史其實挺有趣
2024-06-05 08:50:20
我有罪,大導演昆汀花1萬美金,在包房舔腳半小時,直到皮膚起皺

我有罪,大導演昆汀花1萬美金,在包房舔腳半小時,直到皮膚起皺

西樓知趣雜談
2026-04-20 08:40:47
女子愛上情夫后,為他花了一個億,2013年情夫不肯離婚被殺死了

女子愛上情夫后,為他花了一個億,2013年情夫不肯離婚被殺死了

漢史趣聞
2026-04-23 11:04:16
火箭VS湖人G3,開球時間確定,詹姆斯定律來了,五千萬年薪真值

火箭VS湖人G3,開球時間確定,詹姆斯定律來了,五千萬年薪真值

體育大學僧
2026-04-22 18:26:19
局勢惡化!日本開出危險一槍,中國紅線遭踩踏,東部戰區行動了

局勢惡化!日本開出危險一槍,中國紅線遭踩踏,東部戰區行動了

云舟史策
2026-04-23 07:32:35
AI竟能生成《金瓶梅》"3A大作"!尺度很大細節夸張

AI竟能生成《金瓶梅》"3A大作"!尺度很大細節夸張

游民星空
2026-04-22 11:55:38
尚界Z7發布會上趴窩?官方回應:請大家不要過度解讀、傳播

尚界Z7發布會上趴窩?官方回應:請大家不要過度解讀、傳播

識礁Farsight
2026-04-23 10:29:05
老兵借廁所被拒后續!殘疾原因曝光,老兵發聲,官方建議辭退保安

老兵借廁所被拒后續!殘疾原因曝光,老兵發聲,官方建議辭退保安

離離言幾許
2026-04-21 21:41:39
全程未遭遇抵抗30萬噸伊朗油輪巨輪被美軍俘虜190萬桶石油要栽了

全程未遭遇抵抗30萬噸伊朗油輪巨輪被美軍俘虜190萬桶石油要栽了

阿振觀點
2026-04-23 05:43:07
2026-04-23 17:19:00
機器之心Pro incentive-icons
機器之心Pro
專業的人工智能媒體
12837文章數 142634關注度
往期回顧 全部

科技要聞

馬斯克喊出"史上最大產品",但量產難預測

頭條要聞

小米SU7自動泊車時撞上懸空墻體 車主:以后不再用了

頭條要聞

小米SU7自動泊車時撞上懸空墻體 車主:以后不再用了

體育要聞

萊斯特城降入英甲,一場虧麻了的豪賭

娛樂要聞

王大陸因涉黑討債被判 女友也一同獲刑

財經要聞

關于AI算力鏈"瓶頸" 這是高盛的最新看法

汽車要聞

令人驚艷的奇瑞車 風云A9可不只是樣子貨

態度原創

藝術
教育
健康
游戲
數碼

藝術要聞

生完7個女兒后,60歲的她被香奈兒邀請走高定秀!

教育要聞

中考數學幾何:求α+β,難住不少人

干細胞如何讓燒燙傷皮膚"再生"?

大話西游手游尋芳18更新!挑戰積分第一檔,尋芳十八怎么打?

數碼要聞

榮耀WIN游戲本360W氮化鎵適配器發布,售價499元

無障礙瀏覽 進入關懷版