无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

LeCun新證明:世界是高斯的

0
分享至


來源:量子位 | 公眾號 QbitAI

克雷西 發自 凹非寺

LeCun的LeJEPA到底有沒有構建出世界模型?他本人最新發表的論文,解答了這個問題。

答案是肯定的,但是有條件,世界的底層變量需要服從高斯分布


論文給出了完整的數學證明,覆蓋了精確成立的條件和近似情況下誤差的退化規律。

同時,LeCun他們還用機器人手臂控制實驗驗證了這一點——

在目標導向的控制任務上,用高斯采樣訓練出來的模型,規劃效果與已知真實狀態的理想情況在統計上沒有差異。

這讓LeCun押注多年的JEPA路線,終于有了理論支撐。

模型學沒學到世界,怎么判斷?

判斷一個機器學習模型的內部表示,到底對不對得上真實世界的結構,要看它能不能還原世界里的真實變量。

一個模型在訓練集上表現優秀,并不代表它真正理解了世界,可能只是把圖像的紋理、光照、背景等無關信息混在一起,恰好拼湊出了正確答案。

一旦場景發生變化,這樣的表示就會失效。

真正有用的表示,應該對應世界的真實自由度,比如物體的位置、速度、顏色這些獨立的內在變量,而不是它們被觀測過程扭曲之后的混合產物。

問題在于,這些變量的觀測本身就是一道屏障。

我們看到的圖像、傳感器的讀數,都是世界真實狀態經過復雜非線性變換之后的結果。

這個變換可以非常復雜,大量的結構信息在這個過程中被混淆、疊加。

從這樣的觀測出發反推真實結構,在數學上一般是無法保證的,這正是表示學習長期面臨的核心難題。

對比學習、VICReg、BYOL等自監督學習的各種方法,在這個問題上都繞開了正面回答。

這些方法的共同特點是,它們對模型輸出的嵌入分布沒有明確的約束,只是通過各種技巧防止表示退化為常數。

嵌入分布是什么形狀、有什么性質,這些方法并不關心。

正因如此,想要從理論上分析這些方法學到的表示是否還原了真實結構,就缺乏足夠的數學方法。

LeJEPA的設計在這里走了一條不同的路。

它通過一個叫SIGReg的正則項,把模型輸出的嵌入分布顯式約束為各向同性高斯分布。

這個約束讓嵌入空間有了明確的幾何結構,也正是這個結構,讓嚴格的理論分析成為可能。


選擇高斯分布的一個前提,是論文對世界的潛變量做了一個假設——它們服從高斯分布。

這個假設的選擇有兩個理由。

高斯分布是給定均值和方差條件下熵最大的分布,這意味著它對潛變量的結構做出了最少的額外假設,是一個盡可能保守的起點。

與此同時,任務相關的潛變量往往是大量微觀變量聚合的結果,根據中心極限定理,這類聚合變量天然趨向高斯分布。

高斯分布,有效且唯一的答案

在LeCun的論文中,判斷LeJEPA的表示是否還原了世界的真實結構的標準,叫做線性可識別性

意思是說,如果學到的表示和真實潛變量之間存在一個線性對應關系,就認為模型還原了世界的真實結構。

但這個標準的門檻并不低,它要求表示空間里的每一個維度,都對應真實世界里某一個獨立的變量

用數學語言來表達,就是存在一個矩陣Q,使得真實潛變量經過Q的線性變換之后,恰好等于模型輸出的表示。

用于判斷線性可識別性的工具,叫做線性探針,即在凍結的表示上,訓練一個線性分類器或回歸器,用來衡量表示里包含了多少關于目標變量的信息。

線性探針本身只能做線性變換,這意味著它能提取到什么,完全取決于表示里的信息——

如果表示真的線性對應了真實變量,線性探針就能準確提取,反之亦然。

論文中,作者正是用線性探針來衡量LeJEPA的表示是否還原了真實潛變量的。

實驗的設置是這樣的:

  • 先在已知的低維高斯潛變量上施加非線性混合函數,這些混合函數包括螺旋形變換、正弦剪切、拋物線剪切、RealNVP耦合層等多種形式,目的是把潛變量變換成觀測數據;

  • 接著,再用LeJEPA在這些觀測數據上訓練編碼器;

  • 最后在編碼器輸出的表示和原始潛變量之間擬合一個線性回歸,用R2衡量兩者的線性對應程度。

R2越接近1,說明表示和真實潛變量之間的線性關系越強,即線性可識別性越好。

實驗還把潛變量的維度從2一路擴展到1024,遠超DINOv2等模型的嵌入維度,以驗證結論是否隨規模成立。

結果顯示,在所有測試的混合函數和維度下,SIGReg和VICReg的R2都保持在0.999以上,線性可識別性在高斯潛變量的條件下穩定成立。


從理論角度看,對于高斯分布,描述變量如何在時間上演化的轉移算子有一組特殊的特征函數,叫做Hermite多項式,它們是高斯分布下函數空間的自然正交基,類似于周期函數里的傅里葉級數。

這組多項式的關鍵性質是,一個函數里非線性成分的次數越高,它在正樣本對之間的相關性就越低。


LeJEPA的對齊損失要最大化正樣本對之間的相關性,因此任何非線性扭曲都會被嚴格懲罰。

再結合SIGReg對嵌入分布的約束,這個線性映射必然是一個正交變換,即真實潛變量的一個旋轉。

論文進一步證明了這個條件的唯一性。

Sturm-Liouville理論是經典數學物理里分析微分算子特征函數的框架,它描述了在什么條件下,一個算子的特征函數具有特定的形狀。

論文借用這個框架證明,要讓轉移算子的第一個特征函數恰好是仿射函數(即線性函數加常數),潛變量的分布必須滿足一個非常嚴格的條件——它的對數密度的導數必須是線性的,而滿足這個條件的分布恰好只有高斯分布。

這意味著高斯分布在這個問題里的地位是唯一的,換成Laplace分布、均勻分布或其他任何非高斯分布,線性可識別性的保證都無法成立。

論文也用實驗印證了這一點,在廣義正態分布族里掃描形狀參數,線性恢復的R2在形狀參數等于2(即高斯)時出現尖銳的峰值,偏離高斯之后迅速下降。


在表示空間規劃,就是在真實世界規劃

線性可識別性一旦成立,意味著什么?

這意味著,在學到的表示空間里做規劃,得到的結果和在真實世界里求解最優控制完全等價。

如果表示和真實潛變量之間只差一個旋轉,那么表示空間里的直線軌跡,解碼回真實空間之后仍然是一條直線,而直線軌跡恰好是很多控制問題里的最優解。

因此,只要代價函數對旋轉不敏感,在表示空間里規劃出來的最優策略,就等同于在真實世界里規劃出來的最優策略。

論文用一個機器人手臂控制任務來驗證這一點。

實驗的場景是DMC Reacher,一個有兩個關節的機械臂,目標是從起始姿態運動到目標姿態。

實驗分兩組:

  • 第一組用各向同性隨機采樣(OU過程)生成訓練數據,潛變量的分布滿足高斯假設;

  • 第二組直接用強化學習策略跑出來的真實軌跡作為訓練數據,潛變量的分布因為策略的目標導向性而集中在狀態空間的某個低熵區域,不再滿足高斯假設。


結果顯示,第一組訓練出來的編碼器,在表示空間里做直線插值規劃,得到的關節軌跡與已知真實狀態的理想情況在統計上沒有差異;第二組訓練出來的編碼器,同樣的規劃方法卻產生了明顯的偏差,控制代價顯著上升。

同一套物理系統,用隨機探索的方式采樣就能滿足理論條件,用目標導向的策略采樣就會破壞條件。

兩者的區別,正是在于數據的分布。

這意味著,在自監督預訓練階段,數據采樣策略,本身就是理論保證的一部分。

論文地址:
https://arxiv.org/abs/2605.26379

閱讀最新前沿科技趨勢報告,請訪問21世紀關鍵技術研究院的“未來知識庫”


未來知識庫是 “21世紀關鍵技術研究院”建 立的在線知識庫平臺,收藏的資料范圍包括人工智能、腦科學、互聯網、超級智能,數智大腦、能源、軍事、經濟、人類風險等等領域的前沿進展與未來趨勢。目前擁有超過8000篇重要資料。每周更新不少于100篇世界范圍最新研究資料。 歡迎掃描二維碼或訪問https://wx.zsxq.com/group/454854145828進入。

截止到2月28日 ”未來知識庫”精選的百部前沿科技趨勢報告

(加入未來知識庫,全部資料免費閱讀和下載)

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
中足聯官宣重磅罰單!52歲于根偉禁賽5場罰5萬 辱罵+率隊圍堵裁判

中足聯官宣重磅罰單!52歲于根偉禁賽5場罰5萬 辱罵+率隊圍堵裁判

我愛英超
2026-07-02 22:05:30
早上7點 世界杯14億大戰!C羅深陷20年魔咒 必有1巨星出局

早上7點 世界杯14億大戰!C羅深陷20年魔咒 必有1巨星出局

葉青足球世界
2026-07-02 17:12:02
一路走好!1天時間4位名人被曝去世,最大78歲,最小才30歲

一路走好!1天時間4位名人被曝去世,最大78歲,最小才30歲

借你一生
2026-07-02 10:26:03
成田機場的一張廣告牌,讓日本攝影師恍惚:“瞬間以為回到了中國”

成田機場的一張廣告牌,讓日本攝影師恍惚:“瞬間以為回到了中國”

東京在線
2026-07-02 16:57:07
里子面子都丟了!管不住下半身的任素汐,一場演唱會撕下她的體面

里子面子都丟了!管不住下半身的任素汐,一場演唱會撕下她的體面

往史過眼云煙
2026-07-02 09:55:26
首都保衛戰打響后,普京發表全國講話,俄羅斯對美西方發出通牒

首都保衛戰打響后,普京發表全國講話,俄羅斯對美西方發出通牒

策前論
2026-07-02 17:21:49
“一個月600塊你要餓死他?”大學男生吃飯被偷拍,看的人心疼!

“一個月600塊你要餓死他?”大學男生吃飯被偷拍,看的人心疼!

林林先生
2026-07-01 12:30:03
從699分到愛心接力:少年向上 社會向善丨中聽

從699分到愛心接力:少年向上 社會向善丨中聽

大象新聞
2026-07-01 16:30:12
六代機,就這么明晃晃的官宣了!

六代機,就這么明晃晃的官宣了!

新動察
2026-07-02 08:25:58
韓紅一句“走個面兒”引全網聲討,這屆觀眾不伺候了

韓紅一句“走個面兒”引全網聲討,這屆觀眾不伺候了

可達鴨面面觀
2026-07-02 19:44:03
曝38歲德國主帥下課 足協開會3小時要求他辭職 愿付700萬歐補償金

曝38歲德國主帥下課 足協開會3小時要求他辭職 愿付700萬歐補償金

我愛英超
2026-07-02 21:40:07
80%變0!里奇·保羅曝光詹姆斯離湖心路

80%變0!里奇·保羅曝光詹姆斯離湖心路

籃壇第一線
2026-07-02 00:47:17
地鐵吐血女孩半月內多次收到病危通知單,當事人:自己的生命已經進入倒計時,但還是希望能夠有人關注到自己手里仍在運行的公益項目

地鐵吐血女孩半月內多次收到病危通知單,當事人:自己的生命已經進入倒計時,但還是希望能夠有人關注到自己手里仍在運行的公益項目

瀟湘晨報
2026-07-02 16:32:20
賈玲直言自己又活過來了,大方承認體重反彈了,坦言不再逼自己極端自律,活得太通透了

賈玲直言自己又活過來了,大方承認體重反彈了,坦言不再逼自己極端自律,活得太通透了

背包旅行
2026-07-02 11:45:23
西安賽格墜樓熱搜刷屏:我看到謀生的嚴總,走上絕路時的無助

西安賽格墜樓熱搜刷屏:我看到謀生的嚴總,走上絕路時的無助

李晚書
2026-07-02 18:44:26
故意剝奪伊朗隊勝利!伊朗裔美國專家起訴國際足聯,索賠10億美元

故意剝奪伊朗隊勝利!伊朗裔美國專家起訴國際足聯,索賠10億美元

全景體育V
2026-07-02 21:38:20
成都一女子不洗手抱孫子,兒媳怒斥不衛生,兒子一拳打面中,母親揚言要兒子坐牢,兒子卻說:她活該!6年后現狀曝光...

成都一女子不洗手抱孫子,兒媳怒斥不衛生,兒子一拳打面中,母親揚言要兒子坐牢,兒子卻說:她活該!6年后現狀曝光...

背包旅行
2026-07-02 14:33:11
中國臺灣演員陳昊森承認與湖北女演員蘭西雅相戀,目前已交往超過半年,兩人曾合作電影

中國臺灣演員陳昊森承認與湖北女演員蘭西雅相戀,目前已交往超過半年,兩人曾合作電影

極目新聞
2026-07-02 22:47:55
加息,突變!美國重磅數據出爐!美股、黃金、比特幣全線拉升

加息,突變!美國重磅數據出爐!美股、黃金、比特幣全線拉升

證券時報
2026-07-02 21:53:03
扎哈羅娃:馮德萊恩是個“出色的騙子”

扎哈羅娃:馮德萊恩是個“出色的騙子”

參考消息
2026-07-02 14:14:08
2026-07-03 02:28:49
人工智能學家 incentive-icons
人工智能學家
人工智能領域權威媒體
4864文章數 37483關注度
往期回顧 全部

科技要聞

馬斯克不承認,但SpaceX就該造AI手機

頭條要聞

商戶在西安賽格商場墜亡 好友:他曾變賣門店發工資

頭條要聞

商戶在西安賽格商場墜亡 好友:他曾變賣門店發工資

體育要聞

韓國人,為什么恨透了洪明甫?

娛樂要聞

眾星祝福祖國,曾沛慈原形畢露?

財經要聞

千億茶市場無贏家:瀾滄巨虧 八馬停"蹄"

汽車要聞

有純電有增程 還有二代VLA支持 小鵬MONA L03預售價14.38萬起

態度原創

數碼
游戲
本地
公開課
軍事航空

數碼要聞

卓威同步發布XQ2766X顯示器:27" QHD 360Hz TN

國產外設廠"宣布"放棄實體手柄!數字化徹底解決漂移

本地新聞

這場穿越酉陽的光影之旅,張張都是壁紙!

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

美軍“航母殺手”首次公開 此前從未展示

無障礙瀏覽 進入關懷版