網易首頁 > 網易號 > 正文申請入駐

22歲的北大青年學者，想做真正理解物理的通用世界基座模型｜AI Founder 請回答

2026-05-22 17:04:20　來源: 鈦媒體APP

北京舉報

分享至

資本與產業界正迅速達成共識：AI正在從虛擬世界邁向物理世界，而世界模型這套讓機器真正理解物理規律、預測狀態轉移的底層認知引擎，是這條路上最關鍵的一塊拼圖。

據 Morgan Stanley 于 2025 年 4 月發布的《The Humanoid 100: Mapping the Humanoid Robot Value Chain》報告預測，世界模型所對應的下游產業——從具身智能到自動駕駛到工業仿真——全球總市場規模將在 2050 年達到 5 萬億美元量級。

當整個行業還在爭論世界模型該怎么做的時候，一支從北大走出來的年輕團隊——逆矩陣科技，帶著對于世界模型路線獨特的思考，走進了我們的視野。

”做世界模型，最核心的問題是：模型學到的到底是相關性，還是因果？”

“如何在隱空間里真正學到物理因果，而不只是一個視覺上說得過去、物理上隨時會失效的假設，是我們最想解決的問題。”

“世界模型必須引入主動干預，通過行動驗證因果，而不是從旁觀中擬合相關性。”

“我們不是把物理規律顯性地寫進模型，而是通過物理上可驗證的方法，讓模型自然地涌現出對物理的理解。”

這些觀點正來自于逆矩陣科技的聯合創始人——陳博遠，而他的另一個身份則是北大元培學院22歲的應屆畢業生。

陳博遠在大一時就中稿了AI三大頂會之一的NeurIPS，本科生在此發文本就極為罕見。此后幾年，他又陸續拿下NeurIPS Oral（口頭報告，全球錄取率不足0.5%）和ACL最佳論文（全球僅4篇，國內學術機構首篇獨立完成）。畢業前，他已是北大學生年度人物和北大五四獎章得主，這是北京大學給予學生的兩項最高榮譽。

他與同出北大的師兄吉嘉銘一起創立了逆矩陣科技，做通用世界基座模型。吉嘉銘同樣是2025北大學生年度人物，也是極少數同時獲得蘋果、騰訊、螞蟻三家頂級科技企業認可的青年研究者——2025年Apple Scholar（蘋果學者，全球遴選，中國大陸僅2位）、首屆騰訊青云獎學金、螞蟻Intech獎學金（全球共10名）。

2026年3月，公司完成超千萬美元天使輪融資，由高瓴創投和北大系基金燕緣創投聯合投資。近期獲悉，他們又將完成新一輪融資。

近日，我們與陳博遠圍繞世界模型和他的成長經歷進行了一次深入的對談。

▎以下為與陳博遠的對話全文，略有刪減：

創投家：世界模型現在非常火，從逆矩陣的角度是怎么理解這件事的？

陳博遠：現在世界模型很火，可以說Anything is world model（一切皆世界模型）。但其實世界模型這個概念最早就是從強化學習和控制理論里來的。

1990年圖靈獎得主、強化學習之父 Richard Sutton 提出 Dyna 架構，指出模型需要預測環境如何響應智能體的行動，再到后來2018年 David Ha 和 Schmidhuber 發表了一篇名為 World Models 的文章，指出智能體使用世界模型學習策略，并且在自己產生的夢世界中利用交互學習世界模型。

回到第一性原理。AI一定會從虛擬世界走向物理世界，而在物理世界里，核心是Interaction——交互。人類是怎么理解世界的？端起一個水杯大概三步：理解世界——什么是水杯，什么是桌面；編碼到腦子里——隱空間；執行策略——不斷嘗試，失敗了更新自己的信念。所以我們最終需要的世界模型，其實是一個狀態轉移模型——基于當下狀態采取什么action（動作），觸發什么next state（下一狀態）。這個東西，強化學習研究了幾十年。

創投家：你們的技術路線與李飛飛和LeCun有什么本質區別？

陳博遠：做世界模型，最核心的問題是：模型學到的到底是相關性，還是因果？

舉個例子。比如我們給模型看一段杯子落在桌上的視頻，它完全可以推斷出"桌子有引力把杯子吸住了"，這個假設在統計上說得通，能解釋觀測到的狀態變化，但是是錯的。真實的物理原因只有重力。你沒辦法光靠觀察區分這兩種解釋，得讓模型去干預：把杯子移開，發現它掉地上了，"桌子有引力"就被排除了。這在強化學習里叫Reward Hacking（獎勵破解），也是我們認為世界模型必須引入主動干預的根本原因，通過行動驗證因果，而不是從旁觀中擬合相關性。

拿這個標準去看現有的幾條路線。李飛飛老師那邊是從3D重建進來的，追求極致的空間還原，工程上很扎實。但三維重建解決的是"世界長什么樣"，不是"世界怎么運轉"。知道瓶蓋扣在瓶子上，和理解瓶蓋沒擰緊水會灑出來，是兩件事。LeCun的方向是在隱空間里學表征，方向我們覺得是對的，但它有一個工程上很難繞過去的問題：像素生成好不好，人眼能直接判斷，Critic Model（評判模型）容易建；隱空間里學到的表征對不對，怎么評，這個問題到現在沒有公認的解法，也是JEPA（聯合嵌入預測架構）路線從理論走向工程化最難的地方。

如何在隱空間里真正學到物理因果，而不只是一個視覺上說得過去、物理上隨時會失效的假設，是我們最想解決的問題。

創投家：你們說自己做的是"通用世界基座模型"，怎么理解這個概念？

陳博遠：可以類比大語言模型的發展路徑。早期也有人做法律大模型、金融大模型，針對垂直場景去訓練。但最后大家發現，真正有效的方式是先訓一個通用基座，讓它把語言的底層規律學透，然后在上面做微調和適配。垂直模型天花板很低，通用模型才有涌現的可能。

世界模型今天也在經歷類似的分岔。我們選擇先做通用基座，有兩個核心判斷。第一，物理規律本身就是跨場景共通的——重力、碰撞、流體、時空一致性，這些東西不會因為你換了個應用場景就失效。一個真正學透了這些底層規律的模型，天然就能遷移到具身智能、工業仿真這些不同場景，不需要為每個領域重新建一套認知。第二，恰恰是這些場景，對世界模型的精確性和物理正確性要求極高，比如嚴肅工業場景里容不得半點物理判斷失誤，機器人抓取也不允許力的估算出錯。所以我們從一開始就把物理正確性作為最核心的指標，而不是先追求視覺上好看、再回頭補物理。

我們選擇先把底層的物理因果學透，做一個通用的基座，基座做好了，上面的應用場景自然能長出來。

創投家：你們是把物理定律寫入模型嗎？

陳博遠：不完全是。物理規律其實是人類對世界做的一個壓縮。拉馬努金不需要公式，也能一眼看出答案。我們不是把物理規律顯性地寫進模型，而是通過物理上可驗證的方法，讓模型自然地涌現出對物理的理解。

就像大模型的進化路徑——大模型能有今天這么強的數學和編程能力，其實靠的也是強化學習——RLVR（基于可驗證獎勵的強化學習），用明確的、可驗證的獎勵信號，讓模型在自我演進中涌現出對底層規律的理解。對物理世界也一樣，我們可以做一些物理一致性的獎勵，激活模型學習過程中的物理規律。

創投家：視頻生成模型也在強調物理理解，這會是捷徑嗎？

陳博遠：視頻生成模型能生成流暢的動畫，但可能出現穿模、不符合物理規律的現象——翻書時憑空出現第三只手。達到了“好看”，但不是“物理正確”。當然我們不是說基于開源視頻模型做強化學習完全不行。

我們只是認為世界模型一定會經歷從架構到數據的整套算法的改變。優先關注物理正確性，才符合Physical AI（物理人工智能）的需求。我們內部已經看到了一些Scaling Law（規模定律）的跡象，所以我們一直說，我們是一家關注通用世界基座模型的公司，不是只做面向具身或游戲的公司。

創投家：要實現物理定律理解的涌現，最大難點在哪？

陳博遠：這是全方位的問題。數據上，第一人稱視角數據很關鍵，因為它代表了主體和世界的交互，游戲引擎里的數據也很重要。人類學物理也不是直接學微積分，是從1+1=2開始的，學物理規律也有“課程學習”的概念。

架構上，記憶性問題、長時序問題，現在大家都解決不了。這些都是方興未艾的問題，無論初創還是大廠都在探索。正是這樣的土壤，給了我們機會。

創投家：逆矩陣的組織形式很特別，更像一個實驗室？

陳博遠：世界模型今天面對的核心問題還不是工程問題，是科學問題：怎么讓模型真正學到物理因果。這件事沒有現成的技術棧可以復用，需要的是對底層問題的深度思考和快速試錯，是研究導向的組織最擅長的事情。

因此我們確實不太像一家傳統意義上的公司，更像早期的DeepMind或者OpenAI剛成立的時候，一幫人聚在一起，就是想把一個技術問題搞明白。我們沒有KPI，沒有部門劃分，甚至沒有明確分工，只有分工偏好。內部叫這個文化"NO WALLS（沒有部門墻）"。

為什么這么做？因為我們觀察到，真正的創新往往就是兩三個人做出核心突破，然后再傾注資源去放大。你提前畫好部門和KPI，反而會把這種可能性堵死。

團隊現在20到30人，一半是年輕的研究者，一半是從大廠出來的工程人才。我們很重視Infra（基礎設施）這一塊，好的算法一定是建立在好的基建和數據上的。

還有一點，我們是一個真正的AI native（AI原生）團隊，這對我們來說不是一個口號，而是日常工作方式。新人入職第一件事，就是教他用好AI工具。我們內部測算過，每個人配合自己的agent（智能體），處理大量基礎工程任務的效率是以前的好幾倍，某種程度上一個人可以干原來一支小團隊的活兒。這也是我們三十個人覺得夠用的原因，這批高密度的人，每個人又能最大化地發揮AI的乘數效應，三十個AI原生的人，實際的戰斗力能當幾百人用。

當然核心的洞察和判斷，代碼風格的把控、工程架構的設計，這些還是得靠人來把關，AI替代不了。

外部叫我們"NEO Lab（新生代實驗室）"，我們自己也覺得還挺貼切的。團隊里每個人都是帶著好奇心來的，做自己覺得有價值的事。我們珍視每一個人，每個人都很重要。

創投家：這種純研發導向的周期，會受到資本挑戰嗎？

陳博遠：其實我們的速度比自己預期的快很多了，內部看到了一些Scale up（規模化提升）的跡象。我們認為半年到一年內能產生一些有意思的成果。投資人對我們的長期主義十分理解和支持。

我們現在解決的是底層的科學問題——世界模型怎么真正學到物理因果，這件事目前全世界沒有人做出來。但歷史反復證明，一旦核心科學問題被突破，后面的工程化和商業化反而是水到渠成的事。OpenAI花了好幾年解決語言模型的Scaling Law（規模定律）問題，Anthropic花大量時間研究對齊和安全，當時外界也覺得太慢、太學術，但科學問題一旦解決，產品和商業價值是爆發式的。我們相信世界模型也是同樣的邏輯。

創投家：上一輪融資主要花在哪？

陳博遠：主要花在算力和數據上。基模訓練、預訓練、強化學習，都很吃算力。同時也在廣納賢才。

創投家：年初說四季度發布旗艦模型，進度如何？

陳博遠：進度還不錯，我們希望今年發布一個旗艦世界基座模型，真正關注物理正確性本身，給世界模型領域帶來一些不一樣的東西。

創投家：在你心中，逆矩陣的終極形態是怎樣的？

陳博遠：我在讀Google的Deepmind創始人，Demis Hassabis自傳時，有一段很有意思的對話——當別人問DeepMind想成為什么樣的公司時，他說：“想成為獲得最多諾貝爾獎的公司。”

整個世界模型還有很多問題需要解決，架構、算法、數據。我們之后會發布技術報告，把前期探索的東西展現給外界。核心關鍵就是把真正通用的世界基礎模型帶給大家，帶給整個AI，讓人工智能真正從數字世界走進物理世界，為具身智能、工業仿真、游戲這些產業提供底層的通用物理認知引擎。

創投家：再聊聊你的成長經歷吧，你是怎么一步步走到今天這條路上的？

陳博遠：我出生在山東的一個普通家庭，高考到北大元培學院。父母從小對我放養，所以我小時候經常自己泡書店，研究一些奇怪的東西。我特別喜歡動手，比如自己做小發電機什么的。

后來中學時代我開始對數學特別感興趣，越級學習成為一種習慣。高中開始打數學競賽，但很快感覺我更想做一些探索新規律的事情。數學本身就是AI的底層語言，我們現在可以看到，Hinton學的是心理學和數學，LeCun是信號處理出身，Ilya本科就是數學，其實從數學走向AI是一條很自然的路，而世界模型要做的事情，本質上也是用數理邏輯去逼近物理世界的規律。

創投家：什么時候對AI產生了興趣？

陳博遠：2021年，高二的時候，偶然聽到北大的一位學長在線上介紹人工智能這個專業。當時AI還沒現在這么火，沒有大模型的概念。但我記得很清楚，當時腦子里閃過一個想法——這就是我想做的事情，我就是為這個學科而生的。

我一直覺得數學研究必須要有一個能落地、產生社會變革意義的方向，現在看起來，那就是AGI（通用人工智能）。到了高三，我的書桌上有一個小紙條，寫著三個詞：北京大學、元培學院、人工智能。

創投家：應該有很多選擇吧？為什么選擇北大元培？

陳博遠：高考結束后，清華招辦也聯系過我。但我還是比較堅定想去北大元培。元培對我來說意味著自由的土壤。北大強調“思想自由，兼容并包”，元培的院訓是“尚自然展個性，化孤獨為共同”。人工智能本身就是跨學科的結合，這里給我更大的空間。

創投家：大一就開始發頂會論文，當時是什么想法？

陳博遠：我在大一寒假確定做強化學習，去聽了楊耀東老師一門大三的《多智能體系統》，楊老師驚訝課堂里來了個大一的學生，我們聊得很投機，后來就加入了課題組。也是在那時候認識了嘉銘。至于發頂會論文、北大年度人物，對我來說都算是比較幸運的事情。我更多還是一個興趣驅動、熱情驅動的人，這些頭銜對我是一種意外之喜，但不是出發的目的。

創投家：為什么本科畢業就選擇創業，而不是讀博或者去大廠？

陳博遠：之前也有一些不錯的去處，DeepSeek、Google的研究團隊都聯系過我，我們幾位聯創都能在大廠拿到很好的offer。但大家核心還是想自己組建一個組織，做底層創新。

我們算過一個數：從第一次工業革命到現在，技術革新間隔從100年變成50年、25年。2025到2035年是AI原始創新的關鍵窗口，這個窗口會慢慢閉合。既然當下有想做的事和志同道合的團隊，為什么不現在就出來？

創投家：作為北大走出來的AI新生代，北大這個背景對你們意味著什么？

陳博遠：北大給我們最大的東西不是光環，是土壤。元培學院的院訓是"尚自然展個性，化孤獨為共同"，這種氛圍讓我大一就可以跑去聽大三的課，再到和大家一同凝聚一個團隊做前沿的探索。如果是一個按部就班的培養體系，這件事不會發生。

團隊里有很多北大的人，但不只是北大。我們的工程團隊來自各個大廠，也有浙大、中科大的同學。北大給我們的不是一個封閉的圈子，而是一種做事的方式——鼓勵你去碰最難的問題，允許你走一條沒人走過的路。我們第一輪融資的投資方之一就是北大校友基金燕緣創投，學校和校友體系在背后給了我們很實在的支持。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.