无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

超越Sora,通往物理世界:賈奎詳解世界模型驅動的具身智能新范式

0
分享至

盡管當前學術界和產業界對人形機器人與具身智能投入巨大,但一個嚴峻的挑戰也隨之浮現:為何當前的機器人AI,在語言能力上表現出色,但在物理行動上卻步履維艱?

▍人形機器人的局限性與理解缺失

人類真實世界是連續、高維且充滿動態變化的復雜系統。當人形機器人的任務復雜度提升——例如,讓它從“在桌上抓取蘋果”變為“在雜亂廚房里找到容器并倒一杯牛奶”這類長序列任務,機器人的模型需要處理的變量和邏輯(如判斷瓶蓋是否需要擰開、杯子是否需要扶正)急劇增加。這導致所需的數據量呈指數級增長,而系統的成功率則大幅下降。

這種困境的根源在于,大多模型跳過了對世界本質的理解,直接在數據層面進行模仿。從指令“請幫我切開這個蘋果”到機器人完成動作,中間缺失了對幾何、物理、因果關系等關鍵“中間知識”的理解。沒有這些知識,模型的泛化能力便無從談起,只能在高度受控的環境中運行,一旦進入真實、復雜的場景便會失效。

▍技術的迭代與全新度量衡

如何讓機器人在復雜的物理世界中進行有效交互,一直是具身智能領域的核心挑戰。

圖靈獎得主Yann LeCun提出了“世界模型”(World Model)的概念,他認為真正的智能必須建立在對世界運作方式的理解之上。這個模型的核心思想是讓智能體在行動前,能通過內部模擬來預見“如果我這樣做,世界會發生什么?”,從而做出更優的決策。今年,這一理念也獲得了業界的廣泛回響,涌現出眾多相關研究。

與此同時,以 Sora 為代表的視頻生成模型的驚人進展,似乎為構建世界模型帶來了曙光。如果AI能夠“看見”并“想象”出行動的視覺后果,它是否就能夠解決上述問題?然而,我們必須認識到,預測像素層面的視覺變化,與真正理解其背后的物理規律(如因果、物體恒存、重力等)之間,存在著巨大的鴻溝

當前的視頻生成模型更像是一個視覺連貫性生成器,而非精確的世界模擬器。它生成的視頻可能在視覺上看似合理,但其中的物理過程可能是失真的:一個球的彈跳可能違反能量守恒,一次碰撞可能不遵循動量定律。模型學會了“推動”與“移動”在視覺上的關聯,卻沒有理解其背后的物理因果鏈條。這種缺失對于需要與物理世界精確交互的機器人是致命的。

如果說機器人在LLM時代,其核心是“規模定律”(Scaling Law)——更大的模型和更多數據帶來更強的能力,那么人形機器人與具身智能時代則迫切需要一個新的指導原則。

跨維在此提出了一種名為“效率法則”(Efficiency Law)的新思路。該法則的核心關注點不再是靜態的數據量,而是動態的數據生成效率。即:在給定的算力和時間預算下,一個智能體能以多快的速度,通過與環境的自主交互,自動化地生成高質量、蘊含物理知識的經驗數據,并據此提升自身解決問題的能力?

“效率法則”揭示了具身智能的核心瓶頸:我們缺的不是算力,而是將算力高效轉化為有價值物理經驗的機制。依賴人類示教或真實世界互動的方式,數據生成效率極低。要實現突破,必須構建一個能自動化、高效率生成高質量數據的“學習飛輪”。

▍跨維智能的解決方案:GS-World生成式仿真世界模型

基于以上思考,跨維智能提出了一套全新的范式:GS-World(Generative Simulation World Model,生成式仿真世界模型)。

GS-World代表了一次根本性的思想轉變:與其預測世界的外在表象(像素),不如生成世界的內在機理(物理)。它不是一個視頻生成器,而是一個可交互、懂物理、可微分的動態仿真引擎。

GS-World的核心能力,是以統一的生成式框架,直接產出驅動物理世界運轉的核心要素:

? 3D資產生成:自主生成剛體、軟體、流體等物體的幾何模型與外觀。

物理屬性生成:為資產賦予質量、摩擦系數、彈性模量等真實物理參數。

? 動力學模型生成:理解并生成物體間的作用力、約束關系和運動方程。

簡而言之,當GS-World面對一個場景,它思考的不僅僅是“畫面會如何變化”,更是“構成世界的元素是什么?它們遵循哪些物理規律?施加一個力會引發怎樣的因果傳導?”。它生成的是一個可供機器人反復實驗和驗證的“物理沙盒”,而非一段被動的視頻。

實現路徑

要實現Physical AGI,我們設想了一條清晰的技術路徑:讓VLA模型學會與物理引擎“合作”,并最終讓機器人大腦成為一個“懂物理”的引擎本身。

具體而言,不再去猜測物體運動的軌跡,而是學習調用和理解一個內置的、可微分的物理模擬器。當機器人觀察一個場景時,它會學習生成該場景的3D模型、物理屬性,并設定交互規則。這個過程是“可微分”的,意味著每一次模擬的成敗都能轉化為明確的數學信號(梯度),指導模型如何修正其內部參數。通過這種方式,模型學習生成的是由物理規律驅動的、可交互的動態世界。

更進一步,機器人最終能超越人類編寫的固定規則。通過觀察真實世界,可以自主學習并歸納出難以用公式描述的復雜物理現象(如線束穿過小孔、粘性液體流動),從物理規則的“使用者”變為“發現者”和“建模者”。這極大地彌補了理想化模擬與復雜現實之間的鴻溝(Sim-to-Real Gap)。

▍技能學習的新范式:在內部物理世界中規劃與演練

擁有GS-World后,機器人學習技能的方式將發生根本性改變。它可以在行動前,在內部世界里進行數萬次零成本、超高速的虛擬演練。

1.基于“可供性鏈”的任務分解

以“倒咖啡”為例,任務需要被分解。這個分解過程基于機器人對物體物理用途的理解,我們稱之為“可供性鏈”(Chain of Affordance)推理。

? 物體可供性 (Object Affordance):機器人從內部模型中知道杯子的位置、重量、材質以及如何抓握。

? 操作可供性 (Manipulation Affordance):在模擬中驗證“按下”按鈕的可行性,“傾倒”咖啡所需的姿態和力度。

? 空間可供性 (Spatial Affordance):理解杯子應被放置的區域,以及移動路徑上是否有障礙。

通過這種推理,機器人能將復雜任務自主分解為一系列物理上可行、邏輯上連貫的子任務。

2.閉環的“演練-評分-反思”

對于每個子任務,機器人在GS-World中通過強化學習或運動規劃進行優化。同時,它具“具身反思推理”(Reflective Embodied Reasoning)能力。如果在模擬中發現某一步反復失敗(例如“拿起杯子”),它會回溯并探索其他任務分解或技能執行策略,而不是盲目重試。這個“分解-演練-評分-反思”的閉環,構成了一個強大的“技能生成引擎”。

▍從虛擬到現實:通往真正可用的機器人智能

GS-World的最終價值在于解決“從模擬到現實”(Sim-to-Real)的遷移難題。

跨維智能提出的新一代VLA模型架構,其高層規劃腦(System 2)與低層執行腦(System 1)共享同一個源自GS-World的物理世界觀,確保了“思考”與“行動”在物理層面的統一。

最關鍵的是,GS-World通過學習物理本質而非視覺表象,解決了當前生成視頻類世界模型距離落地應用的核心難題。當機器人進入現實世界,與物體的運動學參數、動力學參數相關的物理法則是不變的。GS-World學習的正是這些超越視覺、連接虛擬與現實的“領域不變”知識。因此,在GS-World中學成的技能,能夠以極少調整甚至“零樣本”的方式,直接遷移到真實機器人上。

這引領我們走向一種全新的“引擎驅動學習”(Engine-driven Learning)范式。具身智能體擁有了一個永不枯竭的數據源——GS-World,可按需生成無窮無盡的訓練場景,可以在持續的自主探索中實現自我進化。我們甚至可以利用這套框架,在模擬中評估并優化機器人的硬件形態(如臂長、關節數量),實現軟硬件的一體化協同進化。

▍結語

我們正處在人形機器人與AI發展的關鍵路口:一條是繼續在數據與像素表象上進行模型訓練,追求在特定場景下的成功;另一條則是選擇更具挑戰但更穩固的道路,教會AI真正理解并掌握世界運行的根本法則——物理。

GS-World所倡導的正是第二條道路。它構想的未來是,AI不再是僅僅模仿人類行為的系統,而是能通過內部世界的物理推演來理解、預測并與世界進行創造性互動的理性行動者。我們堅信,這條路將為通往真正穩固、可解釋、可擴展的通用人工智能奠定堅實的基礎。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
墻倒眾人扶!被人民日報點名的李維剛,再次證明真誠才是必殺技

墻倒眾人扶!被人民日報點名的李維剛,再次證明真誠才是必殺技

舊事別提
2026-06-12 07:09:01
教科書上有哪些令你觸動的話?網友:所有的蝗蟲都會在秋風中死去

教科書上有哪些令你觸動的話?網友:所有的蝗蟲都會在秋風中死去

夜深愛雜談
2026-06-13 23:31:52
社保繳費變了!2026年6月1日起執行

社保繳費變了!2026年6月1日起執行

新浪財經
2026-06-13 00:11:54
“把兒子當外人整呢”,一根破爛眼鏡腿,讓人心疼高考男生處境

“把兒子當外人整呢”,一根破爛眼鏡腿,讓人心疼高考男生處境

澤澤先生
2026-06-13 21:43:34
徹查!信號強烈!中央升級反腐“天網”!

徹查!信號強烈!中央升級反腐“天網”!

職場資深秘書
2026-06-13 16:01:25
婆婆退休擺十桌唯獨漏我,我關機旅游七天,老公哭訴:媽出大事了

婆婆退休擺十桌唯獨漏我,我關機旅游七天,老公哭訴:媽出大事了

千秋文化
2026-05-31 22:19:38
世界杯預測:冷門震碎三觀的一天

世界杯預測:冷門震碎三觀的一天

生活新鮮市
2026-06-13 14:30:34
中東那個惡霸終于死了,不是被打死的,是被特朗普的談判拖死的!

中東那個惡霸終于死了,不是被打死的,是被特朗普的談判拖死的!

云舟史策
2026-06-14 07:48:18
日本隊慌了!中國隊首發五虎預測:雙塔鎖內線,三個海歸領銜

日本隊慌了!中國隊首發五虎預測:雙塔鎖內線,三個海歸領銜

童叔不飆車
2026-06-14 00:39:15
“清淡飲食”正在毀掉中老年人的血管!我國近20%的老年人患有肌少癥,不吃肉,血管反而越來越脆

“清淡飲食”正在毀掉中老年人的血管!我國近20%的老年人患有肌少癥,不吃肉,血管反而越來越脆

消化石醫生
2026-06-05 21:28:28
中國政府債券余額首次突破100萬億元

中國政府債券余額首次突破100萬億元

第一財經資訊
2026-06-13 13:16:38
天降橫財!男子入獄前,花120萬買股票,6年后出獄,變成4.9億!

天降橫財!男子入獄前,花120萬買股票,6年后出獄,變成4.9億!

川渝視覺
2026-05-13 22:09:30
她是足球報主任,和董路水火不容對罵5年,如今仍在足球媒體一線

她是足球報主任,和董路水火不容對罵5年,如今仍在足球媒體一線

青梅侃史啊
2026-06-13 16:36:45
世界杯最新積分榜:亞洲球隊強勢!再爆大冷南美1平1負歐洲2平1負

世界杯最新積分榜:亞洲球隊強勢!再爆大冷南美1平1負歐洲2平1負

求球不落諦
2026-06-14 08:36:13
王毅收到蒙古國外長的邀請,稀土外運日本一事,想聽聽中方想法?

王毅收到蒙古國外長的邀請,稀土外運日本一事,想聽聽中方想法?

共工之錨
2026-06-13 00:25:29
不要讓俄國進來! 1976年4月2日《人民日報》

不要讓俄國進來! 1976年4月2日《人民日報》

那些看得見的老照片
2026-05-21 20:30:03
李連杰一家三口拜見仁波切,64歲利智許久不見,顏值回春如昔日!

李連杰一家三口拜見仁波切,64歲利智許久不見,顏值回春如昔日!

娛樂團長
2026-06-02 15:09:12
拉杜卡努晉級女單決賽將戰維克奇

拉杜卡努晉級女單決賽將戰維克奇

體壇周報
2026-06-14 02:10:57
釘釘員工自曝作息大改,內部爭議曝光

釘釘員工自曝作息大改,內部爭議曝光

影視情報室
2026-06-14 00:39:31
我幫同事點了份32元的外賣,用紅包抵扣了12元,實際付款20元;隨后同事轉賬給我,當我看到金額后,當場傻眼!

我幫同事點了份32元的外賣,用紅包抵扣了12元,實際付款20元;隨后同事轉賬給我,當我看到金額后,當場傻眼!

勵職派
2026-06-13 19:22:04
2026-06-14 10:32:49
人形大講堂
人形大講堂
人形大講堂是面向人形機器人產業,集中展現前沿技術、創新產品、場景應用和產業進程的行業深度媒體平臺。
261文章數 2關注度
往期回顧 全部

科技要聞

Anthropic最強模型被禁,傳亞馬遜通風報信

頭條要聞

牛彈琴:一不小心美國又創造歷史 英格蘭隊被"一鍋端"

頭條要聞

牛彈琴:一不小心美國又創造歷史 英格蘭隊被"一鍋端"

體育要聞

美國4比1巴拉圭:這統治力真是美國隊?!

娛樂要聞

鄧超曬孫儷親手織的帽子,笑瘋全網!

財經要聞

金價跌至900元關口,大媽又來抄底了!

汽車要聞

深藍S07華為乾崑激光版增程車型上市 限時15.49萬元起

態度原創

房產
手機
親子
健康
數碼

房產要聞

海南最賺錢行業曝光!最快4年半,海口全款買三房!

手機要聞

告別4499元!小米18起售價將突破5000元大關 首發高通驍龍8E6

親子要聞

真正覺醒的家庭

老人、小孩、孕婦,吃粽子有啥風險

數碼要聞

藍粉動漫風!映眾推出RTX 5070櫻花限定版:隱藏供電+磁吸背板

無障礙瀏覽 進入關懷版