網易首頁 > 網易號 > 正文 申請入駐

拒絕透露姓名,卻拿了兩個世界第一:具身圈大佬們都在打聽它是誰

0
分享至



編輯|楊文、陳陳

這幾天,世界模型賽道格外熱鬧。

李飛飛空間智能獨角獸 World Labs 高調推出「Spark 2.0」,阿里隨即上線世界模型「快樂生蠔」。

幾乎同一時間,Physical Intelligence 也發布新模型 π 0.7,并強調其對未見任務的初步組合式泛化能力與跨機器人平臺遷移特性。

這一系列動作本身釋放了一個信號,行業競爭的焦點,已經從誰會做單點動作,轉向誰更接近將「預測世界」和「驅動行動」統一在同一個模型里。

在這個節點上,一款名為MotuBrain 的神秘世界模型,悄無聲息地登上兩個國際 benchmark 的榜首,沒有任何公司署名。

如果只是單榜第一,這件事或許并不稀奇。

但問題在于,它同時拿下的,是兩個幾乎代表行業「兩個極點」的榜單:一個是衡量世界模型「是否真正理解和預測現實世界」的 WorldArena;另一個則是衡量機器人任務執行能力與泛化能力的 RoboTwin2.0。一個偏世界預測,一個偏任務執行,加在一起,恰好對應了行業當下最想攻克的那個統一命題。

在 WorldArena 上,MotuBrain 以 63.77 的總體 EWM Score 位居第一,從結果來看,其表現超越了高德的ABot、極佳GigaWorld-1等模型,并在 Motion Quality、Flow Score、Motion Smoothness 等多個關鍵運動維度上全面領跑。



圖片來源:https://huggingface.co/spaces/WorldArena/WorldArena

而在 RoboTwin2.0 中,MotuBrain 在 Clean 和 Randomized 兩個場景下分別達到 95.8 和 96.1,同樣排名第一,是榜單上唯一一個在隨機環境下平均分超過 95 的模型,在大多數具體任務中也都取得了 100 或接近 100 的成績。相較于高德 ABot、螞蟻靈波 LingBot、JEPA-VLA、pi0.5等模型,MotuBrain 在 RoboTwin 基準測試中具有統治級的表現。





正是這種「雙料第一」,才讓我們注意到這款來歷不明的模型。

簡單搜索了一下,目前網上還未找到任何有關 MotuBrain 的信息,不過我們發現了這個本月剛剛注冊的 X 賬號。



這讓我們想起前段時間被阿里認領的「歡樂馬」(后續也開了 X 賬號)。

這個神秘世界模型,不會也是來自國內哪家大廠吧?

為什么 MotuBrain 的成績值得關注?

WorldArena 和 RoboTwin 并不是兩個同類型的測試,它們測量的是兩種不同的能力。

WorldArena 考察的是world model 維度,包括模型能否理解運動規律,能否對時間序列中的物理變化做出準確的推演和預測,以及是否具備對環境狀態變化的認知能力。這是預測世界的能力。

RoboTwin 則偏向action model 或 policy model 的維度,比方說模型能否在多任務、多環境下穩定執行動作,能否泛化到沒見過的場景,是否具備持續完成復雜操作的能力,而這些是在世界中行動的能力。

不妨做一個類比。人類司機之所以能在復雜路況下安全駕駛,靠的不只是肌肉記憶,更是對下一秒會發生什么的持續預判,比如前車會不會急剎?行人會不會突然橫穿?這種預測與行動的同步進行,是人類智能的底層邏輯。

現有的大多數機器人系統,恰恰缺的就是這一層。它們要么擅長看懂世界卻不知道該怎么動,要么能執行固定動作卻對環境變化毫無預判。兩張皮的結果,是機器人一旦離開訓練場景就容易失控。

過去幾年,這兩個方向各自都有人在做,但往往是割裂的。做視頻生成和世界模型的團隊,關注的是模型能否真實模擬物理世界;做機器人策略和 VLA 的團隊,關注的是如何讓模型在具體任務上執行可靠。真正嘗試把兩者統一起來的工作本就不多,成果穩定的就更少。

MotuBrain 能夠在兩類 benchmark 上同時拿下第一,至少在 benchmark 層面上驗證了一件事,把預測世界和驅動行動統一在同一個模型里,這條路是走得通的。

雙料第一,它究竟贏在哪里?

在 WorldArena 榜單上,MotuBrain 更值得關注的是它在這些維度上的領先。

  • Motion Quality 第一,這代表模型生成的動作本身更加真實,而非停留在視覺上看起來像在動的特效層面。
  • Flow Score 第一,說明模型對連貫動作和運動軌跡的理解更深,且能夠穩定預測大幅度的動作變化,可以把前一個時刻和后一個時刻絲滑地銜接起來,而不是逐幀拼湊。
  • Motion Smoothness 第一,代表生成出來的動作更符合真實的物理規律,不會出現那種不自然的突然加速、抖動或方向跳變。

這三個維度,都和運動直接相關。對于一個未來要服務機器人的世界模型來說,這正是最關鍵的能力。

而在更偏任務執行的 RoboTwin 上,這種優勢被進一步放大。面對 50 個任務、兩種不同環境設置,MotuBrain 的平均得分達到 96.0,顯著高于第二名的 92.3,領先幅度幾乎等同于第二名到第五名之間的差距。

更關鍵的是穩定性。一半任務成功率達到 100%,九成任務超過 90%。這不僅意味著能做對,更意味著在多任務和隨機擾動環境下依然能夠穩定復現結果。

這些成績放在一起看,指向的是一種更接近通用機器人大腦的特征,既能保持動作層面的連續與一致,又具備跨任務的泛化能力。

背后是誰,走的是條什么路子?

目前關于 MotuBrain 的公開信息寥寥無幾,但從這次雙榜的成績結構來看,它背后大概率不是傳統的視頻模型,也不是單純的 VLA 或 policy model。

過去一年,行業內圍繞 world model 和 action model 的探索各自形成了幾條有代表性的路線。

有的強調統一世界模型,通過視覺、語言、視頻與動作的聯合建模,融合視頻模型、VLA、世界模型等等路線,從而實現對真實環境的感知、規劃、預測、執行和跨任務泛化,典型代表是去年 12 月發布的 Motus。

有的更偏向于「先想象、再行動」的路徑,譬如今年一月底發布的 Lingbot-VA 就是先用視頻模型進行未來視頻預測,再反向指導機器人動作決策,兩者融合到一個模型里。

還有一些走的是「同步推演未來狀態 + 生成動作」,邊推演邊行動的 World Action Model,比如英偉達二月初發布的 DreamZero。

從 MotuBrain 這次的表現來看,它可能走了一條偏 World Action Model的路線,兼具 world model 對環境和未來狀態的推演能力,以及 action model 在真實任務中的執行能力。

這也就能解釋它為何能同時在「世界建模」和「動作執行」兩類 benchmark 上問鼎。

結語

如果把一臺機器人拆開來看,可以理解為「手腳」是硬件,而「大腦」是軟件。

過去幾年,機器人硬件的迭代速度有目共睹,運動控制越來越精準,傳感器越來越豐富,成本越來越低。但真正制約機器人大規模落地的,是那顆指揮任務的大腦。

現在的機器人,本質上還是「為特定任務訓練的專用系統」。換一個場景、換一個物體、換一條指令,就可能完全失效。這很大程度上歸因為智能問題。

具身智能的目標,是構建一個統一模型。既能理解物理世界、預測狀態變化,又能據此生成可靠動作,從而適配任意任務與場景。

這個邏輯,資本已經用真金白銀給出了判斷。

觀察最近這幾筆大額融資不難發現,資金正密集涌向那些打造機器人「大腦」的公司。表面投的是機器人,實際上搶占的,可能是下一代「機器人操作系統」或「通用物理大腦」的入口。

如此看來,以 Motubrain 為代表的 world+action 統一架構,恰好站在了這場卡位戰的核心位置。

至于 Motubrain 背后究竟是哪支團隊,接下來又會帶來什么,這個問號大概不會懸太久。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
CBA季后賽12進8賽程出爐,廣東男籃率先公布票價 第一豪門實至名歸

CBA季后賽12進8賽程出爐,廣東男籃率先公布票價 第一豪門實至名歸

順靜自然
2026-04-25 21:26:09
上交所、深交所、北交所,同日公告

上交所、深交所、北交所,同日公告

上觀新聞
2026-04-26 00:08:08
當年差點成天王嫂的她,39歲借浪姐7復出,卻因跨國婚姻備受爭議

當年差點成天王嫂的她,39歲借浪姐7復出,卻因跨國婚姻備受爭議

財叔
2026-04-25 08:30:21
泰國潑水節一名15歲少女遭軍人尾隨進公廁性侵,監控曝光,嫌疑人已投案自首,將被移送軍事法庭

泰國潑水節一名15歲少女遭軍人尾隨進公廁性侵,監控曝光,嫌疑人已投案自首,將被移送軍事法庭

揚子晚報
2026-04-21 22:25:47
臺高層已抵達非洲,大陸徹底看清:特朗普的最壞打算是什么

臺高層已抵達非洲,大陸徹底看清:特朗普的最壞打算是什么

不甜的李子
2026-04-26 08:23:54
中國女籃雙星留洋首秀:楊舒予31分末節16分獲MVP 陳明伶19分

中國女籃雙星留洋首秀:楊舒予31分末節16分獲MVP 陳明伶19分

醉臥浮生
2026-04-25 20:04:15
30年來最大叛徒!如今被開除日本乒乓球隊,還被吊銷駕照

30年來最大叛徒!如今被開除日本乒乓球隊,還被吊銷駕照

酷侃體壇
2026-04-24 23:10:37
大面積閉店!深圳“奶茶一姐”為何輸給了河南草根兄弟?

大面積閉店!深圳“奶茶一姐”為何輸給了河南草根兄弟?

帥真商業
2026-04-15 18:58:55
拿了錢還不放人!19歲花季少女被困柬埔寨56天,綁匪正臉照曝光!

拿了錢還不放人!19歲花季少女被困柬埔寨56天,綁匪正臉照曝光!

今朝牛馬
2026-04-07 22:43:23
敲詐中國10億美元、拒絕中國飛機借道,如今這個國家又找上中國!

敲詐中國10億美元、拒絕中國飛機借道,如今這個國家又找上中國!

春序娛樂
2026-04-20 04:52:53
中國第四艘航母官宣:是核動力!舷號19,命名大概率是“江蘇號”

中國第四艘航母官宣:是核動力!舷號19,命名大概率是“江蘇號”

書紀文譚
2026-04-25 16:03:21
被原村支書開鏟車活埋后續!知情人曝糾紛細節,人在醫院情況不好

被原村支書開鏟車活埋后續!知情人曝糾紛細節,人在醫院情況不好

奇思妙想草葉君
2026-04-25 23:56:55
尼日爾撕毀4億美元合同,驅逐中國高管,我方暗藏后手,給它狠狠教訓

尼日爾撕毀4億美元合同,驅逐中國高管,我方暗藏后手,給它狠狠教訓

詭譎怪談
2025-04-30 23:32:55
閆闖 被問買問界M6和Model Y哪個好? 被旁邊大哥一句話干沉默了

閆闖 被問買問界M6和Model Y哪個好? 被旁邊大哥一句話干沉默了

周哥一影視
2026-04-11 03:19:35
贏球也挨批!曼城功勛王牌徹底低迷,拖垮全隊險些爆冷

贏球也挨批!曼城功勛王牌徹底低迷,拖垮全隊險些爆冷

瀾歸序
2026-04-26 05:45:25
炸鍋了!俄戰地大佬公開認慫:2026必輸,趕緊轉防御保命

炸鍋了!俄戰地大佬公開認慫:2026必輸,趕緊轉防御保命

老馬拉車莫少裝
2026-04-23 21:32:27
內塔被上百國通緝,中方打破沉默,在安理會出手,明牌清算以色列

內塔被上百國通緝,中方打破沉默,在安理會出手,明牌清算以色列

軒逸阿II
2026-04-26 08:44:53
《八千里路云和月》一頓飯成真愛驗金石,難怪萬福玉嬌結局最圓滿

《八千里路云和月》一頓飯成真愛驗金石,難怪萬福玉嬌結局最圓滿

樓蘭娛姐
2026-04-25 17:47:08
伊朗外長將再次訪問巴基斯坦

伊朗外長將再次訪問巴基斯坦

新華社
2026-04-26 06:03:02
孟子曰:“男女授受不親”,其實后半句才是真相,老祖宗可不保守

孟子曰:“男女授受不親”,其實后半句才是真相,老祖宗可不保守

鶴羽說個事
2026-04-23 22:16:52
2026-04-26 10:16:49
機器之心Pro incentive-icons
機器之心Pro
專業的人工智能媒體
12852文章數 142636關注度
往期回顧 全部

科技要聞

漲價浪潮下,DeepSeek推動AI“價格戰”

頭條要聞

牛彈琴:伊朗放了美國人鴿子 特朗普被氣壞了

頭條要聞

牛彈琴:伊朗放了美國人鴿子 特朗普被氣壞了

體育要聞

那一刻開始,兩支球隊的命運悄然改變了

娛樂要聞

《我們的爸爸2》第一季完美爸爸翻車了

財經要聞

90%訂單消失,中東旺季沒了

汽車要聞

2026款樂道L90亮相北京車展 樂道L80正式官宣

態度原創

手機
教育
房產
藝術
公開課

手機要聞

停更一年憋大招!小米大折疊攜玄戒O3回歸,系統也是新的

教育要聞

學校管理:“管”出規范,“理”出活力

房產要聞

新一輪教育大爆發來了!海口,開始瘋狂建學校!

藝術要聞

鄭麗文訪問清華附中引發熱議,蔣中正信札字跡真實性遭質疑

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版