當外界還在討論誰才是機器人領域的當紅炸子雞時,一家名為無界動力的初創公司正以極其兇猛的姿態殺入大眾視野。
6月29日,這家成立于2025年的年輕企業,正式發布了全球首個“長時序雙向物理因果鏈”隱空間世界模型——MWA?具身通用大腦。
在斯坦福大學等頂尖機構聯合發起的RoboCasa桌面任務權威測試中,MWA以百分之七十五點二的平均任務成功率刷新了行業紀錄,直接拿下了全球第一,把英偉達的GR00T、小鵬的DIAL等一眾大廠的主流模型都甩在了身后。
![]()
(圖源:無界動力)
在這個瘋狂內卷的具身智能賽道,無界動力究竟憑什么能虎口奪食?
原因有很多,首先,目前業內流行的,以端到端動作預測為核心的VLA大模型,存在一個本質限制:即靜態的視覺-語言預訓練并不能夠捕捉物理動態與因果關系 ,這就導致模型能力無法泛化,具身智能會被嚴格限制在訓練過的場景中。
為了打破這種限制,以英偉達為首的行業巨頭們開始推行世界模型+VLM+VLA的組合,其中VLM負責理解圖像和語言,VLA負責把視覺、語言指令轉化為動作,世界模型則負責預測環境接下來可能發生什么。
把具身智能拆解為理解、行動和預測,這種做法確實能為現有的機器人添加理解當前狀態、預測動作后果的能力,但是過于復雜的真實世界,會讓這類世界模型把大量算力放在預測“下一幀畫面長什么樣”上,顯得有些舍本逐末。
而無界動力的MWA走的是另一條路:隱空間世界模型。
![]()
(圖源:無界動力)
具體來說,MWA模型不需要預測下一幀畫面,也不需要還原這個世界的所有像素細節,它專注于在高度抽象的腦內空間里,專門琢磨物體是怎么運動的,以及動作會產生什么后果。
就像人類騎自行車一樣, 你騎車時也不會去計算周圍樹葉的反光和地面的每一道紋理吧,你依靠的是對平衡、重力和摩擦力的直覺。
更厲害的是,它不僅能看懂,還能提前預判。以前的模型是走一步算一步,而MWA具備了長時序推演能力。這就好比下象棋,新手只能看到眼前這一步,而它能在腦子里提前推演出接下來好幾步的連貫動作。
理論上,這能解決機器人干細活時動作不連貫、容易出錯的老毛病。
![]()
(圖源:無界動力)
為了讓這個大腦更加聰明,無界動力還搞出了一套非常有意思的訓練方法。
市面上的大多數公司都在喂給機器人成功的操作視頻,但無界動力卻專門建立了一個負樣本數據體系,搜集了數萬條機器人搞砸了的數據,比如打滑、磕碰、東西飛濺等。
他們不靠人工去給這些失敗視頻打標簽,而是讓機器人自己去反思為什么會搞砸。這種在錯誤中不斷試錯的方法,讓機器人更加清楚自己動作的極限在哪里,也幫助它們建立了一個極其清晰的物理安全邊界。
在高精密插接任務的實測中,這種方法的加入讓機器人在嘈雜環境下的成功率最高提升了5倍。
![]()
(圖源:無界動力)
對比整個行業,MWA確實有其過人之處。它打破了對人工動作標簽的嚴重依賴,環境適應力更強,把它扔到一個極其凌亂的非標準場景房里,它也能靠著自己掌握的物理常識去干活,而不會因為沒見過某個特定的盤子就直接宕機。
但熱鬧看完了,還得看門道。這些擁有聰明大腦的機器人,到底去哪了?
按照官方披露的信息,無界動力已經和遠景科技集團簽下了一筆超過五億元人民幣的全球市場大單。隨著他們的第二代機器人K15即將大批量投產,這些機器人會被送到風電、光伏等能源工廠里,去執行復雜的多步驟裝配任務。
![]()
而在商業零售領域,他們也已經和國內外知名的連鎖咖啡品牌展開合作,讓機器人在動態的開放店面里應對各類突發狀況。工廠老板和消費巨頭們愿意掏真金白銀,本質上是對這種技術路線實際作業能力的認可。
總的來說,無界動力這次發布的MWA?隱空間世界模型,確實為具身智能行業帶來了一股強勁的新風。它證明了讓機器人去理解物理本質,遠比讓它們死記硬背人類語言要靠譜得多。
但拿下榜單第一,僅僅只是大考的開始。如何讓前沿技術轉化為你我身邊的日常管家,讓具身智能真正走入千行百業,還需要無界動力與全球合作伙伴攜手努力方可達成。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.