无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

世界模型的新用途:不做選手,去當裁判

0
分享至

林方舟 發自 凹非寺
量子位 | 公眾號 QbitAI

眼下具身賽道都在卷世界模型,都在搶著做機器人的“大腦”。

然而,最近有一個叫「Uranus」的世界模型發布,不當具身大腦,卻做機器人開發的基礎設施,在市面上鮮有同類。

它瞄準的是具身智能行業的兩個痛點。

一個是benchmark。如今許多評測基準的公信力不夠強,它想更客觀地評測VLA和世界模型,做公正的“裁判”。

另一個是sim-to-real的gap。傳統仿真器里跑出來的分數很漂亮,搬到真實場景卻對不上,它想做機器人訓練的“場地”。

開發Uranus的團隊來自地平線分拆而來的機器人公司地瓜機器人。這家公司做的是“賣鏟”生意,定位是機器人軟硬件通用底座提供商。

雖然同行都在盯著機器人的大腦,但地瓜機器人的判斷是:腦子要變聰明,先得有一個能讓它反復試錯、穩定考試、還能復盤成績的平臺。



用途一:當具身模型的裁判

先來看Uranus的第一個用途:benchmark。

現在機器人常用的benchmark有兩種。第一種是真機評測,把訓好的模型搬上真實機械臂,在固定的場景和任務里反復跑幾十上百次,最后統計成功率。

它的缺點很明顯:一是效率低,驗證一個模型,得有人守在機器旁邊,反復重置環境,又慢又貴。

另一個是難以復現。哪怕環境看起來一樣,每次物體怎么擺、光照怎么變,都很難控制。一篇論文發表后,其他實驗室很難復現其中的評測結果。

第二種benchmark是仿真評測,在虛擬環境里跑任務。

它的優點是快、便宜、能復現;但麻煩是sim-to-real gap,仿真里的評測分數很高,一搬到真機就要打折,分數和真實能力無法匹配。

而Uranus走的是第三條路。用戶訓練好模型后,Uranus能根據模型輸出的動作一步步生成環境反饋,再得到成功率、軌跡偏差等指標。

這樣做的好處是:迭代效率比真機評測高很多,能控制變量,還能穩定復現;評測分數和模型在真實場景中的實際能力呈正相關,sim-to-real的gap很小。

地瓜機器人想把Uranus做成業內最有公信力的benchmark之一。

地瓜機器人算法副總裁隋偉說,現在benchmark的“刷榜”行為總引起爭議,是因為部分榜單依賴的學術指標與真實應用之間仍存在一定距離,相關數據也未必能充分反映真實場景中的復雜性。

而Uranus并不會刻意避免刷榜,關鍵是要保證刷出來的分數有意義,得分真的能匹配模型的實際能力。

用途二:支持機器人訓練的仿真器

除了當裁判,Uranus還有一個身份:機器人仿真器,主要用在manipulation(操作)領域。

傳統的物理仿真器,缺點是:貴、慢、效率低。手工構建仿真場景是一項浩大的工程,3D建模、材質設定、物理參數調校……每一個新環境都需要數天甚至數周的搭建。

就算費了這么大勁,渲染出來的畫面也總是不夠真實。這就引出了傳統仿真器的另一個缺點:sim-to-real gap。一些仿真器為了省事,會粗暴簡化物理規則,有時甚至連最基本的能量守恒都不滿足。

而Uranus并不是先手工還原一個3D世界,而是直接從數據里學習:機器人執行這個動作后,下一幀畫面會變成什么。

在Uranus里搭場景很簡單,給定幾幀參考圖像、機器人關節狀態、相機參數和一句文本描述,模型就能把對應的場景生成出來。

畫面越逼真,仿真器和真實場景之間的鴻溝就越小。團隊說,Uranus生成的視頻,肉眼基本分不出是實拍還是生成的。



所以Uranus是怎么做到的?

其中最關鍵的技術能力是:幀級閉環。它一幀一幀生成視頻,而不是一口氣生成一整段。

普通視頻生成模型一次性生成整段視頻,中間不能打斷,也不能根據新的動作改寫后續內容。

但機器人不能這樣工作。

模型看到當前畫面,輸出一個動作。動作執行后,環境發生變化,機器人再根據新的畫面輸出下一步動作。這個循環必須一步一步發生。只要中間斷開,強化學習和評測就都完不成。

所以Uranus每次只生成下一幀。新生成的幀會立刻進入歷史窗口,和下一步動作一起成為模型輸入。人也可以在任意時刻接管,改變動作指令,讓后續畫面沿著新的軌跡繼續生成。

打個比方,Seedance等視頻生成模型生成的,像是按劇本拍攝的電影;Uranus生成的,則更像是一個能實時交互的游戲。



但幀級閉環帶來的核心挑戰是誤差累積,每一步的微小預測誤差都會作為歷史條件喂入下一步,幾十步之后畫面就可能糊掉,甚至變成像素塊。

而Uranus突破了閉環長序列的瓶頸,雖然它訓練時只見過2秒短片段,但在推理時可以穩定運行60秒,并且全程保持畫質穩定。

很厲害是不是?不過還沒完,Uranus另一個核心能力是跨具身零樣本泛化。

用戶訓練模型時未必使用同一種具身硬件。如果評測平臺只支持一種本體,大家又得回到找真機、搭環境、重新測的老路上。泛化性也無從談起。

目前,Uranus支持G1人形機器人、Franka協作臂,之后會增加更多本體。

不過,需要注意的是,Uranus目前僅支持manipulation(操作)訓練,還不支持locomotion(運動控制)訓練。

原因在于,Uranus現在的模態只有action、圖像和語言,還沒加進觸覺、摩擦力、電機信號等,所以撐不起locomotion的仿真訓練。

隋偉說,要補上這些模態,關鍵還是數據,而這類數據目前普遍還不成熟。

做地基,比做大腦更難

為什么地瓜機器人選擇把Uranus做成基礎設施,而不是具身大腦?

地瓜機器人大模型負責人秦文康說,現在很多世界模型把視頻生成作為一個輔助loss,但學術界通常不評價訓練過程中生成視頻本身質量的好壞。團隊看過許多世界模型生成的視頻,質量普遍還有提升空間。

Uranus團隊的觀點是,先把視頻生成質量做扎實,對下游動作生成訓練可能會有更大幫助。



還有一個反直覺的理由:具身大腦和基礎設施的底層原理是同一套,但做基礎設施比做大腦更難。

做具身大腦,有相對明確的學術成果;而做仿真器,還沒有特別成功的論文或范式能參考。

具體到技術上,做基礎設施要啃下三塊硬骨頭:

  • 像素級生成:評測和強化學習需要真實圖像作為輸入,只在latent空間里預測不夠。
  • 跨視角一致性:機器人常常有多路相機,手眼相機、環境相機、第三視角相機必須在同一時刻對得上。
  • 幀級閉環:每一步都要接動作、出反饋,還要把自己的輸出繼續喂回去。

許多機器人公司不愿意開發基礎設施,因為大家普遍缺算力,而視頻訓練又是出了名的吃資源、不確定性強,很多人不愿拿有限的資源去賭一個不確定的結果。

而地瓜機器人將自身定位為機器人界的“英偉達”,他們一直建的是“地基”,提供機器人所需的芯片方案、開發工具、訓練和部署平臺。

Uranus正好能順勢嵌入地瓜機器人的生態,一頭接評測,一頭接強化學習訓練,恰好是開發流程里最重要的兩環。

三分之二的力氣,花在了“臟活”上

最后,再來聊聊Uranus是怎么誕生的。

地瓜機器人開發團隊給出的答案有些出人意料:搭infra、處理數據這種看起來沒什么技術含量的“臟活累活”,反而耗費了整個項目三分之二的精力和資源。

先說infra,團隊一半以上的精力都砸在了這上面。

比如,存儲不是買夠硬盤就可以,Uranus面對的是PB量級的數據,團隊為此設計了分層存儲方案。到了訓練階段,還得解決數據怎么加速訪問的問題。

算力也讓人頭疼。今年上半年,市場上突然到處都找不到卡,單一云服務商無法滿足算力需求,團隊不得不花大量時間設計跨云的算力協調方案。

要訓練高分辨率、長時間的視頻,單卡顯存裝不下,需要把同一段視頻切開,在不同卡上并行計算,再把結果聚合回來。

總之,從存儲怎么選、算力節點放在哪個機房、網絡怎么連,到上層訓練數據的熱存儲加速,團隊全都重新優化了一遍。

團隊做完這些工作后的感受是:語言模型領域已經形成共識,沒有infra就不要談大模型。但具身行業對infra的重視程度還不夠。



除了infra,數據同樣讓人心累。

Uranus主要使用開源數據訓練,量級在幾百小時。但這些數據存在不少問題。

例如,有數據丟幀,需要做切片處理;有數據記錄的動作和視頻里實際執行的動作不匹配,需要用算法識別并修正;還有不少數據集連相機標定都沒有做好。

目前幾百小時數據還遠沒把Uranus喂飽,只要數據增加,模型能力就能提升,這條能力增長曲線還看不到收斂的跡象。

Uranus的計劃是,今年下半年把數據擴到幾千小時量級,明年做到數萬到十幾萬小時級別。

今年,很多具身公司喊出“百萬小時數據”的目標,但隋偉有不同看法。

他認為,一方面,現有算力很難支撐這么大的數據量。

另一方面,單純堆時長意義不大,同質化的數據對模型訓練的作用有限。哪怕真采了百萬小時,真正能起作用的數據可能還不到1%。

比起數量,數據的質量和多樣性更重要。

隋偉舉例,自動駕駛行業里談的不是時長,而是「clip數量」,也就是不同時間、空間、場景下采到的片段。

他說,當前的具身行業,模型決定下限,而數據決定上限。

Uranus的例子很能說明這一點:僅靠把相機標定做準、把動作畫面關系對齊、篩出臟數據,就能換來幾十個百分點的成功率提升,而算法卻達不到同樣的效果。

眼下很多關鍵工作歸根到底仍是數據工程,還沒到拼模型的時候。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
當一把高壓水槍,對準了蔚來的“豪華”

當一把高壓水槍,對準了蔚來的“豪華”

白夜若夢
2026-07-02 10:58:04
特朗普賬號買入500萬美元電擊槍股票,兩周后ICE放出2.2億合同

特朗普賬號買入500萬美元電擊槍股票,兩周后ICE放出2.2億合同

全棧遛狗員
2026-07-03 04:48:51
哪一刻讓你意識到和對方是兩個世界的人?網友:眼界差距難以逾越

哪一刻讓你意識到和對方是兩個世界的人?網友:眼界差距難以逾越

夜深愛雜談
2026-06-28 22:30:51
褲衩開叉10厘米!被網暴5年!鐵三女神奪亞軍又被罵,裁判:合規

褲衩開叉10厘米!被網暴5年!鐵三女神奪亞軍又被罵,裁判:合規

番外行
2026-06-07 15:53:29
韓紅愛心慈善基金會發聲明:韓紅兼具文藝工作者社會身份,公益慈善并非其全部工作內容,基金會活動與基金會公益運營相互獨立、界限清晰

韓紅愛心慈善基金會發聲明:韓紅兼具文藝工作者社會身份,公益慈善并非其全部工作內容,基金會活動與基金會公益運營相互獨立、界限清晰

魯中晨報
2026-07-02 19:30:11
四川民企疑遭虛假證據錯判破產,兩級法院審查失守,十年申訴無門

四川民企疑遭虛假證據錯判破產,兩級法院審查失守,十年申訴無門

大眾看點
2026-07-02 12:47:16
泰國租妻產業,正在收割中國“退休老頭”

泰國租妻產業,正在收割中國“退休老頭”

毒sir財經
2026-06-30 22:38:02
北京大媽公交車上打暈患癌姑娘,一巴掌斷送退休后的美好幸福生活

北京大媽公交車上打暈患癌姑娘,一巴掌斷送退休后的美好幸福生活

嘉琪Feel
2025-07-09 23:05:01
搬起石頭砸自己的腳!剛開完演唱會的任素汐,也走上了韓紅的老路

搬起石頭砸自己的腳!剛開完演唱會的任素汐,也走上了韓紅的老路

山谷里的怒吼
2026-07-02 18:05:59
ESPN記者:湖人隊內部人士暗示詹姆斯父子可能一起轉投新球隊

ESPN記者:湖人隊內部人士暗示詹姆斯父子可能一起轉投新球隊

好火子
2026-07-02 22:11:51
墨西哥球迷狂歡震動地球:地震儀捕捉到強烈信號 狂歡導致三人死亡

墨西哥球迷狂歡震動地球:地震儀捕捉到強烈信號 狂歡導致三人死亡

紅星新聞
2026-07-02 17:59:23
創造歷史!C羅世界杯爆發:梅開二度+加冕隊史射手王!率隊爭冠軍

創造歷史!C羅世界杯爆發:梅開二度+加冕隊史射手王!率隊爭冠軍

光輝記
2026-06-24 02:00:59
西班牙6月上千人因高溫死亡!中國空調、電扇企業加班趕訂單

西班牙6月上千人因高溫死亡!中國空調、電扇企業加班趕訂單

山西晚報
2026-07-02 12:46:16
別再比退休金了!2026年滿60歲,拿到這個數就偷著樂吧

別再比退休金了!2026年滿60歲,拿到這個數就偷著樂吧

小影的娛樂
2026-07-03 09:49:09
湖南女醫生出軌17分鐘視頻:別站在道德制高點,批判她的貞操

湖南女醫生出軌17分鐘視頻:別站在道德制高點,批判她的貞操

娜烏和西卡
2025-11-10 13:50:19
81歲港星生日猝然離世,常年運動身體好,晚年移居香港

81歲港星生日猝然離世,常年運動身體好,晚年移居香港

情感的我
2026-07-03 07:36:55
中國腦梗發病率世界第一!醫生苦勸:罪魁禍首已揪出,這4物少吃

中國腦梗發病率世界第一!醫生苦勸:罪魁禍首已揪出,這4物少吃

醫學科普匯
2026-06-17 18:55:13
“叫不醒”的李純,比誰都清醒

“叫不醒”的李純,比誰都清醒

星宿影視鴨
2026-07-02 19:39:59
貝克漢姆14歲的女兒小七怎么如此成熟了,好像少婦

貝克漢姆14歲的女兒小七怎么如此成熟了,好像少婦

西樓知趣雜談
2026-06-13 19:52:21
醫生發現:能跑能跳的老人,基本在70歲,就已經不做這6件事了

醫生發現:能跑能跳的老人,基本在70歲,就已經不做這6件事了

芹姐說生活
2026-06-30 19:12:40
2026-07-03 11:11:00
量子位 incentive-icons
量子位
追蹤人工智能動態
12887文章數 176508關注度
往期回顧 全部

科技要聞

特斯拉交付超預期7.4萬輛,股價卻大跌7.5%

頭條要聞

克羅地亞絕平球無效 官方放賽事用球內置芯片檢測畫面

頭條要聞

克羅地亞絕平球無效 官方放賽事用球內置芯片檢測畫面

體育要聞

韓國人,為什么恨透了洪明甫?

娛樂要聞

黃曉明深夜約會美女,分手原因曝光

財經要聞

AI“鬼故事”不斷,市場開始重估?

汽車要聞

有純電有增程 還有二代VLA支持 小鵬MONA L03預售價14.38萬起

態度原創

本地
親子
游戲
時尚
公開課

本地新聞

這場穿越酉陽的光影之旅,張張都是壁紙!

親子要聞

800元“包懷孕”,地下黑市背后的全民生育焦慮

PS平均賣一份數字游戲能賺28美元!是實體版的2倍

這個夏天,你一定吃過她們的瓜

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版