網易首頁 > 網易號 > 正文 申請入駐

王興興聯合高校機構發論文,機器人會武術的門檻大幅降低

0
分享至


還記得今年央視春晚上宇樹機器人的《武bot》嗎?G1和H1在快速奔跑中穿插變陣,后空翻、側踢、耍雙節棍、打醉拳……讓所有人見識了高動態、高協同的全自主集群控制技術。


這樣的技能,以后還能進化到什么程度?

答案來得很快。

3月3日,北京通用人工智能研究院(BIGAI)、宇樹科技、上海交通大學、中國科學技術大學等,聯合發布了一項重磅研究成果。他們開發出一個名為OmniXtreme的新框架,可以讓宇樹G1學會執行各種極限動作,像是連續翻轉、極限平衡,甚至通過快速接觸切換跳霹靂舞等。

宇樹科技創始人兼CEO王興興也在署名作者之列。


基于統一策略OmniXtreme的全身極端運動控制(圖片來源于論文)


一個困擾行業多年的難題

這篇標題為《OmniXtreme:突破高動態人形機器人控制的通用性壁壘》的論文, 一作 為Yunshen Wang和Shaohang Zhu。兩位青年學者分別來自通研院與上海交通大學、通研院與中國科學技術大學的聯合培養項目,同時也屬于通研院-宇樹科技具身智能與人形機器人聯合實驗室。


論文地址:https://arxiv.org/abs/2602.23843

“我們花了一整年時間深入研究通用跟蹤和極端物理行為之間的障礙。在測試了數十臺G1后,最終找到了學習和物理執行能力方面的瓶頸。”論文的共同通訊作者、北京通用人工智能研究院具身機器人中心主任黃思遠在社交媒體上透露,這是他們首次與王興興合作發表論文,“一次非常有啟發性的經歷”。


讓通用人形機器人擁有人類水平的運動能力,是從業者們長期以來的共同追求。然而,在保持高精度動作控制的同時,實現運動技能的可持續拓展(generality barrier,通用性瓶頸),一直是該領域面臨的關鍵技術挑戰。

簡單來講,當前的機器人就像一個偏科生,可以在某一單項上成為冠軍,比如精準完成后空翻,卻很難成為全能型的運動健將。當訓練數據擴展至包含數十種風格迥異的復雜運動時,模型性能便會急劇衰退,學習效率也大打折扣。

王興興就曾在2025年世界機器人大會上坦言,目前機器人運動控制領域存在RL Scaling Law(強化學習的規模效應)問題。他解釋說,現在的機器人在學習一項新技能時,往往需要從頭開始研究和教學。“比如我有一個新的舞蹈要去訓練,那么每次加入新動作,都要重新訓練”。

他希望 未來能 夠實現技能的持續積累與遷移學習,讓機器人在已有能力基礎上不斷擴展新的技能,從而大幅提升學習效率和適應性。


從模仿學習到實戰打磨

兩階段訓練

OmniXtreme研究團隊找到的破解之法,是把訓練過程拆成兩個階段,先讓它在訓練場里“看”遍各種動作,再把它放到真實場地里打磨技術。


具體來說,第一階段是預訓練,讓機器人先“博覽群書”(flow-based generative control policy,基于流的生成式控制策略)。團隊先為每一個高難度動作,比如后空翻、托馬斯全旋,訓練一個“專家老師”,然后基于數據集聚合(Dagger)的流匹配算法,把這些分散的專家知識全部融合到一個統一的“基座策略”里。有了這些知識,這個基座策略就知道如何執行各種不同類型的動作。

第二階段是后訓練,讓機器人上“真刀真槍”(actuation-aware residual RL,驅動感知的殘差強化學習)。光在電腦里學得好還不夠,畢竟真實世界有復雜的物理約束:電機有扭矩極限,有發熱問題,也有能量回沖的風險。團隊凍結了第一階段學到的基座策略,在上面加了一個輕量級的“殘差策略”,專門負責在真實電機約束下做精細化調整。

后訓練這一步,對于成功實現真實世界的遷移至關重要,團隊為此還上了一套優化的“組合拳”。比如“激進的域隨機化”,說“人話”,就是模擬各種意外情況,讓機器人學會應對真實世界的干擾。

此前很多人就注意到,在《武bot》節目里,多臺G1在完成空翻落地時腿腳打滑,卻能和人一樣馬上調整身形站穩,估計就是訓練的結果。



157次試驗整體成功率91.08%

最終訓練出的單一策略,已經能讓宇樹G1在現實世界中完成24種高動態運動,157次試驗的整體成功率高達91.08%。其中,后空翻等動作成功率為96.36%,武術類為93.33%。


現在 登錄 項目官網,你可以看到研究團隊發布的一系列真機演示視頻。宇樹G1成功完成的動作展示,包括:連續五個韋伯斯特空翻;長段霹靂舞表演;向后跳躍,經手倒立姿勢旋轉,下落,翻轉,隨即彈起;前滾翻,后滾翻,向前爬行等。


項目官網https://extreme-humanoid.github.io/

這些動作不僅需要極高的動態平衡能力,還需要在毫秒級的時間內完成全身協調。視頻中,機器人的動作流暢自然,與參考運動高度一致,展現出相當不錯的運動控制能力。

為了進一步驗證是否真的解決了通用性瓶頸問題,團隊還設計了漸進式壓力測試方案。他們分別使用10個、20個和50個動作,對模型進行訓練,并固定以前10個動作為基準,統一評估不同訓練規模下的表現。

結果顯示,隨著動作多樣性的增加,傳統基于強化學習從頭訓練的方法出現了明顯性能下降,成功率從100%逐步降至83.3%,最終 滑 到73.9%

相比之下,OmniXtreme方法展現出較強的穩定性與泛化能力,在50個動作的訓練條件下,對前10個核心動作的跟蹤成功率仍保持在93.3%


目前,該研究的相關論文、模型檢查點及代碼已正式開源。研究團隊還透露,未來或將陸續公開包括流匹配基礎策略訓練與推理代碼、剩余后訓練與推理代碼,以及C++真實部署代碼等在內的更多資源。

這意味著,全球的研究者和開發者都可以基于OmniXtreme框架,訓練自己的人形機器人學會各種高動態運動技能。這也將大大加速人形機器人運動控制領域的發展。

文 | 童蔚

VIEW MORE

@浙江的小城里藏著一座短劇超級工廠>>

@合肥的科大訊飛、北京的百度都選擇了杭州>>

@2028全球智能危機,第一塊多米諾已倒下?>>

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
特朗普的中東騙局被戳穿,炸伊朗、逼談判是演戲,真正目標藏不住

特朗普的中東騙局被戳穿,炸伊朗、逼談判是演戲,真正目標藏不住

西樓知趣雜談
2026-04-22 11:42:50
從“恐俄”到“祛魅”:俄烏戰爭如何終結了歐洲的百年心魔

從“恐俄”到“祛魅”:俄烏戰爭如何終結了歐洲的百年心魔

民間胡扯老哥
2026-04-22 04:47:09
豆芽立大功!浙科大實證:豆芽可通過菌群代謝,減少84%腹部脂肪!

豆芽立大功!浙科大實證:豆芽可通過菌群代謝,減少84%腹部脂肪!

科學認識論
2026-04-20 14:45:02
成都太古里迎開業11周年 啟動第三階段全面升級

成都太古里迎開業11周年 啟動第三階段全面升級

中國經營報
2026-04-23 19:51:53
特朗普點頭也晚了,中方布局到位,美芯片被擋在門外進不來

特朗普點頭也晚了,中方布局到位,美芯片被擋在門外進不來

石江月
2026-04-23 17:28:51
“豬八戒”扮演者馬德華,妻子顏值不輸“嫦娥”,一家人事業有成

“豬八戒”扮演者馬德華,妻子顏值不輸“嫦娥”,一家人事業有成

芳芳歷史燴
2026-04-20 23:09:25
伊朗反擊了

伊朗反擊了

牛彈琴
2026-04-23 07:40:57
達州市第五屆人民代表大會常務委員會決定免職和任命名單

達州市第五屆人民代表大會常務委員會決定免職和任命名單

明月照鳳凰
2026-04-23 21:19:07
煮米飯別只加清水!酒店不外傳秘訣,粒粒蓬松超好吃

煮米飯別只加清水!酒店不外傳秘訣,粒粒蓬松超好吃

開心美食白科
2026-04-09 09:43:04
沒有副作用,又不會上癮的安眠藥,你知道有哪些嗎?

沒有副作用,又不會上癮的安眠藥,你知道有哪些嗎?

岐黃傳人孫大夫
2026-04-21 11:30:03
歐盟正式批準向烏克蘭提供900億歐元貸款方案

歐盟正式批準向烏克蘭提供900億歐元貸款方案

新京報
2026-04-23 22:14:07
為什么說可憐之人必有可恨之處?網友:不還錢就算了,還都罵我

為什么說可憐之人必有可恨之處?網友:不還錢就算了,還都罵我

另子維愛讀史
2026-04-20 09:28:15
40000 人陣亡,100 艘戰艦會被擊沉?

40000 人陣亡,100 艘戰艦會被擊沉?

小馬姨
2026-04-21 09:49:45
70 歲外長王毅這一跪讓我淚崩!為國奔波萬里,卻讓所有人破防!

70 歲外長王毅這一跪讓我淚崩!為國奔波萬里,卻讓所有人破防!

眼界看視野
2026-04-11 21:09:54
云南一幼童十余天反復咳痰帶血,氣管內取出8厘米活體蠕動螞蟥

云南一幼童十余天反復咳痰帶血,氣管內取出8厘米活體蠕動螞蟥

澎湃新聞
2026-04-22 11:02:28
高校輔導員催學生趕快簽工作,現在基本不會有央國企再來招聘了!

高校輔導員催學生趕快簽工作,現在基本不會有央國企再來招聘了!

燈錦年
2026-04-23 15:24:39
中國海軍70艘驅逐艦一覽,垂發總量4704個,與美國海軍有很大差距

中國海軍70艘驅逐艦一覽,垂發總量4704個,與美國海軍有很大差距

愛吃醋的貓咪
2026-04-22 21:05:30
美國敢抓馬杜羅、敢炸哈梅內伊,為什么偏偏不敢動金正恩?

美國敢抓馬杜羅、敢炸哈梅內伊,為什么偏偏不敢動金正恩?

賤議你讀史
2026-04-12 21:40:28
明日停牌!000610,將被*ST

明日停牌!000610,將被*ST

中國基金報
2026-04-23 23:54:20
“生娃率”持續走低,廈門教授給出建議:不生孩子就下調養老金

“生娃率”持續走低,廈門教授給出建議:不生孩子就下調養老金

大果小果媽媽
2026-04-02 13:16:39
2026-04-24 02:08:49
九千光年 incentive-icons
九千光年
90后00后看世界探未來
1870文章數 5563關注度
往期回顧 全部

科技要聞

馬斯克喊出"史上最大產品",但量產難預測

頭條要聞

以色列:只要美國同意 將刺殺伊朗最高領袖

頭條要聞

以色列:只要美國同意 將刺殺伊朗最高領袖

體育要聞

給文班剃頭的馬刺DJ,成為NBA最佳第六人

娛樂要聞

王大陸因涉黑討債被判 女友也一同獲刑

財經要聞

普華永道賠償10億 恒大股東見到"回頭錢"

汽車要聞

預售30.29萬起 嵐圖泰山X8配896線激光雷達

態度原創

教育
藝術
家居
本地
游戲

教育要聞

推薦一款高考志愿卡,五大功能助你解決志愿疑難

藝術要聞

吉達塔蓋到第100層,“它是沙特唯一能按期完成的大項目”

家居要聞

浪漫協奏 法式風格

本地新聞

SAGA GIRLS 2026女團選秀

任天堂NS2銷量4倍碾壓PS5!差距懸殊 索尼難挽頹勢

無障礙瀏覽 進入關懷版