大數據文摘受權轉載自頭部科技
文丨譚梓馨
今年春晚期間,人形機器人的舞臺協同編排與運動控制技術無疑展現出了巨大飛躍,但如何捕捉人類高動態動作的敏捷性與自適應性,仍是一個開放性難題。
![]()
特別是在復雜多變環境下的敏捷跑酷運動,不僅要求底層控制具備魯棒性,還需要類人的動作表現力、長時程技能組合能力,以及基于感知的決策能力。
近日,來自 亞馬遜FAR、加州大學伯克利分校、卡內基梅隆大學和斯坦福大學團隊聯合 提出一種感知驅動的仿人機器人跑酷框架(PHP),該模塊化框架可讓仿人機器人在高難度障礙賽道上,基于視覺自主完成長時程跑酷任務。
![]()
研究人員在宇樹G1人形機器人上開展了大量真實環境實驗,驗證了本框架的有效性:機器人可完成翻越高達1.25米(為自身身高的96%)障礙物等高動態跑酷技能,并能在長時程多障礙穿越中,通過閉環控制實時適配障礙物擾動,展現出當前業界頂尖的實時敏捷、自適應全身跑酷效果。
框架背后的創新點
在復雜地形中實現類人運動的敏捷性與適應性,仍是人形機器人領域的核心挑戰,跑酷任務尤其凸顯了幾個關鍵挑戰:
第一,機器人必須完成高動態、多接觸的技能,例如翻越接近或超過自身身高的墻體,或是在極短時間內躍過障礙物。這要求在仿人機器人龐大、高維的動作空間中實現高效控制。
第二,這些技能必須與視覺等外部感知緊密耦合,以適應環境變化,并對突發擾動做出快速響應。
此外,要想從單一動作泛化到復雜障礙賽道的連續穿越,機器人必須將多種高動態技能整合到單一視覺運動策略中,而隨著所需技能的數量與多樣性增加,這一難度會急劇上升。
![]()
這個最新框架首先采用運動匹配策略——將其建模為特征空間中的近鄰檢索問題,把重定向后的人類基礎動作單元組合成長時程運動學軌跡,該框架可靈活拼接、平滑切換復雜技能鏈,同時保留人類動態動作的優雅與流暢性。
隨后,針對這些組合動作訓練基于運動追蹤的強化學習專家策略,并結合數據集聚合(DAgger)與強化學習方法,將其蒸餾為單一、僅依賴深度信息的多技能學生策略。
至關重要的是,感知與技能組合的結合實現了自主式、場景感知決策:機器人僅依靠機載深度傳感器與離散二維速度指令,即可自主選擇并執行跨越、攀爬、騰躍、滾下等動作,以應對不同幾何形狀與高度的障礙物。
研究人員表示,這套可擴展方案能夠實現仿真到現實的零樣本遷移,使實體機器人自適應穿越復雜地形。
像人一樣自適應爬墻越障
在此框架的加持下,人形機器人在某些場景的敏捷度大幅提升。
如高墻攀爬性能對比,針對1.25米高墻(為機器人身高的96%),機器人從蹬地時刻算起,僅用3.63秒便登上平臺,速度與人類水平相當。
![]()
具備高動態跑酷技能,機器人翻越一個高0.4米、長0.5米的障礙物,從蹬地到再次著地僅用時0.8秒,向前行進距離超過2米(為自身身高的154%),該動作的前向峰值速度可達3.41m/s,平均速度2.53m/s,體現出機器人在接觸切換過程中具備出色的動量保持能力。
![]()
從1.25米高臺下落著陸時,機器人還會通過下肢關節屈曲緩沖沖擊并穩定姿態。
本框架的一大核心優勢在于:即便訓練數據僅包含單障礙穿越,策略仍能泛化到復雜的多障礙賽道中。
機器人會將跨步、低墻攀爬、高墻攀爬等多種技能組合,在包含多個障礙的賽道上連續奔跑,驗證了閉環自適應能力。
![]()
視覺運動策略可在線生成動作過渡,實現全程流暢的技能切換,策略會自動調整接近方式與動作時機,以響應障礙變化,持續完成穿越任務,這些結果證明了本策略在長時程地形穿越中的強適應性。
還有很大優化空間
研究人員在對比實驗中發現,稠密化運動匹配對于生成連貫的長時程參考軌跡至關重要,并能讓策略學習到豐富多樣的接近條件。
結合強化學習的蒸餾方法,可高效地將單技能、含特權信息的專家策略遷移為多技能、僅依賴深度信息的學生策略。
![]()
這項研究的一作吳臻目前是亞馬遜前沿人工智能與機器人部門(FAR)的應用科學家實習生,在北京大學獲得學士學位,斯坦福大學獲得碩士學位,研究方向是人形機器人和角色動畫。
不過,目前該框架仍缺乏語義化場景理解,研究人員表示,引入語言等更豐富的條件信號,能實現對動作多樣性與風格的更精細控制。
此外,現實場景中的機器人性能也受限于感知與硬件:高速運動時,短距、窄視場相機無法提前充分觀測障礙物幾何形狀,導致機器人必須在感知不確定的情況下做出決策。
展望未來,更優的傳感方案與語義場景理解或許能大大降低這種不確定性,并支持更豐富的環境推理和交互。
GPU 訓練特惠!
H100/H200 GPU算力按秒計費,平均節省開支30%以上!
掃碼了解詳情?
點「贊」的人都變好看了哦!
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.