![]()
記者 潘俊田
“以往具身智能通過模仿人類進行學習,但人工智能的核心在于知道如何學習新事物,因此具身智能必須通過交互學習,通過試錯實現持續學習。”2024年圖靈獎得主理查德·薩頓于6月29日在北京接受經濟觀察報等媒體采訪時表示。
交互學習是指具身智能通過與周圍環境進行互動獲得經驗,進而實現學習的方式,核心是強化學習。此前主流的學習模式為模仿學習,即模仿人類動作進行學習。
比如,AlphaGo在發展早期通過學習圍棋棋手的棋譜進行學習,是為模仿學習。后續研究人員為AlphaGo輸入圍棋規則,AlphaGo通過不斷在圍棋規則內“下棋”習得棋譜,最終戰勝人類選手。
“現階段人工智能的發展更關注大語言模型,具身智能的發展僅靠大語言模型是不夠的,我認為需要關注‘經驗’。”薩頓表示。
薩頓表示,“經驗”指具身智能在參與現實世界的過程中收集到的反饋。具身智能想要獲得“經驗”,需要通過交互學習。
除薩頓外,觸覺感知公司他山科技CEO馬揚,協作機器人公司節卡機器人副總裁許雄以及中信證券投資副總裁黃耀庭也于當天在與經濟觀察報等媒體采訪時交流了交互學習對于具身智能的重要性。
“模仿學習是具身智能‘冷啟動’的方式,通過交互學習才能走向商業化。”馬揚表示。
他舉例,目前絕大多數具身智能進行演示的場景,均為對具身智能“非常舒適”的場景,離現實場景差距較大。通過模仿學習,具身智能只能學會“這是正確的”,不能學會“什么是正確的”。
馬揚表示,交互學習意味著減少或不再使用仿真模擬數據對具身智能進行訓練,而是通過具身智能在真實世界中的行為進行訓練。
薩頓表示,模擬器的自由度很低,因此提供的數據復雜性較現實世界低得多,僅通過仿真模擬數據訓練難以應對真實世界。
“具身智能不需要老師,也不需要訓練,需要的是自己主動地在環境中進行探索、學習。”薩頓說。
據馬揚介紹,具身智能在發展早期,大多通過視覺模型進行訓練,進入交互學習時代,觸覺感知能力更為重要。“視覺是用來感知的數據,觸覺是用來交互的數據。”馬揚說。
馬揚認為,觸覺感知能夠為具身智能提供主動安全策略、驅動具身智能進行探索,以及通過觸覺感知定義事件等。
馬揚表示,隨著近年來具身智能被逐步部署于應用場景中,行業逐漸發現其只依賴視覺,而缺乏觸覺感知,無法適應具體場景。現有的能夠落地應用的具身智能,在執行層面僅能完成基礎性的工作或者是在已經實現的工業自動化工作中增添一點柔性功能。
許雄表示,工業機器人更強調安全與可靠性、交互性以及學習能力,這些都離不開觸覺感知能力。
馬揚說,從去年開始,行業開始探索在純視覺方案中增添觸覺感知的可能性,下游具身智能廠商對機器人觸覺感知產品的需求暴增,不僅僅將觸覺感知作為“執行器”,而是作為“收集器”。
馬揚表示,作為“收集器”的觸覺感知更強調魯棒性、穩定性、耐久性和分辨率,而不在于感知精度。
他舉例,分辨率較好的觸覺感知可以幫助具身智能快速對數據進行分類,進而做出響應和調整。
黃耀庭建議,實驗室和數據采集中心不是具身智能的終點,具身智能企業需要挖掘到真實的、可規模化的、具有商業價值的場景,在場景應用中收集數據并不斷進行產品迭代。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.