網易首頁 > 網易號 > 正文申請入駐

人形機器人突然火出圈，物理AI卡在哪？破解思路藏在這三處

2026-05-28 12:18:06　來源: 聞識

河南舉報

分享至

春晚轉手絹那臺人形機器人刷屏的時候，不少人還沒回過神。AI從ChatGPT聊天的屏幕里跑出來，直接踩進了我們的現實生活。前幾年說機器人賽道能火，沒幾個人當真，還有人說這是忽悠人的偽命題。熱鬧背后，大家都在問同一個問題，物理AI到底卡在哪，啥時候才能真正走進我們的生活？

ChatGPT出來的時候，大家才驚覺AI居然能進化這么快。靠海量數據堆完，直接從量變蹦到質變，嚇了所有人一跳。那時候的AI還老老實實待在屏幕里，最多幫你寫個文案聊個天，碰不著現實里的東西。

后來自動駕駛出來，才第一次把AI放到了真實路面上。本質上那就是最早接觸現實的AI，靠攝像頭識別行人紅綠燈，對著預設規則做判斷。哪怕用數字孿生模擬路況訓練，也能搞定絕大多數出行場景。那時候沒人把這叫物理AI，都覺得反正靠電腦模擬就能把所有現實情況梳理清楚。

直到ChatGPT玩出了自主學習糾錯的活，大家才開始琢磨，真正能跟現實世界互動的機器人，到底該咋做。也就是現在被炒得火熱的具身智能，說白了就是物理AI。兩年前就有人喊要重視機器人賽道，沒人聽，直到春晚那臺機器人出圈，整個賽道才徹底走到聚光燈下。

現在大家最質疑的核心問題，說白了就是機器人能不能像人一樣自主思考。跟我們熟悉的語言大模型不一樣，物理AI要搞定的事兒難太多。它得自己認出現實里亂七八糟的東西，不用人提前標注，掃一眼就得自己判斷出這是什么物件。

現實世界的物品組合、場景變化，比自動駕駛跑的大馬路復雜不知道多少倍。大馬路翻來覆去就是車、行人、紅綠燈，家里廚房可能今天堆了碗明天擺了菜，啥情況都有。之前很早就有人說，先搞定機器人的運動能力再說，還早早投了做靈巧手的企業。

那時候很多人不理解，覺得沒“腦子”的手只能做固定動作，沒啥前景。其實運動能力這塊先突破，才給機器人落地打好了基礎。現在擺在所有人面前的核心坎，就是怎么給物理AI做一顆能自主思考的“大腦”。

去硅谷考察轉了一圈才發現，目前業內公認有三條走得通的思路，都是實打實有人在推進的。第一條就是做場景模擬，把現實里的廚房、客廳啥的，復制出上百萬個不一樣的虛擬場景。把機器人的動作丟進去反復練，靠堆數據讓它摸透不同環境下該怎么操作。

第二條路子是人體姿態采集，讓操作人員戴上數據頭盔和采集爪，直接在真實工作場景里錄動作數據。比如說保潔打掃房間一整套動作，錄完直接導入AI模型讓它學就完事。這條路子勝在數據真實，省了模擬場景的很多偏差。

第三條是輕量化數據采集，不用戴笨重的采集爪，只戴個頭盔采集現實場景的視覺和動作數據就行。讓AI在機器人日常干活的時候自己總結規律，不用特意花大價錢建一堆虛擬場景。各有各的優勢，目前也沒人說哪條一定能成，大伙都在試錯階段。

還有個挺有意思的另類思路，美國那邊在推進“果蠅路線”，就是想直接把人類大腦的運行邏輯植入電腦模型。我自己還投了做機器人本體的星海圖，靠讓機器人日復一日練分揀快遞磨動作精度。單純靠本體自己采集數據有瓶頸，結合虛擬場景和現實采集的數據，才能打通物理AI的全鏈條。

說句實在的，物理AI的本質，就是讓AI離開虛擬屏幕，真的摸清楚現實世界的規則。小到接觸面的摩擦力，大到物體間的空間距離，這些看不見摸不著的物理規律，都得AI自己慢慢摸透。現在它只能在分揀快遞、打掃房間這類細分場景落地，看起來步子邁得不大。其實都是在慢慢攢數據，等數據堆到一定程度，指不定哪天就像當年的語言大模型一樣，突然完成質變，給所有人一個大驚喜。

參考資料：科技日報人形機器人與物理AI發展觀察

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.