春晚轉手絹那臺人形機器人刷屏的時候,不少人還沒回過神。AI從ChatGPT聊天的屏幕里跑出來,直接踩進了我們的現實生活。前幾年說機器人賽道能火,沒幾個人當真,還有人說這是忽悠人的偽命題。熱鬧背后,大家都在問同一個問題,物理AI到底卡在哪,啥時候才能真正走進我們的生活?
![]()
ChatGPT出來的時候,大家才驚覺AI居然能進化這么快。靠海量數據堆完,直接從量變蹦到質變,嚇了所有人一跳。那時候的AI還老老實實待在屏幕里,最多幫你寫個文案聊個天,碰不著現實里的東西。
后來自動駕駛出來,才第一次把AI放到了真實路面上。本質上那就是最早接觸現實的AI,靠攝像頭識別行人紅綠燈,對著預設規則做判斷。哪怕用數字孿生模擬路況訓練,也能搞定絕大多數出行場景。那時候沒人把這叫物理AI,都覺得反正靠電腦模擬就能把所有現實情況梳理清楚。
![]()
直到ChatGPT玩出了自主學習糾錯的活,大家才開始琢磨,真正能跟現實世界互動的機器人,到底該咋做。也就是現在被炒得火熱的具身智能,說白了就是物理AI。兩年前就有人喊要重視機器人賽道,沒人聽,直到春晚那臺機器人出圈,整個賽道才徹底走到聚光燈下。
現在大家最質疑的核心問題,說白了就是機器人能不能像人一樣自主思考。跟我們熟悉的語言大模型不一樣,物理AI要搞定的事兒難太多。它得自己認出現實里亂七八糟的東西,不用人提前標注,掃一眼就得自己判斷出這是什么物件。
現實世界的物品組合、場景變化,比自動駕駛跑的大馬路復雜不知道多少倍。大馬路翻來覆去就是車、行人、紅綠燈,家里廚房可能今天堆了碗明天擺了菜,啥情況都有。之前很早就有人說,先搞定機器人的運動能力再說,還早早投了做靈巧手的企業。
![]()
那時候很多人不理解,覺得沒“腦子”的手只能做固定動作,沒啥前景。其實運動能力這塊先突破,才給機器人落地打好了基礎。現在擺在所有人面前的核心坎,就是怎么給物理AI做一顆能自主思考的“大腦”。
去硅谷考察轉了一圈才發現,目前業內公認有三條走得通的思路,都是實打實有人在推進的。第一條就是做場景模擬,把現實里的廚房、客廳啥的,復制出上百萬個不一樣的虛擬場景。把機器人的動作丟進去反復練,靠堆數據讓它摸透不同環境下該怎么操作。
第二條路子是人體姿態采集,讓操作人員戴上數據頭盔和采集爪,直接在真實工作場景里錄動作數據。比如說保潔打掃房間一整套動作,錄完直接導入AI模型讓它學就完事。這條路子勝在數據真實,省了模擬場景的很多偏差。
![]()
第三條是輕量化數據采集,不用戴笨重的采集爪,只戴個頭盔采集現實場景的視覺和動作數據就行。讓AI在機器人日常干活的時候自己總結規律,不用特意花大價錢建一堆虛擬場景。各有各的優勢,目前也沒人說哪條一定能成,大伙都在試錯階段。
還有個挺有意思的另類思路,美國那邊在推進“果蠅路線”,就是想直接把人類大腦的運行邏輯植入電腦模型。我自己還投了做機器人本體的星海圖,靠讓機器人日復一日練分揀快遞磨動作精度。單純靠本體自己采集數據有瓶頸,結合虛擬場景和現實采集的數據,才能打通物理AI的全鏈條。
![]()
說句實在的,物理AI的本質,就是讓AI離開虛擬屏幕,真的摸清楚現實世界的規則。小到接觸面的摩擦力,大到物體間的空間距離,這些看不見摸不著的物理規律,都得AI自己慢慢摸透。現在它只能在分揀快遞、打掃房間這類細分場景落地,看起來步子邁得不大。其實都是在慢慢攢數據,等數據堆到一定程度,指不定哪天就像當年的語言大模型一樣,突然完成質變,給所有人一個大驚喜。
參考資料:科技日報 人形機器人與物理AI發展觀察
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.