最近Figure AI的直播挺熱鬧的,三臺人形機器人連續不間斷分揀包裹200個小時,期間還安排了一場人機大戰,人類小哥跟機器人對干了10小時,胳臂都要累斷了,最終以12,924件對12,732件險勝。換算下來,人類比機器人快0.04秒。
![]()
Figure AI的CEO說這是"人類最后的勝利",但我還是覺得,人形機器人商業化進工廠,沒那么樂觀。
直播是真的,問題也是真的
先說說直播里我注意到的一些東西。
第一個繞不開的問題:這場直播到底是不是真的?
估計是被忽悠次數多了,有網友質疑背后有人遠程遙控:你看這機器人不知道為啥時不時就抬手往腦袋上扶一下,像不像戴VR頭顯的人下意識推眼鏡?
![]()
Figure堅決否認,說這是全自主的。CEO也上電視辟謠了。
![]()
行吧,就算這一切完全是真的,沒有任何人類干預,那暴露出來的問題也不少。
準確率上還差點意思。直播里大量包裹夾不穩掉落,更要命的是掉了也不知道撿。物流分揀講究的是不出錯,錯一個件意味著投訴、賠付、客戶流失。這個錯誤率放到真正的倉庫里,第一天就會被叫停。
![]()
遇到困難也完全不會變通。有個包裹夠不著拿不起來,它就反復較勁半天,不會換個角度試試、不會用另一只手、不會跳過去先處理下一個。人干活遇到問題會想辦法,它沒有plan B,面對這種沒被預編程過的狀況,表現跟傻子沒有區別。
![]()
還有一類更詭異的:做跟任務完全無關的動作,干著干著活突然開上摩托了,過了好幾秒才回過神來。
![]()
按理說它應該代表的是相當先進的水平了,畢竟之前從來沒有機器人能直播連干200小時,那為什么看起來還是有點笨呢?這得從它的"大腦"說起。
小小的模型裝不下太多世界
Figure機器人的模型叫Helix-02。它有一個根本性的約束:模型完全跑在機器人本地芯片上,不上云端大模型。
![]()
這其實不只是Figure一家的選擇,所有人形機器人都面臨同樣的物理約束:操控動作需要避免延遲。就拿分揀快遞來說,一個包裹滑過來,機器人必須迅速決定怎么抓。你不可能每次都先把攝像頭畫面傳到云端、跑一遍GPT級別的大模型、等一會再把指令傳回來。那包裹早堆成山了,更別說機器人的真實工作環境也不一定有穩定的網絡。
所以Helix-02采用分層架構:頂層是一個7B參數的視覺語言模型,每秒做7-9次場景理解和任務決策;底層是一個只有千萬參數級的全身控制器,以1000Hz頻率實時控制關節。全程在機器人本地芯片離線運行,不依賴云端。
![]()
代價是腦子小,見過的世面就少。GPT、Claude這種千億參數的大模型之所以能應對各種奇怪輸入,靠的是海量數據把邊角case都覆蓋了。你把模型壓到千萬級塞進機器人腦袋里,它就只認識訓練時見過的東西。
直播大部分時間看著還行,是因為環境太理想了:光照穩定、沒有干擾、傳送帶勻速。但只要出現一點訓練數據沒覆蓋的變量,它就開始對空氣做動作了。
所以俄亥俄州立大學工程學院院長Ayanna Howard看完直播說了句大實話:"這更像一個科學項目,不是商業服務。"
![]()
真實環境會把它打回原形
直播是在Figure總部搞的。光照恒定、溫度適宜、傳送帶勻速、包裹規格統一。
真實的快遞倉庫什么樣?我隨便列幾個變量:
夏天有的分揀站室內溫度超過40度。電機在高溫下性能衰減、電池續航縮短、傳感器讀數飄移。冬天低溫環境下潤滑油變稠,關節響應變慢。
粉塵。物流倉庫里紙屑、膠帶碎片、填充物到處飄。這些東西進到光學傳感器鏡頭上,進到關節縫隙里,進到散熱口里。精密設備最怕的就是粉塵。
異形件。真實的快遞包裹有多奇葩?有編織袋、有球拍、有長條卷軸。直播里方方正正的紙箱和塑料袋,在真實場景里絕對不是全部。
突發狀況。傳送帶卡了、前面有個破損包裹漏了液體弄濕了下一件、兩個包裹粘在一起過來了。人工分揀員一眼就能判斷怎么處理,機器人面對任何一個超出訓練數據的意外都會發懵。
直播已經是最理想的環境了。最理想的環境里它還會出問題。真實倉庫那就是地獄難度。
商業化遙遙無期
說回到人機大戰的數據。人類2.79秒一件,機器人2.83秒。看起來差不多對不對?
醒醒,這是供了一個祖宗。
買來第三個月,第一次預防性維護就該到了。按行業建議,高強度運轉的人形機器人每3到6個月就要做一輪全面保養——關節潤滑、傳感器校準、線纜檢查。 你不養它,它就罷工。
![]()
工業機器人行業的通用標準是:年維護費用占原設備價格的10%到20%,就算沒有任何故障,幾年下來光維護費就夠再買一臺了。
![]()
這還不算零件換新的費用。
人形機器人是一臺由精密關節驅動的運動機器。Figure 03全身30個自由度,光手部就有20個,撐全身重量、承受分揀動作沖擊的大關節——膝關節、髖關節、肩關節、腕關節——有十個左右。
![]()
這些關節每一個都在動作中持續承受敲擊式負載。關節里最核心的零件叫諧波減速器。按照行業標準,諧波減速器在額定負載下的壽命大約是7,000到10,000小時,6,000小時以上就算合格。
![]()
什么概念?一個倉庫如果單班運轉,一年工作約2,000小時,核心關節撐3.5到5年就得換。如果是三班倒,這個數字直接縮到一年半到兩年。
同時要換的還有電池。
Figure 03的電池容量2.3千瓦時,續航5小時。
![]()
鋰離子電池的循環壽命一般是500到1,000次滿充滿放。如果每天一充,2到3年電池就得換。換一組電池不便宜,價格在1000到5000美元不等。
![]()
這還是在自然磨損沒出故障的前提下。某一天,它真壞了怎么辦呢。
人形機器不像叉車,車間師傅擰兩下就能修。一個腕關節出問題,流程是這樣的:聯系原廠工程師 → 排期上門 → 拆機 → 診斷 → 確認需要更換減速器 → 訂零件 → 供應商備貨 → 零件到了 → 更換 → 校準 → 測試 → 恢復運轉。
要是零件缺貨,可能要等到明年。
![]()
而在這么長的時間里,這個工位的產能是零。工業機器人計劃外停機的損失,制造業全行業平均每小時26萬美元。
![]()
汽車制造業的損失更是高達每小時230萬美元。換算到分鐘,低則一千美元,高則上萬美元。
![]()
今年Figure宣布了BotQ工廠的建廠計劃,目標年產12,000臺。問題是:就算你造出來12,000臺,誰買?
![]()
以目前的性價比,物流公司不會買(算不過來賬),制造業不會買(專用機械臂更穩更便宜),消費市場更不會買(十幾萬美元一臺的玩具?)。沒有需求端的規模支撐,你的產線開了也是空轉。
說回Figure的直播
我不用"給投資人表演""騙融資"這種陰謀論去理解它。200小時直播前所未有,有實質進步。這一點要認。
但這不等于離商業化近。
人形機器人現在的處境就一句話:便宜不過人工,好不過專用機械臂。
5-10年之內,很難在真實運轉的快遞分揀中心看到它。
順便說一句,最近我在內部啟動了一件事:用AI來評價我們整個組織的AI Native建設程度。核心目的是讓公司擁有創業公司級別的聚焦能力和機動性,靠系統、靠數據、靠AI本身的反饋機制。
內部做了這么多,我們也想把我們的經驗分享給真正想要轉型的企業,實現真正的AI Native組織變革。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.