![]()
來源:新智元
【導讀】Figure的人形機器人本周跑了一場沒有終點的直播,原定8小時,結(jié)果連軸轉(zhuǎn)了超過100小時,分揀超13萬個包裹,至今沒停。10小時人機對決中,人類選手拼到前臂近乎報廢,僅以不到200個包裹的優(yōu)勢險勝。CEO放話「這是人類最后一次贏了」。具身智能的飛輪,可能剛剛碾過了一個拐點。
人形機器人第一次在真實工業(yè)任務中證明了一件事,它可以連續(xù)數(shù)十小時自主工作,中間不需要任何人類介入。
本周,機器人公司Figure開了一場直播,原計劃讓旗下F.03機器人連續(xù)自主分揀包裹8小時。
![]()
![]()
8小時到了,機器人沒有停下來的意思,團隊決定繼續(xù)。
截至發(fā)稿,F(xiàn).03已連續(xù)運行超100小時,分揀了超13萬個包裹,仍在繼續(xù)。
全程零遙操作,每一個動作都來自Figure自研神經(jīng)網(wǎng)絡Helix-02,運行在機器人本體上。
直播間涌入大量觀眾。
![]()
評論區(qū)的網(wǎng)友給四臺輪班機器人取了名字,Bob、Frank、Rose、Gary,F(xiàn)igure團隊把名牌貼上去了。
緊接著,F(xiàn)igure加碼,發(fā)起了一場10小時人機對決。一邊是F.03,一邊是公司實習生Aime,規(guī)則遵守加州勞動法,人類享有餐休和帶薪休息。
![]()
最終,Aime以12924個包裹險勝F.03的12732個,差距不到200個。
賽后Aime說自己左前臂「基本廢了」。
Figure CEO Brett Adcock的賽后評價只有一句:
這是人類的最后一次勝利。
50小時馬拉松,怎么做到的
任務本身不復雜,小包裹分揀。
F.03用頭部攝像頭識別條碼,抓取包裹,將條碼面朝下翻轉(zhuǎn)放上傳送帶。
人類做這套動作平均3秒,F(xiàn).03目前也在3秒左右,已經(jīng)達到人類平均水平。
![]()
關(guān)鍵在于怎么維持50小時不停。
Helix-02是一個端到端神經(jīng)網(wǎng)絡,直接從攝像頭的原始像素推理出動作指令,中間沒有規(guī)則引擎,也沒有人工干預。
當AI策略遇到超出訓練分布的情況,Helix會觸發(fā)自動復位,機器人回到初始狀態(tài)重新來,直播中偶爾能看到這個過程。
容錯機制同樣值得關(guān)注。
某臺機器人出現(xiàn)軟件或硬件問題時,它會自主離開工位前往維修區(qū),另一臺自動頂上。
Figure的實驗室日常就按這個邏輯運轉(zhuǎn),目標是最大化整體在線時間。Brett Adcock說目前還沒出現(xiàn)過導致任務失敗的故障,「但從概率上講,遲早會有」。
這50小時回答了一個核心問題,機器人能不能一直動,出了問題還能自己兜住。
答案是,目前看,可以。
![]()
人機對決,2.79秒 vs 2.83秒
10小時對決的規(guī)則很簡單,誰分揀的包裹多誰贏。
![]()
人類選手Aime享有加州勞動法規(guī)定的全部權(quán)利,包括用餐休息和帶薪休息時間。
F.03沒有休息。
Brett Adcock賽前用了一個比喻,「龜兔賽跑」,人類更快,但體力是變量。
他還補了一句,「沒人告訴實習生要讓著機器人」。
最終比分,Aime分揀了12924個包裹,平均2.79秒一個。
F.03分揀了12732個,平均2.83秒一個。
![]()
人類贏了,贏了不到200個。
Aime付出的代價是左前臂接近「報廢」,水泡也令他的手疼痛難忍。
![]()
而F.03的狀態(tài)和10小時前沒有任何區(qū)別。
差距已經(jīng)壓縮到0.04秒。
人類的速度優(yōu)勢還在,但極其微弱。
而Helix-02還在迭代,這個0.04秒的窗口,隨時可能關(guān)閉。
一旦單次速度追平,耐力差距會讓比分徹底翻轉(zhuǎn),因為人類需要休息,機器人可以一直跑。
![]()
一個抬手動作引發(fā)的信任危機
直播過程中出了一個插曲。
F.03在分揀時被拍到一個可疑動作,左手無故觸碰了自己的頭部。
![]()
部分觀眾立刻懷疑背后有遙操作員在調(diào)整VR頭顯。
![]()
人形機器人行業(yè)里「遙操作摻水」的先例不少,這種質(zhì)疑完全合理。
Brett Adcock很快回應,這是AI策略在執(zhí)行跨身體抓取時的正常行為,機器人抬臂是為了避開工位上的金屬滑槽,跟遙操作沒有關(guān)系。
![]()
公眾對人形機器人自主性的信任門檻依然很高。
Figure選擇全程開放直播、接受實時審視,用50小時不間斷的公開運行記錄來回應質(zhì)疑。
這種做法比任何技術(shù)報告都有說服力。
翻車集錦
當然,如此長時間的直播過程中,還有其他的無法辯解的「翻車名場面」。
比如突然發(fā)生了詭異一幕——機器人開始原地發(fā)呆:
![]()
看起來像在騎著摩托車。
![]()
你的快遞是怎么丟的 be like:
![]()
正常人類工作時很難出現(xiàn)這種情況:
![]()
面對這些翻車,網(wǎng)友也開始銳評:
![]()
![]()
具身智能的飛輪,開始轉(zhuǎn)了
分揀包裹這個任務本身并不是大量機器人公司投入如此多的金錢和精力的主要目的。
就像2016年AlphaGo的橫空出世,絕不只是為了讓機器人下圍棋。
![]()
這里藏著一個正反饋循環(huán)。
機器人連續(xù)運行時間越長,采集到的真實場景數(shù)據(jù)就越多。
數(shù)據(jù)越多,Helix神經(jīng)網(wǎng)絡迭代越快。
模型越強,機器人能處理的邊界情況越多,連續(xù)運行時間進一步拉長。
這個循環(huán)跟大語言模型靠互聯(lián)網(wǎng)文本做 Scaling的邏輯如出一轍,區(qū)別在于具身智能的「語料」是物理世界本身,每一秒的真實運行都在生成訓練數(shù)據(jù)。
一旦飛輪轉(zhuǎn)起來,進步曲線就不再是線性的。
更深一層看,三條智能線正在交匯。
語言智能(LLM)、視覺智能(多模態(tài))、身體智能(具身)各自在加速,但它們已經(jīng)開始共享底層能力。
Helix-02用端到端神經(jīng)網(wǎng)絡直接從像素到動作,跟多模態(tài)大模型的技術(shù)路徑同源。
三條線在互相加速,而它們的交匯點,有一個名字,叫AGI。
大多數(shù)圈外人對具身智能的預期,還錨定在波士頓動力翻跟頭的時代,覺得離實用遙遙無期。
![]()
但語言模型的進步速度之快是大家肉眼可見的,每個月都有相當大的進步。
如果具身智能復刻這條曲線,從「分揀包裹打平人類」到「開放環(huán)境自主執(zhí)行復雜任務」,窗口期可能遠比直覺判斷的短。
Figure CEO Brett Adcock說的「這是人類最后一次贏」,放進飛輪的語境里,是對一條指數(shù)曲線的直白翻譯。
![]()
而這條曲線,可能剛剛碾過了一個拐點。
參考資料:
https://x.com/i/broadcasts/1aJbdbgeAaQKX
https://x.com/i/broadcasts/1OxwblMvXvoJB
為偉大思想而生!
AI+時代,互聯(lián)網(wǎng)思想(wanging0123),
第一必讀自媒體
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.