GEN-1機器人成本驟降90%，工業(yè)AI迎來重大拐點

2026-04-07 18:47:23　來源: 老牧說說

四川舉報

分享至

這不是一個讓機器人看起來更聰明的演示，而是一次讓機器人真正能用的工程突破。

2026年4月2日，美國AI機器人公司Generalist AI正式發(fā)布了GEN-1具身基礎(chǔ)模型。官方數(shù)據(jù)顯示，在此前最優(yōu)模型成功率僅為64%的簡單物理操作任務(wù)上，GEN-1將成功率提升至99%，完成任務(wù)的速度大約是當(dāng)前最先進(jìn)模型的三倍。

Generalist AI成立于2024年，創(chuàng)始人皮特·弗洛倫斯（Pete Florence）此前是谷歌DeepMind的高級研究科學(xué)家，主導(dǎo)開發(fā)了PaLM-E和RT-2等具身智能領(lǐng)域的標(biāo)志性模型。這一次，他帶領(lǐng)團隊在500萬小時交互數(shù)據(jù)的基礎(chǔ)上，交出了GEN-1這張成績單。

GEN-1的測試數(shù)字讓人印象深刻：完成箱體組裝僅需12.1秒，而此前最優(yōu)模型需要約34秒；手機入殼封裝任務(wù)耗時15.5秒，速度是前代的2.8倍。但如果只把這些數(shù)字當(dāng)成性能指標(biāo)來讀，就錯過了這個模型真正重要的地方。

具身智能長期以來有一道難以繞過的成本墻。要讓機器人學(xué)會一項操作任務(wù)，傳統(tǒng)方案通常需要大量的"遙操作數(shù)據(jù)"，也就是讓人類遠(yuǎn)程控制機器人反復(fù)演示，由此生成的高質(zhì)量訓(xùn)練數(shù)據(jù)代價高昂，每小時采集成本動輒數(shù)千美元。這道墻決定了機器人AI很難快速擴展到新任務(wù)、新機器人本體和新應(yīng)用場景，因為每一次擴展都要重新付出巨大的數(shù)據(jù)采集成本。

GEN-1選擇了一條不同的路。其預(yù)訓(xùn)練階段使用的數(shù)據(jù)，主要來自通過低成本可穿戴設(shè)備采集的人類日常活動數(shù)據(jù)，而非依賴昂貴的機器人遙操作數(shù)據(jù)。這使模型在接觸真實機器人之前，已經(jīng)通過海量的人類行為數(shù)據(jù)建立起對物理世界的底層理解，包括手如何抓握、物體如何移動、力如何施加。當(dāng)這個基礎(chǔ)打扎實之后，遷移到具體機器人任務(wù)上所需的專項數(shù)據(jù)量，就大幅下降了。

Generalist稱，在部分測試中，GEN-1僅用約GEN-0十分之一的專項訓(xùn)練數(shù)據(jù)，便可達(dá)到與前代模型相近的性能水平。此次對外展示的每項任務(wù)結(jié)果，每項僅使用了約1小時的機器人數(shù)據(jù)完成適配。

如果這個數(shù)字能在更廣泛的任務(wù)場景中穩(wěn)定復(fù)現(xiàn)，意味著機器人AI部署成本的下降不只是線性的，而是結(jié)構(gòu)性的。

GEN-1的發(fā)布，落在一個具身智能正在密集升溫的時間節(jié)點上。

過去兩年，全球主要AI公司都在加注這個賽道。谷歌DeepMind的RT-X系列、Physical Intelligence（π）的π0模型，以及Figure、1X等人形機器人公司各自研發(fā)的控制系統(tǒng)，正在從不同技術(shù)路線逼近同一個目標(biāo)：讓機器人在非結(jié)構(gòu)化的真實環(huán)境中穩(wěn)定工作。

Generalist AI的獨特之處，在于它從一開始就把"縮放定律"（Scaling Law）作為核心方法論。2025年11月發(fā)布的GEN-0是這個方向上的第一次驗證，證明了具身智能領(lǐng)域同樣存在類似大語言模型的規(guī)模效應(yīng)，即隨著數(shù)據(jù)和算力的增加，模型能力出現(xiàn)系統(tǒng)性提升。GEN-1則是在GEN-0基礎(chǔ)上，通過疊加預(yù)訓(xùn)練擴展、強化學(xué)習(xí)、多模態(tài)人類引導(dǎo)和推理階段優(yōu)化，完成了從"能用"到"接近掌握"的跨越。

弗洛倫斯在官方博客中使用了"mastery"（掌握）這個詞。這不是隨意的修辭，它在技術(shù)上對應(yīng)的是：在特定任務(wù)上實現(xiàn)足夠高的成功率和足夠快的執(zhí)行速度，以至于可以被納入真實工業(yè)流程，而不只是作為演示存在。

99%的成功率是一道實質(zhì)性門檻。工業(yè)場景對可靠性的要求極高，低于這個數(shù)字的系統(tǒng)，在大多數(shù)生產(chǎn)線上都意味著太高的殘次品率和維護(hù)成本，很難真正部署。過去的端到端機器人模型面對這道門檻時屢屢折戟，成本高、可靠性低、泛化能力差，是阻礙商業(yè)化落地的三把鎖。

GEN-1給出的答案是：用人類數(shù)據(jù)替代昂貴的遙操作數(shù)據(jù)來降低成本，用縮放定律驅(qū)動的預(yù)訓(xùn)練來提升泛化能力，用強化學(xué)習(xí)在執(zhí)行層面壓縮失敗率。三把鎖是否同時打開，還需要更廣泛的實際部署來檢驗。

Generalist自己也沒有回避局限性。公司坦承，GEN-1目前僅在部分精細(xì)操作任務(wù)上實現(xiàn)了99%以上的成功率，并非所有測試任務(wù)都能達(dá)標(biāo)，部分復(fù)雜操作場景仍需進(jìn)一步提升。下一代模型的目標(biāo)，是在更高復(fù)雜度任務(wù)上復(fù)現(xiàn)這次的突破，同時繼續(xù)壓低單任務(wù)所需的數(shù)據(jù)量。

對整個具身智能行業(yè)而言，GEN-1的發(fā)布提出了一個值得認(rèn)真對待的問題：當(dāng)訓(xùn)練數(shù)據(jù)門檻足夠低、成功率足夠高，機器人AI的商業(yè)化拐點，是否真的近了？

聲明：個人原創(chuàng)，僅供參考

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.