![]()
這不是一個讓機器人看起來更聰明的演示,而是一次讓機器人真正能用的工程突破。
2026年4月2日,美國AI機器人公司Generalist AI正式發(fā)布了GEN-1具身基礎(chǔ)模型。官方數(shù)據(jù)顯示,在此前最優(yōu)模型成功率僅為64%的簡單物理操作任務(wù)上,GEN-1將成功率提升至99%,完成任務(wù)的速度大約是當(dāng)前最先進(jìn)模型的三倍。
Generalist AI成立于2024年,創(chuàng)始人皮特·弗洛倫斯(Pete Florence)此前是谷歌DeepMind的高級研究科學(xué)家,主導(dǎo)開發(fā)了PaLM-E和RT-2等具身智能領(lǐng)域的標(biāo)志性模型。這一次,他帶領(lǐng)團隊在500萬小時交互數(shù)據(jù)的基礎(chǔ)上,交出了GEN-1這張成績單。
GEN-1的測試數(shù)字讓人印象深刻:完成箱體組裝僅需12.1秒,而此前最優(yōu)模型需要約34秒;手機入殼封裝任務(wù)耗時15.5秒,速度是前代的2.8倍。但如果只把這些數(shù)字當(dāng)成性能指標(biāo)來讀,就錯過了這個模型真正重要的地方。
具身智能長期以來有一道難以繞過的成本墻。要讓機器人學(xué)會一項操作任務(wù),傳統(tǒng)方案通常需要大量的"遙操作數(shù)據(jù)",也就是讓人類遠(yuǎn)程控制機器人反復(fù)演示,由此生成的高質(zhì)量訓(xùn)練數(shù)據(jù)代價高昂,每小時采集成本動輒數(shù)千美元。這道墻決定了機器人AI很難快速擴展到新任務(wù)、新機器人本體和新應(yīng)用場景,因為每一次擴展都要重新付出巨大的數(shù)據(jù)采集成本。
GEN-1選擇了一條不同的路。其預(yù)訓(xùn)練階段使用的數(shù)據(jù),主要來自通過低成本可穿戴設(shè)備采集的人類日常活動數(shù)據(jù),而非依賴昂貴的機器人遙操作數(shù)據(jù)。這使模型在接觸真實機器人之前,已經(jīng)通過海量的人類行為數(shù)據(jù)建立起對物理世界的底層理解,包括手如何抓握、物體如何移動、力如何施加。當(dāng)這個基礎(chǔ)打扎實之后,遷移到具體機器人任務(wù)上所需的專項數(shù)據(jù)量,就大幅下降了。
Generalist稱,在部分測試中,GEN-1僅用約GEN-0十分之一的專項訓(xùn)練數(shù)據(jù),便可達(dá)到與前代模型相近的性能水平。此次對外展示的每項任務(wù)結(jié)果,每項僅使用了約1小時的機器人數(shù)據(jù)完成適配。
如果這個數(shù)字能在更廣泛的任務(wù)場景中穩(wěn)定復(fù)現(xiàn),意味著機器人AI部署成本的下降不只是線性的,而是結(jié)構(gòu)性的。
GEN-1的發(fā)布,落在一個具身智能正在密集升溫的時間節(jié)點上。
過去兩年,全球主要AI公司都在加注這個賽道。谷歌DeepMind的RT-X系列、Physical Intelligence(π)的π0模型,以及Figure、1X等人形機器人公司各自研發(fā)的控制系統(tǒng),正在從不同技術(shù)路線逼近同一個目標(biāo):讓機器人在非結(jié)構(gòu)化的真實環(huán)境中穩(wěn)定工作。
Generalist AI的獨特之處,在于它從一開始就把"縮放定律"(Scaling Law)作為核心方法論。2025年11月發(fā)布的GEN-0是這個方向上的第一次驗證,證明了具身智能領(lǐng)域同樣存在類似大語言模型的規(guī)模效應(yīng),即隨著數(shù)據(jù)和算力的增加,模型能力出現(xiàn)系統(tǒng)性提升。GEN-1則是在GEN-0基礎(chǔ)上,通過疊加預(yù)訓(xùn)練擴展、強化學(xué)習(xí)、多模態(tài)人類引導(dǎo)和推理階段優(yōu)化,完成了從"能用"到"接近掌握"的跨越。
弗洛倫斯在官方博客中使用了"mastery"(掌握)這個詞。這不是隨意的修辭,它在技術(shù)上對應(yīng)的是:在特定任務(wù)上實現(xiàn)足夠高的成功率和足夠快的執(zhí)行速度,以至于可以被納入真實工業(yè)流程,而不只是作為演示存在。
99%的成功率是一道實質(zhì)性門檻。工業(yè)場景對可靠性的要求極高,低于這個數(shù)字的系統(tǒng),在大多數(shù)生產(chǎn)線上都意味著太高的殘次品率和維護(hù)成本,很難真正部署。過去的端到端機器人模型面對這道門檻時屢屢折戟,成本高、可靠性低、泛化能力差,是阻礙商業(yè)化落地的三把鎖。
GEN-1給出的答案是:用人類數(shù)據(jù)替代昂貴的遙操作數(shù)據(jù)來降低成本,用縮放定律驅(qū)動的預(yù)訓(xùn)練來提升泛化能力,用強化學(xué)習(xí)在執(zhí)行層面壓縮失敗率。三把鎖是否同時打開,還需要更廣泛的實際部署來檢驗。
Generalist自己也沒有回避局限性。公司坦承,GEN-1目前僅在部分精細(xì)操作任務(wù)上實現(xiàn)了99%以上的成功率,并非所有測試任務(wù)都能達(dá)標(biāo),部分復(fù)雜操作場景仍需進(jìn)一步提升。下一代模型的目標(biāo),是在更高復(fù)雜度任務(wù)上復(fù)現(xiàn)這次的突破,同時繼續(xù)壓低單任務(wù)所需的數(shù)據(jù)量。
對整個具身智能行業(yè)而言,GEN-1的發(fā)布提出了一個值得認(rèn)真對待的問題:當(dāng)訓(xùn)練數(shù)據(jù)門檻足夠低、成功率足夠高,機器人AI的商業(yè)化拐點,是否真的近了?
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.