![]()
你肯定見過這樣的視頻,一個(gè)人形機(jī)器人流暢地行走、旋轉(zhuǎn)跳躍、翻跟頭,甚至做人類難以完成的復(fù)雜動(dòng)作,彈幕刷屏"未來已來"。
但你大概率沒見過這樣的視頻,機(jī)器人站在貨架前,伸手去拿一瓶礦泉水,猶豫了三秒,然后精準(zhǔn)把旁邊的薯片碰倒了。
這種視頻不會(huì)被放出來。但它才是行業(yè)真正的日常。
走路、跑步、翻跟頭,這些屬于"小腦"能力,也就是運(yùn)動(dòng)控制。真正卡脖子的是"大腦",是感知、理解、決策。看到一個(gè)沒見過的杯子,判斷該用多大力、從哪個(gè)角度抓、抓起來往哪放。
大腦必須吃真實(shí)世界的數(shù)據(jù)才能長(zhǎng)大。而這種數(shù)據(jù),目前嚴(yán)重短缺。
教小孩騎車,看一百遍教學(xué)視頻不如到路上摔一跤。機(jī)器人也一樣。仿真環(huán)境能教套路,教不會(huì)手感。真實(shí)世界里的光照變化、物體形變、力反饋的微妙差異,仿真永遠(yuǎn)沒法窮舉。
有人估算過,訓(xùn)練一個(gè)具身智能基座模型大約需要5000萬小時(shí)的數(shù)據(jù),而行業(yè)目前真機(jī)數(shù)據(jù)存量可能只有幾萬小時(shí)。千倍級(jí)的缺口。
這就是為什么訓(xùn)練場(chǎng)突然變成了一個(gè)真實(shí)的產(chǎn)業(yè)環(huán)節(jié)。不是PPT上的概念,不是炒作,是真的缺。
2025年9月,國(guó)內(nèi)最大的人形機(jī)器人訓(xùn)練場(chǎng)在北京啟用,樂聚機(jī)器人是聯(lián)合運(yùn)營(yíng)方之一。
![]()
占地上萬平方米,1:1還原了工業(yè)智造、智慧家庭、康養(yǎng)服務(wù)、5G融合四大類共16個(gè)細(xì)分場(chǎng)景,年產(chǎn)數(shù)據(jù)超600萬條。央視新聞聯(lián)播專門報(bào)道過。
訓(xùn)練場(chǎng)在訓(xùn)什么?
讓機(jī)器人在真實(shí)的物理環(huán)境里反復(fù)執(zhí)行任務(wù),抓取、搬運(yùn)、分揀、避障,把每一次操作的全過程變成高質(zhì)量數(shù)據(jù),再喂給大腦模型。
場(chǎng)景從哪來?
一部分從真實(shí)客戶產(chǎn)線上來。海晨物流的搬箱子、一汽的零件分揀、兆豐的拆垛碼垛,不是拍腦袋想出來的,都是來自實(shí)際業(yè)務(wù)。
另一部分來自基模和數(shù)據(jù)客戶的需求訂單,商超、家居等泛化場(chǎng)景,按需設(shè)計(jì),定向采集。
從擺好貨架等客上門,到客戶拿著需求單來定制數(shù)據(jù)。這個(gè)轉(zhuǎn)變,是訓(xùn)練場(chǎng)從概念變成產(chǎn)品最硬的證明。
![]()
誰在買單?
目前有三類客戶畫像已經(jīng)比較清晰了。
第一類,訓(xùn)基座模型的大廠,有算力有算法,缺的就是真機(jī)數(shù)據(jù)做最后一公里的收斂。第二類,高校和科研實(shí)驗(yàn)室,花幾十萬買數(shù)據(jù)遠(yuǎn)比自建采集團(tuán)隊(duì)劃算。第三類,做場(chǎng)景落地的后訓(xùn)練團(tuán)隊(duì),這是未來最大的增量。
數(shù)據(jù)本身也有金字塔結(jié)構(gòu)。
底層是互聯(lián)網(wǎng)數(shù)據(jù),量大便宜,讓模型理解世界的基本常識(shí)。中層是仿真和ego數(shù)據(jù),用來做預(yù)訓(xùn)練的冷啟動(dòng)。頂層是真機(jī)數(shù)據(jù),質(zhì)量最高、成本也最高,直接決定具體任務(wù)的成功率。
一組數(shù)字很能說明問題:400條高質(zhì)量真機(jī)數(shù)據(jù)的訓(xùn)練效果,超過1300條低質(zhì)量數(shù)據(jù)。質(zhì)量杠桿是真實(shí)存在的。
所以即便是仿真路線最堅(jiān)定的支持者,到了后訓(xùn)練階段,還是得采真機(jī)數(shù)據(jù)做對(duì)齊和微調(diào)。ego數(shù)據(jù)做預(yù)訓(xùn)練像走國(guó)道,路是通的但遠(yuǎn)。真機(jī)數(shù)據(jù)是高速公路,貴但快。最終你還是得上高速。
這也解釋了訓(xùn)練場(chǎng)的護(hù)城河為什么不在硬件,而在場(chǎng)景積累和數(shù)據(jù)質(zhì)量。場(chǎng)景從哪來、客戶從哪來、采集流程怎么標(biāo)準(zhǔn)化、數(shù)據(jù)質(zhì)量怎么保證,這些東西需要時(shí)間長(zhǎng)出來,不是砸錢就能速成的。
![]()
樂聚能做這件事,是因?yàn)樗谡鎸?shí)場(chǎng)景里摸爬滾打了足夠久。
一汽紅旗工廠的多機(jī)協(xié)同部署,SMT產(chǎn)線99%的抓取成功率,榮耀旗艦店的導(dǎo)購(gòu)服務(wù),養(yǎng)老試點(diǎn)入選工信部名單。每一個(gè)真實(shí)落地的場(chǎng)景都在反哺數(shù)據(jù)質(zhì)量,形成正向飛輪:場(chǎng)景越多,數(shù)據(jù)越好;數(shù)據(jù)越好,客戶越多;客戶越多,場(chǎng)景越豐富。
回到最開始的問題。
為什么機(jī)器人翻跟頭比拿礦泉水容易?因?yàn)榉^是一個(gè)封閉動(dòng)作,參數(shù)有限,仿真就能練到位。但拿礦泉水是一個(gè)開放問題,貨架什么樣、瓶子什么材質(zhì)、旁邊有沒有東西擋著、手指該施加多少牛的力,每一個(gè)變量都需要真實(shí)數(shù)據(jù)來覆蓋。
但如果只看到訓(xùn)練場(chǎng)是數(shù)據(jù)工廠,可能還是低估了這件事的意義。
具身智能和大模型走的是兩條截然不同的數(shù)據(jù)路徑,這個(gè)差異決定了它們的產(chǎn)業(yè)結(jié)構(gòu)會(huì)完全不同。
大模型的訓(xùn)練數(shù)據(jù)來自互聯(lián)網(wǎng),天然是集中的、可爬取的、邊際成本趨近于零的。所以我們看到的格局是算力軍備競(jìng)賽,誰有更多GPU誰就能訓(xùn)更大的模型,數(shù)據(jù)本身不構(gòu)成核心壁壘,非公開核心行業(yè)數(shù)據(jù)除外。
但具身智能的數(shù)據(jù)必須從物理世界中一條一條采出來,每一條都綁定著具體的硬件、具體的場(chǎng)景、具體的物理參數(shù)。這種數(shù)據(jù)不能爬,不能生成,不能憑空捏造,它的邊際成本是剛性的。
這意味著具身智能也許不會(huì)出現(xiàn)一家通吃的局面。具身智能的競(jìng)爭(zhēng)不會(huì)像大模型那樣,收斂成幾家巨頭的比拼,而更可能演化成一個(gè)場(chǎng)景生態(tài)。誰占住了某個(gè)場(chǎng)景的數(shù)據(jù)入口,誰就在那個(gè)場(chǎng)景里擁有持續(xù)的優(yōu)勢(shì)。
![]()
這也是為什么,訓(xùn)練場(chǎng)需要1:1還原真實(shí)場(chǎng)景,而不是搭一個(gè)通用的空曠大廳讓機(jī)器人隨便練?因?yàn)閿?shù)據(jù)的價(jià)值不在于量,在于它跟目標(biāo)場(chǎng)景的匹配度。
一個(gè)在標(biāo)準(zhǔn)化實(shí)驗(yàn)室里采集的抓取動(dòng)作,放到真實(shí)工廠里可能完全失效,因?yàn)楣庹詹灰粯印⒆烂娌馁|(zhì)不一樣、物體擺放的隨機(jī)性不一樣。場(chǎng)景的保真度直接決定了數(shù)據(jù)的可用性。這不只是工程細(xì)節(jié),更是商業(yè)模式的根基。
再往前想一步。當(dāng)真機(jī)數(shù)據(jù)成為稀缺資源,數(shù)據(jù)定價(jià)權(quán)就變得極其關(guān)鍵。
現(xiàn)在行業(yè)還處于早期,數(shù)據(jù)交易更多是點(diǎn)對(duì)點(diǎn)的定制采集。但隨著需求規(guī)模化,一定會(huì)出現(xiàn)數(shù)據(jù)的標(biāo)準(zhǔn)化、分級(jí)和流通機(jī)制。誰能在這個(gè)過程中建立起質(zhì)量標(biāo)準(zhǔn)和定價(jià)體系,誰就有機(jī)會(huì)成為具身智能時(shí)代的"數(shù)據(jù)交易所"。
訓(xùn)練場(chǎng)今天做的事情看起來是采數(shù)據(jù)、賣數(shù)據(jù),但它真正在積累的是對(duì)"什么樣的數(shù)據(jù)有價(jià)值、值多少錢"這個(gè)問題的定義權(quán)。
這可能是整個(gè)具身智能產(chǎn)業(yè)鏈里最容易被低估的一環(huán)。
對(duì)于樂聚這家企業(yè),布局機(jī)器人訓(xùn)練場(chǎng)并非單純售賣數(shù)據(jù),而是著力搭建體系完善的全鏈條產(chǎn)業(yè)生態(tài)。
其生態(tài)計(jì)劃循序漸進(jìn)落地,第一階段率先布局基礎(chǔ)設(shè)施層與核心技術(shù)層,依托量產(chǎn)工廠和訓(xùn)練場(chǎng)打造機(jī)器人硬件本體與智能大腦,同時(shí)完善核心零部件供應(yīng)鏈;第二階段搭建場(chǎng)景應(yīng)用層,匯聚40余家行業(yè)伙伴,覆蓋多個(gè)領(lǐng)域,并聯(lián)動(dòng)高校打通產(chǎn)學(xué)研閉環(huán),完整生態(tài)架構(gòu)全面成型。
如今邁入第三階段,正式面向行業(yè)招募二次開發(fā)合作伙伴。樂聚提前扛下了硬件研發(fā)、場(chǎng)地搭建、數(shù)據(jù)采集等重資產(chǎn)高門檻工作,讓二開合作伙伴無需從零自建本體、搭建訓(xùn)練體系,可直接依托現(xiàn)有生態(tài)快速入局,專注深耕細(xì)分場(chǎng)景應(yīng)用、加速商業(yè)化落地,同時(shí)也以開放生態(tài)模式賦能行業(yè),推動(dòng)整個(gè)具身智能產(chǎn)業(yè)高質(zhì)量發(fā)展。
大家都在關(guān)注誰的模型更強(qiáng)、誰的硬件更酷,但最終決定這個(gè)行業(yè)能不能真正落地的,是那些在訓(xùn)練場(chǎng)里一遍遍讓機(jī)器人拿礦泉水的人。他們做的事情不性感,但不可替代。
如果你有任何看法,歡迎在評(píng)論區(qū)一起討論
如果有一點(diǎn)收獲,可以點(diǎn)贊、轉(zhuǎn)發(fā)、推薦文章,關(guān)注「AI機(jī)器人茶館」
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.