![]()
通過數(shù)據(jù)+賽事的雙輪驅(qū)動(dòng),樂聚補(bǔ)齊了機(jī)器人落地的短板。
提起機(jī)器人,你腦海里浮現(xiàn)的是什么?
是春晚舞臺上整齊劃一、舞姿曼妙的舞林高手?還是展會(huì)上只會(huì)機(jī)械地遞咖啡、轉(zhuǎn)圈圈的氣氛組?
在很多人印象中的機(jī)器人,雖然 Demo 看起來無所不能,但真要讓它去廚房幫你拿個(gè)杯子,它可能下一秒就在地毯上表演平地摔,或者對著墻角陷入漫長的深度思考。
這種大腦想得美,小腦跟不上的尷尬現(xiàn)象,被研究者戲稱為“兩層皮”:決策層(大腦)滿腹經(jīng)綸,但執(zhí)行層(小腦)卻步履蹣跚;或者運(yùn)控極其精準(zhǔn),卻完全不具備應(yīng)變能力。兩套系統(tǒng)各說各的話,一到復(fù)雜場景就宕機(jī)。
這種斷層,正是制約人形機(jī)器人從實(shí)驗(yàn)室走向真實(shí)場景的最大藩籬。
近日,樂聚機(jī)器人發(fā)布的科研框架 2.0,試圖通過一套深度集成的“大小腦一體化”邏輯,打破這道阻礙機(jī)器人走進(jìn)現(xiàn)實(shí)世界的圍墻。
01
具身機(jī)器人卡在哪?
要理解樂聚科研框架 2.0 的目標(biāo)與作用,必須先看清行業(yè)的痛點(diǎn)。
目前具身智能研發(fā)面臨著軟硬割裂、流程碎片化、研究與實(shí)際應(yīng)用落差困局。
一方面,行業(yè)普遍將機(jī)器人的功能拆分為兩個(gè)獨(dú)立系統(tǒng):
?大腦(大模型/任務(wù)規(guī)劃):負(fù)責(zé)理解語義、拆解任務(wù)、自主決策。
?小腦(運(yùn)動(dòng)控制):負(fù)責(zé)平衡、運(yùn)動(dòng)、多關(guān)節(jié)協(xié)同。
這種架構(gòu)看似分工明確,實(shí)則隱患重重。
機(jī)器人的大腦決策與小腦運(yùn)控往往互不通、不同步,導(dǎo)致其在處理長時(shí)序復(fù)雜任務(wù)時(shí)表現(xiàn)僵硬,難以實(shí)現(xiàn)類人級別的應(yīng)變。
![]()
另一方面,研發(fā)工具鏈極度分散,從數(shù)據(jù)采集、仿真訓(xùn)練,到真機(jī)部署的各個(gè)環(huán)節(jié)互不兼容,研發(fā)時(shí)要將大量精力耗費(fèi)在環(huán)境適配和重復(fù)造輪子上,阻礙了算法創(chuàng)新。
研究人員常面臨采數(shù) 1 天、調(diào)參 3 天、部署卡殼 1 周的窘境,這種碎片化導(dǎo)致大量精力被浪費(fèi)在環(huán)節(jié)銜接上,而非核心科研。
此外,高質(zhì)量真機(jī)數(shù)據(jù)的稀缺與硬件尺寸的限制,也使得研發(fā)成果往往局限于實(shí)驗(yàn)室 Demo,難以跨越Sim2Real(仿真到真機(jī))的橫溝。
02
大小腦一體化,終結(jié)思考與動(dòng)作的斷層
樂聚科研框架 2.0 的核心解法非常明確:重構(gòu)大小腦的協(xié)同邏輯,實(shí)現(xiàn)感知、決策、執(zhí)行的端到端打通。
在這套框架下,大腦與小腦不再是兩套說不同方言的系統(tǒng)。該框架統(tǒng)一兼容了全尺寸機(jī)器人平臺,確保了從頂層決策到底層硬件執(zhí)行的高速通訊協(xié)議對齊。
這種一體化設(shè)計(jì)意味著,機(jī)器人在動(dòng)作執(zhí)行的過程中,大腦實(shí)時(shí)感知環(huán)境變化,并動(dòng)態(tài)調(diào)整小腦的運(yùn)控參數(shù)。
機(jī)器人的能力也會(huì)進(jìn)化,從機(jī)械執(zhí)行,到類人作業(yè)。
依托于 OpenLET 社區(qū)與樂聚 LET 全身運(yùn)控/靈巧操作數(shù)據(jù)集,樂聚的小腦系統(tǒng)可以穩(wěn)定輸出高動(dòng)態(tài)、流暢的動(dòng)作。
與之相配合的是,大腦具備了極強(qiáng)的長程任務(wù)拆解與場景泛化能力。在調(diào)酒、分揀等多步驟復(fù)雜任務(wù)中,機(jī)器人可以自主規(guī)劃路徑,根據(jù)物品的擺放位置靈活調(diào)整抓取力度與角度。
![]()
長程任務(wù)全流程自主操作演示
現(xiàn)在很多研究機(jī)構(gòu)使用的,是 1 米左右的中小尺寸機(jī)器人,但這會(huì)帶來泛化難題:小機(jī)器人無法完成彎腰取地上的重物、伸手取高架上的零件等真人日常動(dòng)作。這種空間受限的數(shù)據(jù),在真實(shí)的工業(yè)或家庭場景中幾乎沒有落地價(jià)值。
樂聚科研框架 2.0 則引入了 1.70 米全尺寸全身實(shí)時(shí)遙操系統(tǒng)。
?實(shí)時(shí)同步:支持真人動(dòng)作的毫秒級實(shí)時(shí)同步。
?全自由度:支持彎腰、下蹲、全身聯(lián)動(dòng),完全貼合人類的作業(yè)姿態(tài)。
?真實(shí)覆蓋:1.7 米的身高確保了操作空間能覆蓋真實(shí)的工業(yè)和家庭環(huán)境高度需求。
![]()
樂聚KUAVO5全尺寸全身遙操演示
通過這種全尺寸遙操,科研人員可以在更貼近現(xiàn)實(shí)的環(huán)境下采集數(shù)據(jù)、驗(yàn)證算法,讓科研成果不再僅僅是實(shí)驗(yàn)室里的 Demo,而是直接面向可應(yīng)用的真實(shí)任務(wù)。
以上種種轉(zhuǎn)變,目的就是讓機(jī)器人從簡單的工具,升級為具備了思考+執(zhí)行能力的智能體。
03
一站式工具全家桶:拒絕重復(fù)造輪子
具身智能研發(fā)的另一大門檻,在于極度碎片化的開發(fā)鏈條。與外界的理解相反,看似并不性感的工程適配,往往會(huì)占據(jù)大量研發(fā)時(shí)間,拖慢創(chuàng)新進(jìn)度。
為了終結(jié)這種低效循環(huán),樂聚科研框架 2.0 提供了一站式閉環(huán)工具鏈。
在小腦運(yùn)控工具上,樂聚提供了三大核心倉庫:
? Leju-GMR: 專注于動(dòng)作重定向。它能精準(zhǔn)地將人類的動(dòng)作映射到機(jī)器人的關(guān)節(jié)上,確保數(shù)據(jù)采集的原汁原味。
? LejuLab-Train:內(nèi)置多種任務(wù)范式。實(shí)現(xiàn)零基礎(chǔ)上手,完成機(jī)器人行走、倒地起身和舞蹈的場景任務(wù),解決以往研究中訓(xùn)練范式不標(biāo)準(zhǔn)、難以快速上手的問題。
? LejuLab-Deploy: 實(shí)現(xiàn)了跨機(jī)型的一鍵式快速部署。無論是中尺寸的教學(xué)演示機(jī),還是全尺寸的工業(yè)實(shí)操機(jī),都能做到開箱即用。
![]()
基于真人舞蹈軌跡的強(qiáng)化學(xué)習(xí)訓(xùn)練演示
在大腦的具身模型長程任務(wù)規(guī)劃和泛化能力上,提供一整套訓(xùn)練推理部署的工具鏈和數(shù)據(jù)集。框架配套了高質(zhì)量的具身任務(wù)數(shù)據(jù)集,開發(fā)者可以利用這些數(shù)據(jù)直接進(jìn)行模型訓(xùn)練。
數(shù)據(jù)永遠(yuǎn)是 AI 最好的老師,但在機(jī)器人領(lǐng)域,高質(zhì)量的專家數(shù)據(jù)極度稀缺。
為此,科研框架2.0還提供全尺寸全身實(shí)時(shí)遙操技術(shù),支持真機(jī)數(shù)據(jù)采集和模型二次訓(xùn)練。
全身遙操提供的數(shù)據(jù)集、基準(zhǔn)模型和部署框架,用戶可以進(jìn)行二次訓(xùn)練,部署到真機(jī)上進(jìn)行高質(zhì)量操作數(shù)據(jù)的采集。
這種全鏈路工具鏈的價(jià)值在于,它將開發(fā)者從底層代碼的泥潭中拉了出來,讓他們能專注在更具價(jià)值的算法創(chuàng)新上。
04
補(bǔ)齊落地最后一塊拼圖
有了框架和硬件,接下來就是如何讓這套系統(tǒng)跑起來。
樂聚通過數(shù)據(jù)+賽事的雙輪驅(qū)動(dòng),補(bǔ)齊了落地的短板。
就在前不久,開放原子具身智能開源數(shù)據(jù)集社區(qū)正式啟動(dòng),并發(fā)布 OpenLET 全身運(yùn)控?cái)?shù)據(jù)集。該社區(qū)由開放原子開源基金會(huì)發(fā)起建立,樂聚機(jī)器人牽頭建設(shè),聯(lián)合了一眾具身智能企業(yè)和科研院校,是一個(gè)聚焦具身智能開源數(shù)據(jù)集和算法的社區(qū)。
![]()
目前,針對真機(jī)數(shù)據(jù)采集成本高、多模態(tài)數(shù)據(jù)零散的痛點(diǎn),樂聚提供了開源的數(shù)據(jù)底座,里面包含了6 萬+分鐘的開源真機(jī)數(shù)據(jù)。這些數(shù)據(jù)覆蓋了工業(yè)、商業(yè)、家庭等117 項(xiàng)原子技能,涵蓋了力控、觸覺、全身關(guān)節(jié)等全方位維度。
此外,樂聚還對接ICRA、天池、機(jī)器人及人工智能、挑戰(zhàn)杯等高含金量賽事,為科研團(tuán)隊(duì)提供真機(jī)評測資源。
這種數(shù)據(jù)訓(xùn)練—算法迭代—賽事驗(yàn)證—產(chǎn)業(yè)轉(zhuǎn)化的閉環(huán),讓算法不再只是論文里的跑分,而是能真正走出實(shí)驗(yàn)室,進(jìn)入工廠和家庭。
可以看出,樂聚科研框架 2.0 的發(fā)布,不僅是一次簡單的工具迭代,更是對機(jī)器人研發(fā)范式的重新思考。
通過將大腦的邏輯能力與小腦的運(yùn)動(dòng)能力深度整合,并輔以全尺寸硬件支撐和海量開源數(shù)據(jù),樂聚正在實(shí)現(xiàn)普通人對機(jī)器人的最終幻想:讓它不再是冷冰冰的執(zhí)行機(jī)器,而是能夠通過學(xué)習(xí)和思考,最終成為在復(fù)雜現(xiàn)實(shí)世界中工作的主體。
當(dāng)大腦與肢體終于不再割裂,當(dāng)機(jī)器人能夠像人類一樣,將思考與動(dòng)作無縫融合,那些曾經(jīng)只存在于科幻電影中的應(yīng)用場景,才真正具備了商業(yè)化落地的可能。
未經(jīng)「AI科技評論」授權(quán),嚴(yán)禁以任何方式在網(wǎng)頁、論壇、社區(qū)進(jìn)行轉(zhuǎn)載!
公眾號轉(zhuǎn)載請先在「AI科技評論」后臺留言取得授權(quán),轉(zhuǎn)載時(shí)需標(biāo)注來源并插入本公眾號名片。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.