網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

讓機(jī)器人告別「四肢發(fā)達(dá)、頭腦簡單」：拆解樂聚科研框架 2.0 的一體化野心

2026-03-30 15:44:27　來源: AI科技評論

廣東舉報(bào)

分享至

通過數(shù)據(jù)+賽事的雙輪驅(qū)動(dòng)，樂聚補(bǔ)齊了機(jī)器人落地的短板。

提起機(jī)器人，你腦海里浮現(xiàn)的是什么？

是春晚舞臺上整齊劃一、舞姿曼妙的舞林高手？還是展會(huì)上只會(huì)機(jī)械地遞咖啡、轉(zhuǎn)圈圈的氣氛組？

在很多人印象中的機(jī)器人，雖然 Demo 看起來無所不能，但真要讓它去廚房幫你拿個(gè)杯子，它可能下一秒就在地毯上表演平地摔，或者對著墻角陷入漫長的深度思考。

這種大腦想得美，小腦跟不上的尷尬現(xiàn)象，被研究者戲稱為“兩層皮”：決策層（大腦）滿腹經(jīng)綸，但執(zhí)行層（小腦）卻步履蹣跚；或者運(yùn)控極其精準(zhǔn)，卻完全不具備應(yīng)變能力。兩套系統(tǒng)各說各的話，一到復(fù)雜場景就宕機(jī)。

這種斷層，正是制約人形機(jī)器人從實(shí)驗(yàn)室走向真實(shí)場景的最大藩籬。

近日，樂聚機(jī)器人發(fā)布的科研框架 2.0，試圖通過一套深度集成的“大小腦一體化”邏輯，打破這道阻礙機(jī)器人走進(jìn)現(xiàn)實(shí)世界的圍墻。

具身機(jī)器人卡在哪？

要理解樂聚科研框架 2.0 的目標(biāo)與作用，必須先看清行業(yè)的痛點(diǎn)。

目前具身智能研發(fā)面臨著軟硬割裂、流程碎片化、研究與實(shí)際應(yīng)用落差困局。

一方面，行業(yè)普遍將機(jī)器人的功能拆分為兩個(gè)獨(dú)立系統(tǒng)：

?大腦（大模型/任務(wù)規(guī)劃）：負(fù)責(zé)理解語義、拆解任務(wù)、自主決策。

?小腦（運(yùn)動(dòng)控制）：負(fù)責(zé)平衡、運(yùn)動(dòng)、多關(guān)節(jié)協(xié)同。

這種架構(gòu)看似分工明確，實(shí)則隱患重重。

機(jī)器人的大腦決策與小腦運(yùn)控往往互不通、不同步，導(dǎo)致其在處理長時(shí)序復(fù)雜任務(wù)時(shí)表現(xiàn)僵硬，難以實(shí)現(xiàn)類人級別的應(yīng)變。

另一方面，研發(fā)工具鏈極度分散，從數(shù)據(jù)采集、仿真訓(xùn)練，到真機(jī)部署的各個(gè)環(huán)節(jié)互不兼容，研發(fā)時(shí)要將大量精力耗費(fèi)在環(huán)境適配和重復(fù)造輪子上，阻礙了算法創(chuàng)新。

研究人員常面臨采數(shù) 1 天、調(diào)參 3 天、部署卡殼 1 周的窘境，這種碎片化導(dǎo)致大量精力被浪費(fèi)在環(huán)節(jié)銜接上，而非核心科研。

此外，高質(zhì)量真機(jī)數(shù)據(jù)的稀缺與硬件尺寸的限制，也使得研發(fā)成果往往局限于實(shí)驗(yàn)室 Demo，難以跨越Sim2Real（仿真到真機(jī)）的橫溝。

大小腦一體化，終結(jié)思考與動(dòng)作的斷層

樂聚科研框架 2.0 的核心解法非常明確：重構(gòu)大小腦的協(xié)同邏輯，實(shí)現(xiàn)感知、決策、執(zhí)行的端到端打通。

在這套框架下，大腦與小腦不再是兩套說不同方言的系統(tǒng)。該框架統(tǒng)一兼容了全尺寸機(jī)器人平臺，確保了從頂層決策到底層硬件執(zhí)行的高速通訊協(xié)議對齊。

這種一體化設(shè)計(jì)意味著，機(jī)器人在動(dòng)作執(zhí)行的過程中，大腦實(shí)時(shí)感知環(huán)境變化，并動(dòng)態(tài)調(diào)整小腦的運(yùn)控參數(shù)。

機(jī)器人的能力也會(huì)進(jìn)化，從機(jī)械執(zhí)行，到類人作業(yè)。

依托于 OpenLET 社區(qū)與樂聚 LET 全身運(yùn)控/靈巧操作數(shù)據(jù)集，樂聚的小腦系統(tǒng)可以穩(wěn)定輸出高動(dòng)態(tài)、流暢的動(dòng)作。

與之相配合的是，大腦具備了極強(qiáng)的長程任務(wù)拆解與場景泛化能力。在調(diào)酒、分揀等多步驟復(fù)雜任務(wù)中，機(jī)器人可以自主規(guī)劃路徑，根據(jù)物品的擺放位置靈活調(diào)整抓取力度與角度。

長程任務(wù)全流程自主操作演示

現(xiàn)在很多研究機(jī)構(gòu)使用的，是 1 米左右的中小尺寸機(jī)器人，但這會(huì)帶來泛化難題：小機(jī)器人無法完成彎腰取地上的重物、伸手取高架上的零件等真人日常動(dòng)作。這種空間受限的數(shù)據(jù)，在真實(shí)的工業(yè)或家庭場景中幾乎沒有落地價(jià)值。

樂聚科研框架 2.0 則引入了 1.70 米全尺寸全身實(shí)時(shí)遙操系統(tǒng)。

?實(shí)時(shí)同步：支持真人動(dòng)作的毫秒級實(shí)時(shí)同步。

?全自由度：支持彎腰、下蹲、全身聯(lián)動(dòng)，完全貼合人類的作業(yè)姿態(tài)。

?真實(shí)覆蓋：1.7 米的身高確保了操作空間能覆蓋真實(shí)的工業(yè)和家庭環(huán)境高度需求。

樂聚KUAVO5全尺寸全身遙操演示

通過這種全尺寸遙操，科研人員可以在更貼近現(xiàn)實(shí)的環(huán)境下采集數(shù)據(jù)、驗(yàn)證算法，讓科研成果不再僅僅是實(shí)驗(yàn)室里的 Demo，而是直接面向可應(yīng)用的真實(shí)任務(wù)。

以上種種轉(zhuǎn)變，目的就是讓機(jī)器人從簡單的工具，升級為具備了思考+執(zhí)行能力的智能體。

一站式工具全家桶：拒絕重復(fù)造輪子

具身智能研發(fā)的另一大門檻，在于極度碎片化的開發(fā)鏈條。與外界的理解相反，看似并不性感的工程適配，往往會(huì)占據(jù)大量研發(fā)時(shí)間，拖慢創(chuàng)新進(jìn)度。

為了終結(jié)這種低效循環(huán)，樂聚科研框架 2.0 提供了一站式閉環(huán)工具鏈。

在小腦運(yùn)控工具上，樂聚提供了三大核心倉庫：

? Leju-GMR：專注于動(dòng)作重定向。它能精準(zhǔn)地將人類的動(dòng)作映射到機(jī)器人的關(guān)節(jié)上，確保數(shù)據(jù)采集的原汁原味。

? LejuLab-Train：內(nèi)置多種任務(wù)范式。實(shí)現(xiàn)零基礎(chǔ)上手，完成機(jī)器人行走、倒地起身和舞蹈的場景任務(wù)，解決以往研究中訓(xùn)練范式不標(biāo)準(zhǔn)、難以快速上手的問題。

? LejuLab-Deploy：實(shí)現(xiàn)了跨機(jī)型的一鍵式快速部署。無論是中尺寸的教學(xué)演示機(jī)，還是全尺寸的工業(yè)實(shí)操機(jī)，都能做到開箱即用。

基于真人舞蹈軌跡的強(qiáng)化學(xué)習(xí)訓(xùn)練演示

在大腦的具身模型長程任務(wù)規(guī)劃和泛化能力上，提供一整套訓(xùn)練推理部署的工具鏈和數(shù)據(jù)集。框架配套了高質(zhì)量的具身任務(wù)數(shù)據(jù)集，開發(fā)者可以利用這些數(shù)據(jù)直接進(jìn)行模型訓(xùn)練。

數(shù)據(jù)永遠(yuǎn)是 AI 最好的老師，但在機(jī)器人領(lǐng)域，高質(zhì)量的專家數(shù)據(jù)極度稀缺。

為此，科研框架2.0還提供全尺寸全身實(shí)時(shí)遙操技術(shù)，支持真機(jī)數(shù)據(jù)采集和模型二次訓(xùn)練。

全身遙操提供的數(shù)據(jù)集、基準(zhǔn)模型和部署框架，用戶可以進(jìn)行二次訓(xùn)練，部署到真機(jī)上進(jìn)行高質(zhì)量操作數(shù)據(jù)的采集。

這種全鏈路工具鏈的價(jià)值在于，它將開發(fā)者從底層代碼的泥潭中拉了出來，讓他們能專注在更具價(jià)值的算法創(chuàng)新上。

補(bǔ)齊落地最后一塊拼圖

有了框架和硬件，接下來就是如何讓這套系統(tǒng)跑起來。

樂聚通過數(shù)據(jù)+賽事的雙輪驅(qū)動(dòng)，補(bǔ)齊了落地的短板。

就在前不久，開放原子具身智能開源數(shù)據(jù)集社區(qū)正式啟動(dòng)，并發(fā)布 OpenLET 全身運(yùn)控?cái)?shù)據(jù)集。該社區(qū)由開放原子開源基金會(huì)發(fā)起建立，樂聚機(jī)器人牽頭建設(shè)，聯(lián)合了一眾具身智能企業(yè)和科研院校，是一個(gè)聚焦具身智能開源數(shù)據(jù)集和算法的社區(qū)。

目前，針對真機(jī)數(shù)據(jù)采集成本高、多模態(tài)數(shù)據(jù)零散的痛點(diǎn)，樂聚提供了開源的數(shù)據(jù)底座，里面包含了6 萬+分鐘的開源真機(jī)數(shù)據(jù)。這些數(shù)據(jù)覆蓋了工業(yè)、商業(yè)、家庭等117 項(xiàng)原子技能，涵蓋了力控、觸覺、全身關(guān)節(jié)等全方位維度。

此外，樂聚還對接ICRA、天池、機(jī)器人及人工智能、挑戰(zhàn)杯等高含金量賽事，為科研團(tuán)隊(duì)提供真機(jī)評測資源。

這種數(shù)據(jù)訓(xùn)練—算法迭代—賽事驗(yàn)證—產(chǎn)業(yè)轉(zhuǎn)化的閉環(huán)，讓算法不再只是論文里的跑分，而是能真正走出實(shí)驗(yàn)室，進(jìn)入工廠和家庭。

可以看出，樂聚科研框架 2.0 的發(fā)布，不僅是一次簡單的工具迭代，更是對機(jī)器人研發(fā)范式的重新思考。

通過將大腦的邏輯能力與小腦的運(yùn)動(dòng)能力深度整合，并輔以全尺寸硬件支撐和海量開源數(shù)據(jù)，樂聚正在實(shí)現(xiàn)普通人對機(jī)器人的最終幻想：讓它不再是冷冰冰的執(zhí)行機(jī)器，而是能夠通過學(xué)習(xí)和思考，最終成為在復(fù)雜現(xiàn)實(shí)世界中工作的主體。

當(dāng)大腦與肢體終于不再割裂，當(dāng)機(jī)器人能夠像人類一樣，將思考與動(dòng)作無縫融合，那些曾經(jīng)只存在于科幻電影中的應(yīng)用場景，才真正具備了商業(yè)化落地的可能。

未經(jīng)「AI科技評論」授權(quán)，嚴(yán)禁以任何方式在網(wǎng)頁、論壇、社區(qū)進(jìn)行轉(zhuǎn)載！

公眾號轉(zhuǎn)載請先在「AI科技評論」后臺留言取得授權(quán)，轉(zhuǎn)載時(shí)需標(biāo)注來源并插入本公眾號名片。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.