網(wǎng)易首頁(yè) > 網(wǎng)易科技 > 網(wǎng)易科技 > 正文

高德發(fā)布首個(gè)面向AGI的全棧具身技術(shù)體系“ABot”

2026-04-19 15:42:33　來(lái)源: 網(wǎng)易智能

北京舉報(bào)

分享至

據(jù)介紹，ABot體系以AGI為核心目標(biāo)，首次將數(shù)據(jù)引擎、基座模型與執(zhí)行中樞耦合為統(tǒng)一系統(tǒng)。

4月19日消息，在2026北京亦莊機(jī)器人半程馬拉松上，阿里旗下高德公開(kāi)首款開(kāi)放環(huán)境全自主ABot體系，從架構(gòu)上突破了傳統(tǒng)具身智能“單點(diǎn)拼湊、封閉驗(yàn)證”的碎片化路徑，以AGI為核心目標(biāo)，首次將數(shù)據(jù)引擎、基座模型與執(zhí)行中樞耦合為統(tǒng)一系統(tǒng)。目前，高德ABot系列模型已經(jīng)在全球15項(xiàng)權(quán)威基準(zhǔn)測(cè)試中拿到SOTA。

據(jù)了解，ABot體系采用閉環(huán)飛輪式設(shè)計(jì)，涵蓋數(shù)據(jù)、模型、應(yīng)用三層，架構(gòu)并非簡(jiǎn)單堆疊，而是深度咬合、互為引擎，實(shí)現(xiàn)“數(shù)據(jù)驅(qū)動(dòng)模型、模型服務(wù)應(yīng)用、應(yīng)用反哺數(shù)據(jù)“。

據(jù)介紹，作為數(shù)據(jù)層的核心， ABot-World通過(guò)批量合成 Video、Depth、Point Cloud、Trajectory 四類訓(xùn)練數(shù)據(jù)，配合RL Training Engine在虛擬環(huán)境里定義獎(jiǎng)懲、反復(fù)試錯(cuò)。模型以高保真仿真替代高昂的真機(jī)采集，從根本上彌合Sim-to-Real鴻溝，將數(shù)據(jù)成本壓縮數(shù)個(gè)數(shù)量級(jí)。

模型層重點(diǎn)解決具身操作的通用性和導(dǎo)航的長(zhǎng)程性，其核心是感知與決策。其中ABot-M負(fù)責(zé)操作，ABot-N負(fù)責(zé)導(dǎo)航，兩個(gè)模型分工訓(xùn)練、通過(guò) Model Skill機(jī)制組合調(diào)用，完成長(zhǎng)程復(fù)雜任務(wù)。

應(yīng)用層的核心是具身版“龍蝦”ABot-Claw，通過(guò)將異構(gòu)機(jī)器人統(tǒng)一于共享認(rèn)知框架之下，打造具備調(diào)度、記憶、分層控制與社會(huì)對(duì)齊能力的“執(zhí)行中樞”，以應(yīng)對(duì)長(zhǎng)程任務(wù)閉環(huán)難、知識(shí)不共享等問(wèn)題。

據(jù)悉，在PBench、EZSbench、WorldArena、Agibot World Challenge等主流評(píng)測(cè)中ABot-World持續(xù)領(lǐng)先，并成為唯一在物理合規(guī)性、動(dòng)作可控性、零樣本泛化三大維度均達(dá)SOTA的模型。

此外，作為首個(gè)實(shí)現(xiàn)五大核心導(dǎo)航任務(wù)"大一統(tǒng)"的VLA基座模型，ABot-N具備意圖理解、自主決策與持續(xù)進(jìn)化能力，是途途走向開(kāi)放世界的核心導(dǎo)航引擎。ABot-M是全球首個(gè)統(tǒng)一架構(gòu)的具身操作基座模型，其可實(shí)現(xiàn)一個(gè)“通用大腦”適配多種形態(tài)的機(jī)器人，大幅提升操作模型在異構(gòu)機(jī)器人形態(tài)和任務(wù)場(chǎng)景下的泛化能力。其采用層級(jí)式“大腦-動(dòng)作”架構(gòu)，通過(guò)多模塊協(xié)同實(shí)現(xiàn)單一模型導(dǎo)航任務(wù)全覆蓋。ABot-N推出后，在VLN-CE（R2R/RxR）、HM3D-OVON、EVT-Bench等7大權(quán)威基準(zhǔn)上全面刷新SOTA，并在導(dǎo)航精度、社會(huì)合規(guī)性、zero-shot泛化實(shí)現(xiàn)領(lǐng)先。

據(jù)介紹，在LIBERO、LIBERO-Plus、RoboCasa GR1、RoboTwin 2.0等主流評(píng)測(cè)中，ABot-M全面超越π0.5、UniVLA、OpenVLA-OFT等強(qiáng)基線，在泛化能力、魯棒性與跨形態(tài)遷移三個(gè)維度實(shí)現(xiàn)領(lǐng)先。

在ABot-Claw層面，作為ABot體系的“執(zhí)行中樞”，ABot-Claw采用集中式Harness架構(gòu)，將高德地圖與用戶私有地圖設(shè)為全局認(rèn)知錨點(diǎn)，把多模態(tài)感知數(shù)據(jù)統(tǒng)一映射至共享語(yǔ)義空間，形成可動(dòng)態(tài)刷新、持久沉淀的“世界記憶”。新終端接入后，僅需讀取全局上下文即可零成本繼承環(huán)境認(rèn)知。另外，ABot-Claw 采用"云端大腦—邊緣響應(yīng)"兩級(jí)設(shè)計(jì)，兼顧智能深度與執(zhí)行可靠性。在調(diào)度層面，該架構(gòu)還支持多種異構(gòu)機(jī)器人的并行協(xié)作與任務(wù)接力，故障時(shí)自動(dòng)接續(xù)，實(shí)現(xiàn)任務(wù)上下文無(wú)縫移交與跨形態(tài)協(xié)作。ABot-Claw還首創(chuàng)閉環(huán)反饋與糾錯(cuò)機(jī)制，在模糊指令理解、跨機(jī)導(dǎo)引等復(fù)雜場(chǎng)景中充分驗(yàn)證其魯棒性與泛化性。（定西）