4月19日,在2026北京亦莊機器人半程馬拉松賽事現(xiàn)場,阿里巴巴旗下高德地圖正式拋出具身智能領(lǐng)域的重磅突破:全球首個面向AGI的全棧具身技術(shù)體系ABot重磅發(fā)布,同步完成全球首款開放環(huán)境全自主具身機器人“高德途途”的實戰(zhàn)首秀。這款四足機器人在現(xiàn)場成功協(xié)助視障人士完成復(fù)雜避障、人群穿行、動態(tài)路徑規(guī)劃等高嚴(yán)苛度實戰(zhàn)任務(wù),一舉打破了具身智能長期以來“實驗室驗證完美、真實場景落地困難”的行業(yè)魔咒,徹底打通從技術(shù)研發(fā)到實際應(yīng)用的最后一公里,標(biāo)志著中國具身智能正式邁入開放環(huán)境規(guī)模化落地的全新階段。
![]()
高德途途能夠從容應(yīng)對導(dǎo)盲這類對安全性、精準(zhǔn)性、適應(yīng)性要求極高的場景,其底層核心支撐正是高德全新打造的ABot全棧具身技術(shù)體系。該體系并非傳統(tǒng)技術(shù)的簡單堆疊,而是基于上萬種真實生活場景、千萬級多模態(tài)Clip數(shù)據(jù),將高德沉淀十余年的空間智能資產(chǎn)高效轉(zhuǎn)化為具身智能核心訓(xùn)練資源,打造出全球首個以AGI為終極目標(biāo)的全棧具身技術(shù)閉環(huán)。截至目前,ABot系列模型已在全球15項權(quán)威基準(zhǔn)測試中斬獲SOTA(當(dāng)前最優(yōu))成績,用硬核數(shù)據(jù)坐穩(wěn)具身智能領(lǐng)域的技術(shù)領(lǐng)跑位置。
在全球具身智能行業(yè)陷入研發(fā)瓶頸的當(dāng)下,傳統(tǒng)技術(shù)路線普遍存在“單點拼湊、封閉驗證”的碎片化問題,企業(yè)大多聚焦單一功能優(yōu)化,難以形成體系化能力,同時面臨數(shù)據(jù)稀缺、仿真鴻溝、技能泛化三大核心痛點,導(dǎo)致機器人只能在實驗室特定環(huán)境下運行,無法適配復(fù)雜多變的真實開放場景。高德ABot體系從底層架構(gòu)重構(gòu),徹底摒棄傳統(tǒng)碎片化研發(fā)路徑,以AGI為核心導(dǎo)向,首次將數(shù)據(jù)引擎、基座模型與執(zhí)行中樞深度耦合為統(tǒng)一系統(tǒng),采用數(shù)據(jù)-模型-應(yīng)用三層飛輪式閉環(huán)設(shè)計,實現(xiàn)“數(shù)據(jù)驅(qū)動模型、模型服務(wù)應(yīng)用、應(yīng)用反哺數(shù)據(jù)”的自我進(jìn)化邏輯,精準(zhǔn)擊穿行業(yè)三大瓶頸,構(gòu)建起持續(xù)自我迭代的完整技術(shù)生態(tài)。
![]()
這一飛輪設(shè)計的核心邏輯,直接沿襲自高德深耕多年的空間智能飛輪體系。依托近10億月活用戶在真實世界中產(chǎn)生的海量時空數(shù)據(jù)與實時行為反饋,ABot體系的算法能夠在閉環(huán)中持續(xù)快速迭代,模型對物理世界的認(rèn)知深度與廣度不斷提升。這套飛輪無需人工干預(yù),每日在真實場景中自動演進(jìn),形成了高德獨有的體系化優(yōu)勢——不依賴單一技術(shù)點的突發(fā)突破,而是依靠技術(shù)飛輪在真實場景中的持續(xù)運轉(zhuǎn)速度,構(gòu)建起難以復(fù)制的技術(shù)壁壘,這也是ABot能夠快速實現(xiàn)15項SOTA的核心原因。
數(shù)據(jù)層:ABot-World三大維度全球第一,彌合虛擬與真實鴻溝
數(shù)據(jù)是具身智能的核心“燃料”,直接決定了機器人泛化能力的上限。與大語言模型不同,具身智能的真機數(shù)據(jù)采集難以規(guī)模化,成本呈指數(shù)級攀升,成為行業(yè)發(fā)展的核心掣肘。作為ABot體系的底層仿真基座,ABot-World是全球首個將物理定律深度嵌入生成全流程的可微分、可進(jìn)化動力學(xué)引擎,從根本上解決了傳統(tǒng)世界模型“視覺幻覺”、動力學(xué)與真實物理世界脫節(jié)的難題,徹底打通“虛擬訓(xùn)練-真實部署”的最后閉環(huán)。
![]()
架構(gòu)層面,ABot-World專為具身智能定制14BDiT架構(gòu),以觀測數(shù)據(jù)與動作指令為輸入,在潛空間直接生成符合時空動力學(xué)的未來狀態(tài)序列,結(jié)合千萬級真實數(shù)據(jù)與多層級采樣治理,突破單一任務(wù)的泛化限制,讓模型具備應(yīng)對未知場景的能力。場景構(gòu)建上,其搭載3DGS冷啟動空間基座,僅需手機拍攝、航測圖等稀疏輸入,就能通過“粗建模、高保真修復(fù)、蒸餾回環(huán)”的自動化流程,將低質(zhì)量視頻轉(zhuǎn)化為厘米級高精度3D場景,大幅拉低數(shù)據(jù)生成成本,讓大規(guī)模場景復(fù)刻成為可能。
訓(xùn)練技術(shù)上,ABot-World首創(chuàng)Diffusion-DPO物理偏好對齊框架,由VLM生成物理規(guī)則清單并獨立完成判別,構(gòu)建優(yōu)劣樣本對驅(qū)動模型主動抑制違反物理規(guī)律的行為;同時融合拉格朗日動力學(xué)與3DGS重建技術(shù),讓每一幀畫面都成為包含質(zhì)量、摩擦、接觸力等完整物理屬性的可微分物理快照,讓虛擬訓(xùn)練完全貼合真實世界規(guī)則。此外,ABot-World構(gòu)建“訓(xùn)練+數(shù)據(jù)”雙引擎并行架構(gòu),依托高德自有地圖與脫敏數(shù)據(jù)實現(xiàn)厘米級場景重建與光照一致性,目前已累計生產(chǎn)萬級3D真實場景、百萬級推理數(shù)據(jù)與千萬級訓(xùn)練軌跡,覆蓋99%的典型生活場景。
![]()
在PBench、EZSbench、WorldArena、AgibotWorldChallenge等全球主流具身智能評測中,ABot-World持續(xù)領(lǐng)跑全球,成為唯一在物理合規(guī)性、動作可控性、零樣本泛化三大維度均達(dá)到SOTA的世界模型,為上層機器人導(dǎo)航、操作能力提供了最堅實的底層支撐。
![]()
模型層:ABot-N&ABot-M運動雙核,斬獲11項SOTA
如果說ABot全棧體系是具身智能的“運行大腦”,那么ABot-N與ABot-M就是支撐機器人行動的“運動雙核”,分別掌管機器人的“導(dǎo)航雙腿”與“操作雙手”,精準(zhǔn)響應(yīng)物理世界中“去哪里”與“做什么”的核心指令。兩款模型采用統(tǒng)一架構(gòu)設(shè)計,可解耦可協(xié)同,一舉突破跨形態(tài)適配、跨任務(wù)泛化的行業(yè)技術(shù)瓶頸,累計斬獲11項權(quán)威基準(zhǔn)SOTA,成為具身智能模型的標(biāo)桿。
![]()
ABot-N是全球首個實現(xiàn)五大核心導(dǎo)航任務(wù)“大一統(tǒng)”的VLA基座模型,具備意圖理解、自主決策與持續(xù)進(jìn)化能力,是高德途途走向開放世界的核心導(dǎo)航引擎。其采用層級式“大腦-動作”架構(gòu),通過多模塊協(xié)同實現(xiàn)單一模型全覆蓋所有導(dǎo)航任務(wù),徹底打破傳統(tǒng)專用導(dǎo)航架構(gòu)的泛化天花板。發(fā)布后,ABot-N迅速在VLN-CE(R2R/RxR)、HM3D-OVON、EVT-Bench等7大權(quán)威基準(zhǔn)上全面刷新SOTA紀(jì)錄,在導(dǎo)航精度、社會合規(guī)性、零樣本泛化能力上實現(xiàn)斷層式領(lǐng)先,讓機器人在人群、城市、復(fù)雜地形中都能像人類一樣靈活導(dǎo)航。
![]()
ABot-M則是全球首個統(tǒng)一架構(gòu)的具身操作基座模型,實現(xiàn)“一個通用大腦適配多種機器人形態(tài)”,大幅提升操作模型在異構(gòu)機器人、多場景任務(wù)下的泛化能力。其首創(chuàng)全球首個動作流形學(xué)習(xí)技術(shù),將學(xué)習(xí)目標(biāo)由去噪重構(gòu)轉(zhuǎn)為流形投影,顯著提升動作生成的穩(wěn)定性與解碼效率,在高自由度全身控制等復(fù)雜場景中展現(xiàn)極強可擴展性;感知端采用語義流和動作流雙流并行架構(gòu),大幅提升精細(xì)操作的執(zhí)行精度。
![]()
在LIBERO、LIBERO-Plus、RoboCasaGR1、RoboTwin2.0等主流操作評測中,ABot-M全面超越π0.5、UniVLA、OpenVLA-OFT等行業(yè)強基線,在泛化能力、魯棒性與跨形態(tài)遷移三個維度實現(xiàn)系統(tǒng)性領(lǐng)先。
![]()
不僅如此,ABot-N、ABot-M的多項子成果成功入選ICLR、CVPR、ICML、ECCV等全球AI頂會,成為全球機器人精準(zhǔn)導(dǎo)航、高效操作的范式參考,代表中國具身智能模型技術(shù)躋身世界第一梯隊。
應(yīng)用層:ABot-Claw首創(chuàng)MapasMemory,邁向體系智能
記憶能力是機器人跨越認(rèn)知與執(zhí)行鴻溝的底層基石,傳統(tǒng)機器人視覺存在“視野之外即荒原”的致命缺陷,記憶呈現(xiàn)場景碎片化,無法形成全局認(rèn)知,嚴(yán)重制約機器人的長程任務(wù)執(zhí)行能力。作為ABot體系的“執(zhí)行中樞”,ABot-Claw首創(chuàng)“MapasMemory”(地圖即記憶)理念,重構(gòu)具身智能的記憶與執(zhí)行機制,徹底破解場景孤島難題。
ABot-Claw采用通用集中式Harness架構(gòu),將高德地圖與用戶私有地圖設(shè)為全局認(rèn)知錨點,把多模態(tài)感知數(shù)據(jù)統(tǒng)一映射至共享語義空間,形成可動態(tài)刷新、持久沉淀的“世界記憶”。新機器人終端接入后,僅需讀取全局上下文即可零成本繼承環(huán)境認(rèn)知,無需重新學(xué)習(xí)場景,徹底粉碎場景孤島。
![]()
同時,ABot-Claw采用“云端大腦—邊緣響應(yīng)”兩級設(shè)計,既保證了智能決策的深度,又實現(xiàn)了指令執(zhí)行的低延遲與高可靠性,完美平衡智能與效率。
在調(diào)度層面,ABot-Claw支持多種異構(gòu)機器人的并行協(xié)作與任務(wù)接力,遇到設(shè)備故障時可自動接續(xù)任務(wù),實現(xiàn)任務(wù)上下文無縫移交與跨形態(tài)協(xié)同作業(yè)。這一突破標(biāo)志著機器人系統(tǒng)正式從“單體智能”向“體系智能”演進(jìn),機器人不再是孤立的執(zhí)行個體,而是成為共享記憶、統(tǒng)一調(diào)度、協(xié)同進(jìn)化的智能網(wǎng)絡(luò)節(jié)點。此外,ABot-Claw搭載閉環(huán)反饋與實時糾錯機制,在模糊指令理解、跨機導(dǎo)引、復(fù)雜任務(wù)執(zhí)行等場景中,充分驗證了極強的魯棒性與泛化性。
全棧開源賦能行業(yè),重構(gòu)具身智能研發(fā)范式
伴隨高德途途的全球首秀,高德同步宣布開源ABot全棧技術(shù)體系,這是對“AMAPAIInside”核心理念的深度踐行,更是具身智能行業(yè)發(fā)展的里程碑事件。
長期以來,具身智能行業(yè)存在技術(shù)門檻高、研發(fā)成本高、場景適配難的問題,中小團隊難以參與核心技術(shù)研發(fā)。高德ABot全棧開源,將數(shù)據(jù)引擎、世界模型、導(dǎo)航模型、操作模型、執(zhí)行中樞等核心技術(shù)全面開放,直接降低行業(yè)技術(shù)研發(fā)門檻,讓全球開發(fā)者、企業(yè)都能站在高德的技術(shù)肩膀上推進(jìn)具身智能創(chuàng)新。此舉將徹底重構(gòu)具身智能的研發(fā)范式,打破技術(shù)壟斷,推動行業(yè)從單點競爭走向生態(tài)協(xié)同,全面加速AGI時代的到來。
從四足機器人途途的開放場景落地,到ABot全棧體系的15項SOTA,再到全棧技術(shù)開源,高德用一套完整的技術(shù)閉環(huán)與產(chǎn)業(yè)布局,重新定義了具身智能的發(fā)展方向。依托空間智能的核心優(yōu)勢,高德ABot實現(xiàn)了從虛擬訓(xùn)練到真實部署、從單體執(zhí)行到體系協(xié)同、從封閉研發(fā)到開放生態(tài)的全鏈路突破,不僅彰顯了中國在AGI與具身智能領(lǐng)域的技術(shù)實力,更將推動全球具身智能行業(yè)邁入快速落地、全面進(jìn)化的新階段。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.