![]()
新智元報道
![]()
【新智元導讀】全球首個3D原生城市世界模型誕生!單圖十分鐘生成3D城市,高德ABot-Earth0.5只用了百分之一的成本,就讓可實時渲染的3D世界,變得觸手可及。
人類對物理世界的復刻與重構,從未停止過想象。
從古巴比倫的泥板地圖,到大航海時代的羊皮紙海圖;從第一張二維衛星影像,到如今手機里司空見慣的導航地圖。
人類始終在用更精準、更具象的方式,把龐大復雜的真實世界「裝」進小小的載體中。
然而,當我們邁入AI的深水區,傳統的方式突然不夠用了。
在這個時代,看地圖的變成了自動駕駛汽車的傳感器、低空物流無人機的「大腦」、具身智能機器人的決策中樞。
它們需要的,是一個擁有物理法則、具備幾何深度、高度真實還原的三維世界空間。
很長一段時間里,科技界構建3D城市的方式是「采集擬合」。這種方式昂貴且低效,需要派出無數架無人機,拍攝海量照片,通過龐大的算力集群去計算點云,再靠人工去修補那些「融化」的建筑和樹木。
難道這就是唯一的方式嗎?
就在剛剛,一個全新技術的誕生,正在改變3D制圖的歷史走向。
6月8日,高德重磅發布了全球首個3D原生城市世界模型——ABot-Earth0.5。
ABot-Earth0.5的發布不僅宣告著城市級場景3D原生技術的重要突破,更徹底重塑了傳統3D建模的生產邏輯與成本結構。
![]()
百分之一的成本,千倍的提效
長期以來,提到3D地球,行業的絕對標桿一直是Google Earth。高質量的3D地球建模被視為只有巨頭才能承擔的「奢侈工程」,傳統方案動輒需要數年積累、上百億投入。
但現在,AI帶來效率與成本的底層質變,已進化出另一個維度的形態——ABot-Earth0.5。
支撐這一龐大版圖的,是3D生成效率相對傳統方式的「降維打擊」。
過去,要生成一平方公里的高保真3D城市模型,需要等待晴天派無人機航拍,獲取數萬張照片,然后再將數據喂給由上百臺高性能服務器組成的算力集群,再依靠后期大量修模外包人員進行人工精修。
一套標準的3D城市生成動輒數小時到數天,成本高到只有大型市政項目或巨頭企業才能承擔。
而ABot-Earth0.5 3D原生的模式從根本上簡化了這一流程,擊穿了傳統模式的成本壁壘。
![]()
只需任意模態輸入(圖像、文本、3D模型),ABot-Earth0.5就能在消費級GPU上10分鐘內讓一座具備真實地理與幾何一致性的3D城市拔地而起,3D城市生成效率提升1000倍。
3D城市的生產周期,正式進入「按分鐘交付」的時代。
憑借這種顛覆性的生產力,ABot-Earth0.5目前已經悄然建成了全球覆蓋面積最廣的3D地圖,遍及全球190多個國家和地區。
![]()
過去,高保真3D模型是「奢侈品」;現在,ABot-Earth0.5將其變成了「工業標準件」。
告別「中間商」,直達原生渲染
如果僅僅是快和便宜,那可能只是犧牲了質量換來的妥協。
但ABot-Earth0.5生成的3D城市較人工重建的水準也不遑多讓。
傳統由照片生成的3D模型,其輸出格式往往是點云(Point Cloud)或者多邊形網格(Mesh),再貼上一層2D的紋理貼圖。
這種格式在遠看時還可以糊弄眼睛,一旦拉近,建筑邊緣的鋸齒、植被那慘不忍睹的幾何扭曲就會暴露無遺。
更重要的是這些格式在導入到現代游戲引擎或工業仿真軟件時,往往需要極為繁瑣的格式轉換和二次優化。
ABot-Earth0.5的3D原生模式則不再具備這部分憂慮。它的輸出,不再是粗糙的網格和貼圖,而是原生可渲染、工程可用的3DGS資產。
![]()
這種原生格式帶來了兩個顯著優勢。
第一,極高的保真度。樹葉的縫隙、水波的反射、建筑的復雜紋理,在幾千萬個高斯基元的描繪下栩栩如生。
第二,高工程可用性。ABot-Earth0.5生成的3D城市,可以直接導入到Unity或Unreal Engine等主流引擎中無縫使用。
沒有繁瑣的「中間商賺差價」,沒有格式轉換的數據流失。
ABot-Earth0.5的出現,向全行業宣告:3D城市生成的舊范式,已經被徹底改寫。
![]()
為什么只有高德做得出來?
看到這里,你一定會疑問:既然3DGS原生世界模型這么強大,為什么之前沒有人做出來?為什么偏偏是高德拔得頭籌?
![]()
要回答這個問題,我們需要進行一次深度的技術拆解。
你會發現,ABot-Earth0.5的誕生并非偶然,它是路徑選擇、工程能力與數據壁壘共同催生的結果。
高德能夠做成這個模型,靠的是二十年積累的真實空間技術和數據,以及對3D原生路線的堅定押注。
打破神話的「真實時空數據」
在當下的人工智能浪潮中,數據是決定模型想象力的天花板。
不同于大語言模型遍布整個以太網的數據量,空間智能模型所需要的真實3D數據量級嚴重不足。
這也就催生了數據采集工廠和合成數據產業,行業內的一些大模型就是通過游戲引擎生成的虛擬數據進行訓練的。
然而,要生成一個真實的「世界模型」,合成數據是完全靠不住的。
因為地球并非是由規則的幾何體拼接而成的。真實城市的肌理充滿了復雜性:毫無規律生長的龐大植被、高低錯落的非標準建筑、在陽光下折射出不同光影的河流湖泊……
如果只用合成數據去喂養AI,AI永遠只能學會建造一個并不可靠且「塑料感」十足的樂高城市,因為它無法理解真實世界的地理規律。
而這道橫亙在技術發展面前的鴻溝,恰恰是高德的強項——數據護城河。
高德作為扎根物理世界二十余年的科技企業,擁有著其他純科技公司難以企及的龐大、真實的空間數據儲備。
ABot-Earth0.5訓練數據源于高德沉淀的海量時空數據,它的每一次訓練,都是在吸收真實城市的地理與幾何先驗。它學習的不是「如何畫一棟樓」,而是「真實世界中的樓是如何與街道、樹木、光影共存的」,這就從根本上保證了ABot-Earth0.5生成內容的「地理一致性」和「幾何一致性」。
這條用時間與腳步丈量出來的數據護城河,是任何后來者都無法在短期內通過砸錢買算力來趕超的。
![]()
拋棄「2D蒸餾」,直擊「原生3D理解」
在ABot-Earth0.5之前,學術界和工業界探索3D生成,普遍走的是一條「曲線救國」的道路:從2D圖像蒸餾3D結構。
簡單來說,就是先讓大模型看海量的2D照片,然后讓它去「猜」這個物體的3D長什么樣。
這種方法用來生成一個蘋果、一張椅子等物品級的3D模型還勉強湊合;但如果用來生成一座包含萬物、結構極其復雜的城市,AI就會瞬間陷入混亂,產出的模型充滿了幻覺和幾何謬誤。
既然要建構3D世界,為什么不直接讓AI用3D的方式去思考?
高德所采用的就是一條全新開辟的技術棧——直接以海量3DGS數據訓練模型。讓AI從一開始就形成對三維空間的原生理解,從而實現在單張衛星圖的條件下,端到端直接生成3DGS格式的城市場景。
工程破局:ABot-Earth0.5的四重突破
理論很豐滿,但要讓原生3DGS模型真正落地為工業級產品,需跨越數據表征、尺度交互、空間連續與條件適配四大工程挑戰。
高德通過系統性架構設計,完成了對四大挑戰的逐一突破,率先跑通了城市級3D原生場景的端到端生成鏈路。
![]()
挑戰一:3D表示差異(Representation Gap)
現有的生成器大多是為處理3D網格(Mesh)設計的。
但真實戶外場景里,到處都是樹木、水體這類充滿「復雜非流形拓撲」的東西,用Mesh表示就像用保鮮膜去包裹一棵樹,根本包不住,結果就是一團漿糊。
而3DGS(數百萬無序的高斯基元)能完美還原這些細節,但它太龐大、太無序,現有的AI根本咬不動。
為此,高德首創了一個直接在3DGS表示上進行操作的「壓縮-生成」框架。
他們就像給極其復雜的3DGS數據做了一個超級ZIP壓縮包,將其編碼到一個緊湊的隱空間中,讓AI能夠在其中輕松進行推理和生成,然后再解壓成全新的高質量場景。
挑戰二:多尺度交互渲染(Scale & Interactivity)
地球級的場景,不能只能遠觀。用戶需要從上帝視角的宏觀城市,一秒鐘俯沖到微觀的街道細節中去。
這種連續的LOD(多層次細節)漫游,是之前的「物品級」生成器連想都不敢想的。為此,高德設計了原生多層次細節(LOD)解碼器。它將LOD直接集成到了生成過程中。
![]()
不需要生成完再花大把時間去做后處理,AI在生成城市的那一刻,就已經把宏觀和微觀的層次結構建好了。這為流暢的、實時的在線漫游提供了強大的原生支持。
挑戰三:大范圍空間連續性(Spatial Coherence)
要生成公里級的大范圍場景,AI的顯存會被瞬間撐爆。所以必須分塊(tiles)生成。但分塊生成就像把不同人織的毛衣布料拼在一起,必然會出現刺眼的接縫,完全破壞了真實感。
高德提出了一種高效的「基于滑窗的無縫推理策略」。
AI在生成相鄰地塊時,會在重疊區域進行智能融合算法處理。就像是一個手法極其高超的裁縫,在針腳交匯處進行了完美的過渡,極大地消除了拼接痕跡,真正實現了公里級甚至更大范圍的近乎無縫的連續構建。
挑戰四:條件魯棒性(Conditional Robustness)
全球各地的衛星影像,清晰度不同、顏色不同、拍攝傾角不同,有的甚至還有云層遮擋。
更要命的是,衛星圖和AI訓練用的航拍圖之間存在巨大的「域差異」(比如大氣造成的顏色偏差)。
如何讓模型在看到任何一張質量參差不齊的真實衛星圖時,都能始終穩定發揮?
針對這個問題,高德獨創了跨域自適應條件注入策略。
在訓練時,高德刻意模擬衛星的視角去渲染航拍重建數據,讓模型提前適應這種「模糊感」;在推理時,高德引入了強大的視覺語言模型(VLM)作為一個「適配器」,去動態調整、校準輸入的真實衛星影像特性。
![]()
這種強大的魯棒性,確保了ABot-Earth0.5在面對任意一張圖時,都能生成高可信度的3D場景。
這四項技術并非孤立優化,而是構成了一套完整的城市級3D原生生成工程體系。
相較于學術界常見的實驗性探索,高德首次在工業尺度上打通了從3D數據表征、連續生成到多條件適配的完整鏈路,驗證了前沿3D生成算法走向規模化、低成本落地的工程可行性。
空間智能的工程落地,已經全面開始
當我們驚嘆于ABot-Earth0.5的技術亮點時,我們更應該退后一步,看看這項技術發布背后所隱含的巨大產業風暴。空間智能技術的成熟,正在推動多個產業進入新的發展階段。
補齊AI理解世界的最后一塊拼圖
在過去的兩年里,大語言模型證明了AI在語言理解和邏輯推演上取得了歷史性的突破。
但是,文字終究是人類文明的抽象符號。
如果AI要真正融入人類的物理世界,它就必須具備理解空間、生成空間、在空間中行動的能力。這就是目前全球頂級科技圈都在瘋狂追逐的圣杯——空間智能。
高德的ABot-Earth0.5則用實打實的工程成果,證明了AI在推斷和生成復雜物理空間結構上的驚人突破。
![]()
如果說大模型讓機器學會了「說話」,那么ABot-Earth0.5就是讓機器學會了「睜眼看世界」并「在腦海中構建世界」。這兩者的結合,標志著AI的進化正式從二維的數字空間,跨入了三維的物理世界。
場景落地:千行百業的生產力重構
技術突破的最終歸宿是產業落地。
ABot-Earth0.5以其驚人的速度、極低的成本和直接沉淀3D模型資產的能力,正在對多個產業帶來結構性的顛覆。
具身智能:打通機器人仿真的「任督二脈」
傳統的虛擬仿真環境存在致命缺陷:要么因為「太假」導致機器人學不到真實的物理反饋;要么因為追求高保真,導致人工建模成本極其高昂,動輒耗時數月、花費百萬,且場景單一,無法覆蓋長尾的邊緣場景。
ABot-Earth0.5的出現,相當于為具身智能打通了任督二脈。
只需幾分鐘,ABot-Earth0.5就能根據真實數據生成物理精確的3D城市。真實的臺階高度、路面坑洼的幾何起伏、樹木與建筑的遮擋關系、甚至光影的反射,都能被精準還原。
并且,它還能生成指數級的訓練場景。 只需要輸入不同的文本或圖像指令,它就能瞬間生成「下雨積水的十字路口」、「滿是雜物的狹窄巷道」等無數種復雜的合成數據環境。
這徹底改變了機器人訓練的邏輯。
ABot-Earth0.5不再只是一個制圖工具,它正在成為具身智能時代不可或缺的底層世界模擬器。
低空經濟:以極低成本鋪設「天空之城的隱形軌道」
以無人機物流、eVTOL(電動垂直起降飛行器)為代表的低空經濟,是當下最火熱的萬億級戰略賽道。
但想要讓成千上萬的飛行器在城市上空安全穿梭,依靠傳統的2D平面地圖無異于盲人摸象。
低空飛行需要精確到厘米級的3D全域地圖來規劃航線、規避障礙物。
然而,傳統的3D測繪成本極高、更新極慢,根本無法覆蓋廣袤且時刻變化的全域低空。
現在,利用ABot-Earth0.5,低空經濟的基建成本被徹底打下來了!
僅需輸入常規的衛星圖或普通航拍圖,ABot-Earth0.5即可在極短時間內、以近乎為零的邊際成本,生成覆蓋全域的高保真3D基底。
而且,它還解決了一個更為棘手的難題:城市是生長的,昨天沒有的塔吊,今天可能就成了致命障礙。憑借「按分鐘交付」的極速能力,ABot-Earth0.5能夠實現低空地圖的高頻甚至實時更新。
現在,ABot-Earth0.5為每一架無人機鋪設了安全、精準的隱形軌道,讓低空空域從不可控的荒野,變成了秩序井然的數字高速公路。
智慧政務與應急響應:與時間賽跑的生命通道
在地震、洪水等災害發生時,災區的地貌往往會發生巨大改變。救援的黃金72小時內,每一分鐘都極其寶貴。
然而,傳統測繪需要漫長的數據處理,等3D模型建好,救援時機早已錯失。
而這,正是ABot-Earth0.5發揮極限價值的生死場。
它能實現災情的實時三維重建。
前方只需用普通無人機飛一圈傳回影像,或者僅僅憑借幾張現場照片,指揮中心利用單張顯卡,10分鐘內就能生成災后現場的1:1三維結構全景。
救援人員可以在這個瞬間生成的3D沙盤上,精準測算泥石流的土方量、尋找安全的直升機降落點、規劃不會被二次滑坡波及的生命通道、甚至分析洪水淹沒的立體范圍。
在常規的城市治理中,這種能力同樣帶來了質的飛躍。
過去的違建排查、老舊小區改造需要大量人力實地丈量。
現在,通過ABot-Earth0.5快速生成城市高保真3D孿生底座,規劃部門可以一鍵模擬新建高樓對周邊小區的日照遮擋。
真正的「數字孿生城市」,因為ABot-Earth0.5的低門檻,實現了普惠應用。
高德,用想象力重塑邊界
ABot-Earth0.5的發布,是高德長期技術積累的集中體現。
大眾對高德的傳統認知,是一個好用的導航軟件,是一個地理信息的記錄者。
但隨著高德首款機器人高德途途和全棧具身技術體系ABot的亮相,高德持續向世界展示了其深厚的技術底蘊。而此次ABot-Earth0.5的發布,正是ABot體系的重要補充和能力放大。
憑借在以ABot技術體系為核心的空間智能算法基礎上的持續突破,高德的邊界正在無限延伸——它正在從「記錄物理世界」的數字制圖者,進化為「生成物理世界」的空間智能引擎。
在過去,高德告訴你「世界長什么樣」;而在未來,高德的技術將能夠為AI和千行百業「按需生成這個世界」。
高德ABot-Earth0.5的發布,已經讓空間智能規模化落地成為可能。
一張圖,十分鐘,一座城。
這在昨天聽起來像是科幻小說的情節,在今天已經成為可以用代碼運行、用顯卡計算的真實工程。
如今,3D城市建模的舊有范式已經被打破,高德作為先行者和定義者,已經推開了那扇通往三維新世界的大門。
官方網站:
abot-earth.amap.com
技術報告:
https://github.com/amap-cvlab/ABot-Earth-0.5/blob/main/tech-report.pdf
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.