杰西卡 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI
AI行業(yè),最稀缺的搶手貨變了。
李飛飛提出“空間智能”后,行業(yè)正在形成一個越來越明顯的趨勢判斷:大模型之后,世界模型、具身智能正成為資本和產(chǎn)業(yè)關(guān)注的新焦點。
然而,AI開始轉(zhuǎn)向理解并作用于真實的物理世界之時,一個尷尬的現(xiàn)實也隨之浮現(xiàn):
訓練這些模型所需的真實物理世界交互數(shù)據(jù),極度稀缺——缺到甚至有業(yè)內(nèi)觀點認為,需求與供給之間,可能存在近十萬倍的差距。
因為過去的大模型,靠海量文本和圖片就能完成語言理解與生成,但具身智能需要的是“決策→行動→反饋”的完整鏈條——這些靜態(tài)、缺乏因果和交互的數(shù)據(jù),很難再滿足需求。
行業(yè)迫切需要一種全新的數(shù)據(jù):來自真實物理世界、帶有因果邏輯、能持續(xù)產(chǎn)出的交互數(shù)據(jù)。
![]()
于是,高質(zhì)量的物理世界數(shù)據(jù),成為當下戰(zhàn)略級的稀缺資源;而能為行業(yè)持續(xù)、低成本、大規(guī)模生產(chǎn)物理世界數(shù)據(jù)的玩家,也逐漸被推上風口。
有意思的是,業(yè)內(nèi)人士告訴量子位,AI時代最大的物理世界數(shù)據(jù)入口之一,很可能正在從一個很多人意想不到的行業(yè)里誕生,那就是出行平臺。
你可能并不知曉,平日里常用的出行服務平臺,除了出行服務之外,正在用數(shù)據(jù)新業(yè)務“賺外快”。
出行平臺,流行起用數(shù)據(jù)“賺外快”?
出行服務行業(yè),最近逐漸流行起一門新的生意:手握海量真實道路一手數(shù)據(jù)源的平臺們,正通過數(shù)據(jù)資產(chǎn)化、服務化等方式,開辟第二增長曲線。
而且這些平臺中,已經(jīng)有玩家成功變現(xiàn),初步驗證了商業(yè)化路徑的可行性。
最先對外披露具體數(shù)據(jù)的,是廣汽集團旗下的出行服務平臺——如祺出行。
![]()
如祺出行在2025年財報中披露,以AI數(shù)據(jù)業(yè)務為主要收入來源的技術(shù)服務板塊,已成為公司增長最快的板塊。
而這個AI數(shù)據(jù)業(yè)務,指的是如祺出行的數(shù)據(jù)業(yè)務板塊(以下簡稱“如祺數(shù)據(jù)”),最早布局于2023年。
彼時,如祺出行在2023年5月獲批了乙級測繪資質(zhì),開始將那些搭載激光雷達、高精度慣導、周視與環(huán)視攝像頭等傳感器的智能駕駛數(shù)據(jù)采集車,投入常態(tài)化運營。
這些車輛在提供出行服務的同時,也在合規(guī)采集真實的駕駛和道路數(shù)據(jù)。而如祺數(shù)據(jù)也在采集數(shù)據(jù)的過程中,不斷延伸其數(shù)據(jù)服務能力。
![]()
直到最近,如祺數(shù)據(jù)首次對外完整披露了其AI數(shù)據(jù)資產(chǎn)及能力版圖。
公開信息顯示,其數(shù)據(jù)資產(chǎn)已覆蓋標注數(shù)據(jù)、行為數(shù)據(jù)、合成數(shù)據(jù)及多模態(tài)訓練數(shù)據(jù)集四大類,涵蓋從原始采集到加工交付的全鏈條。
這其中,標注數(shù)據(jù)是基礎(chǔ),行為數(shù)據(jù)則記錄了駕駛員在實際道路環(huán)境中的操作決策,合成數(shù)據(jù)用于補充長尾場景,多模態(tài)訓練數(shù)據(jù)集則覆蓋圖像、文本、音頻與視頻,可以直接用于大模型的垂類微調(diào)。
規(guī)模上,如祺數(shù)據(jù)已搭建起一張覆蓋面可觀的數(shù)據(jù)采集網(wǎng)絡。
截至2026年5月,公司在廣州、上海、重慶、沈陽等城市,部署了超過300輛智能駕駛數(shù)據(jù)采集車。
通過近三年的常態(tài)化運營,這些車輛的日均產(chǎn)出已經(jīng)達到1600小時、130TB;平臺亦累計沉淀出千萬級的高價值駕駛場景片段。
![]()
這些片段背后,本身就是完整的真實世界交互過程。從這個角度看,平臺產(chǎn)生的數(shù)據(jù),更像是在持續(xù)生產(chǎn)物理世界的“切片”。
而規(guī)模之外,商業(yè)化進展才是真正檢驗其模式可行性的關(guān)鍵。
在如祺財報中,2025年,以AI數(shù)據(jù)服務為主要收入來源的技術(shù)服務板塊,錄得營收1.6億元,同比大增487.4%。
這一增速說明,市場對高質(zhì)量物理世界數(shù)據(jù)的需求正在快速釋放。
如祺數(shù)據(jù)的客戶結(jié)構(gòu)也能驗證這一結(jié)論。據(jù)介紹,公司服務目前已覆蓋智能駕駛、具身智能、大模型、消費電子、醫(yī)療等多個領(lǐng)域;騰訊、小馬智行、理想、火山引擎、百度智能云、廣汽集團等頭部企業(yè)都是其客戶。
![]()
也就是說,從出行服務衍生出的數(shù)據(jù)服務,已經(jīng)具備跨行業(yè)解決實際需求的能力,并且能跑通從數(shù)據(jù)采集、加工到商業(yè)化交付的完整閉環(huán)。
隨之而來的變化是,外界更新了對如祺這類出行平臺的認知。
具備全鏈條數(shù)據(jù)服務能力的如祺,不再只是一家出行服務商,也不單單是傳統(tǒng)的數(shù)據(jù)標注服務商,而是在向“數(shù)據(jù)集+全棧能力”的綜合服務商升級。
而這種“數(shù)據(jù)集+全棧能力”的閉環(huán)能力,很可能也會成為下一代AI中,不可或缺的底層基礎(chǔ)設施之一。
出行平臺,為什么突然造就了AI基礎(chǔ)設施?
想更好理解出行平臺的身份轉(zhuǎn)變,其實可以將其拆解為兩個更本質(zhì)的問題:
為什么AI行業(yè)對物理世界數(shù)據(jù)如此渴求?
以及,為什么出行平臺恰恰能填補這個缺口?
一切要從李飛飛對世界模型的定義說起。她認為,當前主流的大語言模型存在一個致命缺陷,就是缺乏“空間智能”——即對三維物理世界進行感知、推理和行動的能力。
因此,李飛飛倡導構(gòu)建一種全新的AI系統(tǒng),讓機器能像人類一樣,理解三維物理世界的運行法則,并完成互動。
這套系統(tǒng),就是她所說的“世界模型”。而世界模型需要具備三個最核心的標準:生成性、多模態(tài)性、交互性。
![]()
這意味著,訓練下一代AI所需的數(shù)據(jù),必須同時具備這三個特征,尤其是“交互性”——數(shù)據(jù)不能只是被動的視覺呈現(xiàn),還必須包含“動作-反饋”閉環(huán)的完整因果鏈條。
但問題在于,當前行業(yè)能夠穩(wěn)定獲取的物理世界交互數(shù)據(jù),遠遠無法滿足訓練需求。
因為傳統(tǒng)的數(shù)據(jù)供給方式主要有三種,且各有局限:
- 其一,是從互聯(lián)網(wǎng)上爬取公開圖片和視頻,這些數(shù)據(jù)大多是靜態(tài)的、缺乏交互信息;
- 其二,是在實驗室或仿真環(huán)境中人工搭建場景,成本相對高、規(guī)模較小;
- 其三,是眾包采集,不過數(shù)據(jù)的質(zhì)量和一致性有時難以保證。
短期內(nèi),三種方式都難以持續(xù)、大規(guī)模地產(chǎn)出帶有因果邏輯的交互數(shù)據(jù)。
這正是當前行業(yè)面臨的核心瓶頸。高質(zhì)量、高保真、帶交互標簽的物理世界數(shù)據(jù)極度匱乏,需求與供給之間存在巨大缺口。
在這種背景下,出行賽道恰恰具備生產(chǎn)、積累這類高價值數(shù)據(jù)的天然優(yōu)勢。
與傳統(tǒng)的數(shù)據(jù)供給方式不同,出行平臺的數(shù)據(jù)采集邏輯是嵌入真實運營。
每一輛數(shù)據(jù)采集車,本質(zhì)上都是一個移動的感知終端,在完成日常出行服務的同時,同步記錄“駕駛員決策—車輛響應—環(huán)境反饋”的完整交互鏈條。
![]()
這種閉環(huán)數(shù)據(jù)天然具備多模態(tài)對齊、時序連續(xù)和因果邏輯的特征。
用如祺對外展示的泊車場景舉例:
如祺數(shù)據(jù)不僅會記錄3D障礙物的位置信息,還會同步采集汽車底盤的CAN信號(反映車輛狀態(tài),如方向盤轉(zhuǎn)角、油門剎車)、毫米波雷達回波、激光點云與攝像頭視頻。
這些多模態(tài)數(shù)據(jù)圍繞泊車場景,形成了“行為(駕駛員操作)-狀態(tài)(車輛響應)-環(huán)境(周圍反饋)”的聯(lián)合數(shù)據(jù)集。
在訓練AI時,這類數(shù)據(jù)不僅能告訴模型“是什么”,還能幫助模型理解“為什么”,比如為什么要避讓、如何判斷車位可用性等需要物理常識和因果推理的任務。
有長期關(guān)注AI大模型訓練的分析人士告訴量子位,這類具有完整推理、決策和反饋鏈條的數(shù)據(jù),就是訓練空間智能模型的“黃金數(shù)據(jù)礦”。
如祺數(shù)據(jù)也是基于這種獨特的數(shù)據(jù)源,得以系統(tǒng)性地構(gòu)建其全鏈條服務能力。
技術(shù)層面,如祺數(shù)據(jù)自研的OCC自動化標注算法,采用同源底圖與自動化算法,可減少90%人工標注時間,交付準確率超98%。
其合成數(shù)據(jù)模塊可一鍵生成雨、霧、雪、夜等長尾場景,彌補真實采集盲區(qū);多模態(tài)數(shù)據(jù)集則覆蓋圖像、文本、音頻與視頻,可以直接支持大模型的垂類微調(diào)。
![]()
這套能力的本質(zhì),是將其在自動駕駛領(lǐng)域驗證過的數(shù)據(jù)工程化經(jīng)驗——從合規(guī)采集、規(guī)模化清洗、精準標注到合成增強——打包成標準化產(chǎn)品。
客戶可以“開箱即用”,無需從零搭建底層采集與處理能力,就能直接獲取經(jīng)過深度加工的標準化數(shù)據(jù)集與工具鏈。
在這一點上,如祺數(shù)據(jù)和Scale AI的邏輯有點類似:
不僅提供數(shù)據(jù),還提供讓客戶“更懂數(shù)據(jù)、更高效用數(shù)據(jù)”的工具與方法論,從而降低高質(zhì)量物理數(shù)據(jù)的使用門檻,提升客戶的模型迭代效率。
這在一定程度上降低了真實物理數(shù)據(jù)的使用門檻,也讓數(shù)據(jù)能力的適用范圍,能從自動駕駛擴展到具身智能、大模型、消費電子、醫(yī)療等多個領(lǐng)域。
![]()
也可以說,規(guī)模和能力只是基礎(chǔ),而出行平臺真正的想象空間,更在于它以場景為原點、向更多物理世界場景泛化的潛力。
這也是AI發(fā)展歷程中一再被證明的結(jié)論:得“場景”者,得天下。
得“場景”者,得天下
走進物理世界后,AI行業(yè)的底層邏輯正在變化——AI的競爭正在從算法轉(zhuǎn)向場景。
正如移動互聯(lián)網(wǎng)催生了基于位置的服務(LBS)數(shù)據(jù)金礦,云計算成為了數(shù)字經(jīng)濟的通用基建。
在AI邁向“空間智能”的當下,那些能持續(xù)、低成本產(chǎn)出真實物理世界交互數(shù)據(jù)的「場景」,也正成為新時代最核心的基礎(chǔ)設施。
在這一背景下,越來越多人開始意識到:場景可能比算法更稀缺。
因為算法可以被復現(xiàn),但一個真實、高頻、且能產(chǎn)生閉環(huán)交互數(shù)據(jù)的物理場景,卻極難被復制或搬運。
而數(shù)據(jù)本質(zhì)上其實是場景的“溢出”,擁有場景,就擁有了持續(xù)產(chǎn)生數(shù)據(jù)飛輪的可能性。
出行平臺,就是這樣一個幾乎堪稱完美的“元場景”:它覆蓋了海量的公共道路空間,涉及持續(xù)的人機共駕決策,每天發(fā)生數(shù)以億計的交互事件。
這些要素疊加在一起,構(gòu)成了一個天然的數(shù)據(jù)生產(chǎn)系統(tǒng)。
![]()
并且出行平臺采用的“業(yè)務即采集”模式,還在成本上天然具備明顯優(yōu)勢。
傳統(tǒng)的專業(yè)數(shù)據(jù)采集,需要投入專門的采集車、專門的駕駛員、專門的場地,成本高昂,規(guī)模化難上加難。
但像如祺出行的采集車,本身就是網(wǎng)約車,在提供服務的同時完成數(shù)據(jù)采集,邊際成本被大幅攤薄。
更重要的是,這種數(shù)據(jù)能力,還可以從駕駛場景向更廣泛的物理世界延伸。
據(jù)接近如祺出行的人士透露,該公司正嘗試將“人-車-環(huán)境”的交互數(shù)據(jù)能力泛化至更多應用領(lǐng)域,例如具身智能在車后服務場景,包括洗車、換電、維保、清理等。
車后服務場景作為出行場景的一部分,是如祺出行最擅長、數(shù)據(jù)積累最深的領(lǐng)域,如祺可以自然地切入,形成真實服務閉環(huán)。
而在這些場景中,機器人需要理解的避障、路徑規(guī)劃、精細操作等底層邏輯,和自動駕駛有高度的數(shù)據(jù)同構(gòu)性。
這種“低成本、高交互”的數(shù)據(jù)生產(chǎn)模式,一旦在一個垂直場景跑通,就具備了成為行業(yè)標配的潛力。
一個更長期的趨勢是,未來,那些擁有深厚物理場景運營經(jīng)驗的企業(yè),其核心資產(chǎn)可能不僅是服務本身,更是其業(yè)務過程中持續(xù)產(chǎn)生的、高價值的場景數(shù)據(jù)。
這些數(shù)據(jù)經(jīng)過系統(tǒng)性的治理與產(chǎn)品化,或許可以反哺乃至重塑AI產(chǎn)業(yè)。
就像出行平臺這樣的巨型物理世界接口一樣,在C端,平臺仍是運人的服務商;而在B端,出行平臺的身份,已經(jīng)進化成為AI理解并進入真實世界的、至關(guān)重要的物理數(shù)據(jù)入口。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.