![]()
新眸原創·作者 | 鹿堯
如果說2025年是人形機器人的“登臺之年”,2026年則正在成為檢驗成色的“卸妝之年”。
3月,Figure AI宣布與OpenAI分道揚鑣,全自研端側模型;4月,特斯拉Optimus在得州工廠的料箱搬運視頻再次刷屏,馬斯克喊出年內交付千臺;國內,宇樹G1以9.9萬元售價繼續拉低整機門檻,銀河通用、星動紀元等接連拿下新融資。
一片喧囂中,一個很關鍵的問題卻被反復繞開:這些越來越會走、越來越能秀的機器人,究竟用誰的數據在訓練?
前段時間,國家發改委在新聞發布會上明確提出加快具身智能訓練基礎設施建設,支撐數據采集和“大小腦”模型訓練——政策信號已經發出,但產業層面的答案似乎仍然稀缺。
目前市面上95%的所謂真機訓練數據,不過是不同顏色的短袖T恤疊衣視頻。真正來自復雜物理世界的有效交互數據,占比微乎其微。而單條高質量遙操作采集數據的成本,按一年使用周期折算,仍高達3-5元。這還沒算上后期清洗、標注、對齊的人力投入。
這就形成了一個很尷尬的局面:數據太貴所以采不起,采不起所以模型笨,模型笨所以沒人用,沒人用所以更沒數據,也更難發展。先有雞還是先有蛋,吵不出答案。
去年2月成立于清華園的靈御智能,做的事說起來不復雜:同時從“雞”和“蛋”兩端下手,把這個死結剪開。他們并沒有做了一個更聰明的機器人,而是在“身體”和“大腦”之間重新做了一次分工。
別看這家公司年輕,才一年時間就交付接近百臺機器人,意向訂單超千臺,單任務采集成本壓到0.6元,端到端延遲控制到90毫秒以內——今天我們來聊聊,他們是怎么做到的。
01
10萬-20萬的“數據母機”
先解決“用得起”的問題
先看一組數據。
據行業統計,目前全行業匯聚的高質量具身數據僅約50萬小時,不足大語言模型訓練數據的數萬分之一。不少從業者判斷,訓練一個具備通用泛化能力的具身模型,至少需要千萬小時級的數據支撐。
四個字可以概括當下狀況:物理數據饑荒。受限于物理操作的固定耗時,真機數據的獲取往往精度低、效率低、成本高。
很多人習慣用“喂數據就能解決問題”的邏輯套用具身智能,但這是個誤區。具身智能需要在三維空間中進行強交互,比如判斷什么材質、怎么發力,數據維度是指數級躍升,靠簡單堆疊真機數量就很難解決。
用圖靈獎得主Yann LeCun團隊的話來說,具身智能向世界模型升級的關鍵瓶頸正是“缺少能真正理解物理規律的規模化交互數據”。
而面對數據荒,靈御智能的打法是先解決“采集”。他們的主力產品叫TeleAvatar,一臺沒有雙足、沒有靈巧手、沒有脖子的輪式雙臂機器人。在第二屆中關村具身智能機器人應用大賽的遙操作賽道中,它以30秒的實際作業時間,把第二名甩出近5分鐘。
副總裁李旭曾在受訪時直言,選擇輪式底盤加夾爪而非雙足加靈巧手,是刻意的減法:“雙足機器人會把45%以上的能耗和50%以上的算力浪費在走路平衡上,靈巧手成本是夾爪的10到100倍——但對數據采集來說,這兩項功能其實沒有產生相應的邊際收益。”
這種“場景定義硬件”的思路,直接拉通了成本結構。
諧波減速器被行星減速器替代,六維力傳感器被電流估算加500Hz控制頻率的閉環算法替代,齒輪背隙用廉價傳感器加軟件補償。這使得一臺TA機器人的售價落在10萬至20萬元區間,僅為同類產品均價的1/3到1/2。
售價下探帶來的,是數據采集經濟模型的重寫。靈御給出的算賬口徑是:單臺機器人年化總成本控制在30萬元以內,折合每小時成本100-150元,單任務數據成本約0.6元。
這樣一來,與行業同等品質采集設備的3-5元相比,一個年需百萬條數據的中型項目,僅賬面成本差額就可能達到數百萬元。
不過我們也知道,對于任何技術創新來說,“便宜”不是故事的核心,“好用”才是。
靈御的聯合創始人兼首席科學家莫一林,這位師從美國工程院院士Richard M. Murray的清華副教授,深耕自動駕駛感知項目,對多傳感器時間同步的致命性有切身體會。
在他看來,降低成本只是結果,真正構成壁壘的是數據質量——多傳感器的時間同步、毫米級的空間精度,這些決定了采集到的數據到底能不能訓練出好模型,否則就和普通第一視角視頻沒什么本質區別。
基于這一理解,TA機器人的定位是做行業最高質量的本體:在硬件底層實現了S100、x86主控、激光雷達、6路相機等全套傳感器的亞微秒級時鐘同步,相機觸發達到納秒級對齊,從曝光到數據入內存的整體延遲可壓至40ms。機械臂重復定位精度做到0.1mm,絕對定位精度控制在1mm。
![]()
你可能不太理解這些復雜數據的意味,簡單來說,這臺機器所有傳感器的時間是同步到微秒級別的,不存在“眼睛看到了、手還沒感覺到”這種脫節。數據記錄的速度極快,基本是實時入賬,不拖后腿。
而且它干活非常穩,無論是一臺機器反復干,還是換臺機器接著干,精準度都足夠高。這幾個能力加在一起,才能保證產出的數據真正“拿來就能訓”,不是那種還得人后期費勁對齊的毛坯數據。
但到這里,問題只解決了一半。有了便宜好用的“數據生產設備”,下一步是:這些數據怎么變成模型能力?怎么回流到物理世界?
02
具身智能的“Model 3時刻”
或許不在端側
2026年的具身智能賽道,端側自主幾乎是默認選項。從Figure自研Helix,到國內廠商爭相將大算力芯片集成進本體,主流敘事很明確:讓機器人越來越不依賴外部。
靈御把這個邏輯反了過來。端側只保留一個低功耗芯片,負責急停、避碰等本地安全控制;真正負責認知、推理、學習、進化的“大腦”,全部上云。
換句話說,把“大腦”塞進云端,再解決“用得好”的問題。
創始人兼CEO金戈在內部交流中多次談到,這個選擇基于三個繞不過去的物理硬約束:
第一,功耗。主流機器人電池容量普遍只有半度電,而汽車動輒十幾度甚至上百度,端側算力堆不上去。第二,算力天花板。大語言模型的智能涌現證明,只有云端級別的算力密度,才能支撐復雜的推理和規劃。第三,網絡環境。機器人的工作場景相對固定,網絡基本可控,不像自動駕駛必須在毫秒級內完成本地決策。
可以想像一下,讓每個機器人都背一個超級大腦,就像讓每個家用電器里都塞進一整套超算——違背工程規律。
但靈御的這套邏輯要成立,有一個前提:通訊不能掉鏈子。否則“云端大腦”就是空中樓閣。
靈御在通訊層做了大量“摳時間”的工程優化。他們把端到端鏈路拆成20個環節,在示波器上逐環節精確測量耗時。目前,城內公網傳輸延遲壓至4毫秒左右,千公里跨城傳輸增加約10毫秒,端到端整體控制在90毫秒以內。
低延遲通訊把路鋪好之后,云端大腦的真正價值才釋放出來——“一身多腦”。
同一臺TA機器人,可以根據任務類型按需調用云端不同的專家模型池。你不需要一個什么都會但什么都不精的“通才模型”,而是讓專業模型各司其職。每一次作業產生的數據,又會自動回流到對應模型的訓練管道里。
今年4月,靈御與英特爾合作完成了一次關鍵驗證:在真實任務中采集數據,訓練云端模型,再通過云端模型操控機器人執行物理任務。這個閉環雛形,在杭州西子智慧產業園的現場交流中首次對外展示。
除此以外,京東的七鮮超市已與靈御展開合作,將部分遞送、理貨任務交由遠端操作員完成,積累特定品類的抓取數據。
![]()
到這里,那條邏輯線就清楚了:“身體”(TA機器人)負責低成本、高精度地生產高質量數據;“大腦”(云端架構)負責把這些數據實時轉化為模型能力,再反哺回物理世界。
兩者合在一起,把“采數據—訓模型—用模型”這個鏈條,從脫節的斷頭路變成了閉環的高速路。
03
當機器人變成跨區勞力的“數字替身”
有了這套“身體+大腦”的基礎設施,一個更具商業想象力的故事開始自然生長出來。
靈御內部觀察到,早期客戶正自發地將數據采集母機投入實際運營場景。典型模式是:高人力成本地區部署靈御機器人,由低人力成本城市的遠程操作團隊接管日常作業。一臺十余萬元的設備,幾個月就通過人力成本差回本。
這本質上是“機器人即服務(RaaS)+操作即服務(MaaS)”的雛形。更關鍵的是,在這個過程中,每一次人工操作都在產生高質量訓練數據。機器在干活的同時就在產數據,產數據的同時就在進化模型,進化完的模型又讓機器更能獨立干活。
金戈曾在采訪中闡述過靈御的遠期定位:長期看,客戶不需要買機器人,而是按需調用機器人的作業能力,按任務付費。云端智能是訂閱服務,長期來看會是模型能力+人能力的混合形態。這意味著,一家北京商超的理貨需求,可以由成都的操作員在云端完成。
![]()
按規劃,2026年Q3靈御將推出開發者公測版平臺,2027年上線商業化正式版,涵蓋多源異構數據管理、AI輔助標注、主流算法架構內置訓練、一鍵云端推理等功能。目前平臺MVP核心能力已完成,支持ROS2生態一鍵部署。
團隊將2026年設為從“產品公司”到“基礎設施服務商”的轉折年,目標錨定三個硬指標:全年交付800臺機器人、在1-2個真實場景中跑通正向ROI的閉環、為行業提供至少百萬小時的高質量真機數據集。
這三件事互為前提,畢竟部署量上去才有場景數據,場景驗證跑通才有商業價值,數據飛輪轉起來才談得上網絡效應。
回顧2026年上半年的行業格局,人形機器人賽道正在經歷一輪快速分化:一類企業繼續沿著端側全自主的技術路徑攀登通用智能的高峰;另一類則選擇從垂直場景的數據閉環切入,先讓機器人干好活、產生數據、優化模型,再談更大范圍的泛化。
靈御智能屬于后者。它的邏輯與特斯拉當年用Model S切入豪華市場、以Model 3實現規模化數據采集的路徑有相似之處——只不過特斯拉采集的是路況數據,靈御采集的是物理交互數據。
當政策層面開始明確推動訓練基礎設施建設和“大小腦”模型訓練時,這條路徑的政策確定性也在增加:加快訓練基礎設施建設,讓機器人“進工廠、進商場、進家庭”。具身智能的“Model 3時刻”,就在那些已經開始干活、回傳訓練、迭代進化的商業閉環之中。
![]()
莫一林曾在采訪中做過一個類比:“AlphaGo初期學人類棋譜,達到一定水平后,再學人類棋譜反而會拉低棋力。只有通過自我對弈才能突破。具身智能的低質數據,總有一天會成為負向資產。”
這話既是對行業的提醒,也是靈御鎖定高質量真機數據的注腳。
出身清華、師從機器人操作領域開山級學者Richard M. Murray,莫一林比大多數創業者更早意識到,算法不能脫離硬件獨立存在。眼下在他看來,具身智能最稀缺的,不是更華麗的算法架構和關節設計,而是一條低成本、高效率、高質量連接物理世界與數字世界的輸送帶。
靈御要做的,就是成為這條輸送帶的基建商。
當行業仍在爭論“雙足還是輪式”“端側還是云端”“全自主還是遙控”,具身智能行業還沒有誰能拿出一個放之四海而皆準的答案。但靈御智能選擇的技術路徑,驗證了“高質量本體 + 低延遲通訊 + 數據飛輪”的可行性。
據了解,靈御智能的天使輪融資已于今年完成,華映資本、國海創新資本等多家機構入局。目前已完成多輪融資,累計近億元,并在CES 2026斬獲海外首單。
在資本愈發謹慎的當下,市場愈發認可數據基礎設施的長期價值,而能連續拿錢且交付規模穩步爬坡的團隊,本身就是對其能力的一種印證。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.