![]()
機器之心編輯部
2026 年,真要成為具身智能的分水嶺了。
過去兩年,大家總會被機器人在舞臺上的表演驚艷,看著機器人跑得更快、跳得更高、動作更流暢。這是行業最容易被看見的部分,它們證明了本體工程和運動控制的進步。
不過,從產業角度來看,真正決定機器人上限乃至具身智能上限的,并不在這些舞臺表演上。
6 月 16 日,星海圖在亦莊舉行全球開發者大會。會上,星海圖公布了模型、本體和數據三條戰線的進展:G0.5 大模型穩居全球第一梯隊,自研雙足人形機器人 Kengo 亮相,「百萬小時真實數據計劃」正式啟動。至此,星海圖成為中國唯一同時擁有頂尖模型與頂尖本體的具身智能企業
![]()
這場半個具身智能產業鏈悉數到場的大會,也傳遞了一個信號,具身智能的競爭,正從單臺產品的比拼,轉向數據與生態的較量。
具身智能頭部玩家
正在劃分生態版圖
國內具身智能行業正在出現越來越清晰的分層,不同企業基于自身能力的積累,選擇了不同的發展路徑。
比如,宇樹科技的優勢,更多體現在本體硬件、運動控制和量產交付上。其四足與人形機器人產品長期以高動態運動性能、成本控制和工程交付能力被行業關注。它代表的是一條相對典型的硬件工程路線,即先把機器人的身體做得足夠穩定、靈活、可靠,再通過量產能力打開市場。
智元則更強調全鏈路垂直整合,打法更接近「軟硬件一體化具身智能平臺」。這條路線的特點是控制力強,適合在明確場景中推動規模化落地。
星海圖走的是第三條路。硬件、數據,在它這里都不是終點,而是同一件事的不同入口,所有努力最終都指向一個問題:機器人如何在真實世界里真正創造生產力
![]()
換句話說,星海圖做整機,是為了獲得真實場景中的數據入口、執行反饋和模型閉環。沒有整機,具身智能就缺少持續采集物理世界數據的載體,沒有真實世界里的任務反饋,模型也很難完成有效迭代。
從這個角度看,星海圖的打法可以概括為「數據 - 模型 - 整機」的飛輪。整機進入場景,帶回真實數據;真實數據訓練模型,提升任務泛化能力;模型能力再反向定義下一代本體、模組和場景部署方式。
星海圖也沒有把自己鎖定在單一本體形態上。它早期就提出「一腦多形」的判斷。人形只是具身智能的一種載體,未來真正有價值的是一套可遷移、可復用、可接入多種硬件形態的智能系統。
這也解釋了為什么星海圖反復強調「生態」。具身智能行業過去更多是在做「專用工具」,針對一個場景、流程或動作去設計機器人,能力邊界清楚,復制到新場景時成本很高。星海圖希望做的,是更接近「通用智能體」的底層能力,也就是同一套大腦可以適配輪式雙臂、雙足人形、靈巧手等不同本體,也可以進入工業、商業、科研等不同場景。
這并不意味著專用機器人沒有價值。相反,專用機器人往往是具身智能最早落地的入口。但如果行業長期停留在專用工具階段,每家公司都會在各自場景里重復造輪子,數據無法流動,模型難以泛化,生態也很難形成。星海圖想解決的,正是從「單點可用」到「能力復用」的問題。
三重躍遷曲線
大會上,星海圖 CEO 高繼揚提出具身智能發展的「三重躍遷曲線」:本能智能、作業智能和進化智能。
本能智能解決的是機器人如何駕馭自己的身體,包括平衡、協調、運動控制和復雜地形適應。它類似動物的本能,也是機器人進入真實世界的基礎。沒有這一層能力,機器人很難穩定執行任務,更談不上生產力。
作業智能更接近產業真正需要的能力。機器人不僅要能動,還要能理解任務、拆解流程、完成有序作業。在這一階段,語言會成為非常重要的接口。因為真實世界中的生產任務,往往是一連串有上下文、有目標、有約束的流程。人類需要用語言調度機器人,機器人也需要把語言轉化為可執行的動作序列。
進化智能則是更長期的判斷。過去是人類根據經驗設計機器人的形態、關節、傳感器和任務流程;未來,AI 可能會反過來參與定義機器人應該長什么樣、該采集什么數據、該進入哪些場景、該如何形成下一輪能力迭代。具身智能的終局,可能不只是讓機器人模仿人類動作,還包括讓 AI 參與重構機器人的設計和生產方式。
星海圖認為,具身智能不存在所謂的「GPT 時刻」。大語言模型的突破發生在一個普通用戶可以直接感知的界面里,每個人打開網頁或手機,就能看到模型能力變化。但具身智能的進展不會如此集中,也很難由一次產品發布完成定義。它更可能從 B 端開始,在倉儲、零售、工業、服務、科研等場景中逐步滲透。某個場景先跑通,某類任務先穩定,再逐步擴展到更多任務。幾年后回頭看,機器人可能已經進入大量生產環節,但很難說清是哪一天突然發生了質變。
在這個判斷下,星海圖構建了一系列支撐「作業智能」落地的硬核技術,包括 G0.5、Fast-WAM、Kengo、R1 系列、靈巧手等等,從軟件到硬件。
新一代 VLA 基礎模型 G0.5是這套體系的大腦。該模型采用統一自回歸 VLA 架構,具備「邊思考邊行動」的原生動作思維能力,并沉淀了抓取、放置、推拉等可遷移基礎動作單元。
![]()
評測顯示,G0.5 刷新了全球 7 大權威榜單,穩居全球第一梯隊,也是國內第一。
Fast-WAM 世界模型則指向動作響應效率。對于機器人來說,慢半拍就可能導致任務失敗。Fast-WAM 單步推理延遲為 190 毫秒,配合 G0.5 讓機器人動作響應提速 4 倍以上。
此外,星海圖自研的雙足人形機器人 Kengo,不僅外形科技感十足,更具備強悍的運動爆發力(單關節扭矩超 130N?m),能勝任四連踢、遞物、疊衣等復雜場景動作。
雙足形態的價值,在于它可以進入更多現有環境,減少場景改造成本。對一家以「具身大腦」為核心的公司來說,擁有自研雙足本體,也意味著它可以在更復雜的任務中驗證模型能力。
Kengo 的發布,星海圖補齊了面向全身作業的最后一塊拼圖,成為中國唯一一家同時擁有「頂尖模型 + 頂尖本體」的具身智能企業,「整機+智能」的戰略正式閉環。
真實數據,具身智能的長期壁壘
模型與本體之外,數據是制約具身智能發展的另一個核心變量,而且在很多從業者看來,它的重要性不亞于前兩者。
大語言模型之所以能夠出現能力躍遷,一個重要前提是互聯網已經積累了海量文本、圖像、代碼和視頻數據。而具身智能至今沒有自己的「互聯網」。物理世界每天都在發生大量交互,但這些交互很少被系統記錄成可訓練、可復用、可標注的數據。
沒有足夠規模、質量、多樣的真實世界數據,具身智能很難真正理解物理約束,也很難在新環境中穩定執行任務。仿真數據和合成數據可以提升效率,也能補充長尾場景,但真實世界的操作數據仍不可替代。
從行業進展看,過去兩年,具身智能賽道的數據積累量,基本停留在幾千小時到十幾萬小時區間。但今年開始,行業頭部企業普遍在向百萬小時量級數據推進,而未來兩三年,千萬小時或許將成為新的競爭基準
![]()
星海圖去年開源的GOD 數據集,是全球第一個開放場景具身操作數據集,下載量已突破 60 萬次,在開源社區中保持著較高的使用頻次。
在此基礎上,星海圖這次聯合北京亦莊共建「亦數智能」,并啟動了「100 萬小時超高質量真實數據計劃」,目標在 2026 年完成百萬小時數據積累,未來三年邁向千萬小時規模。
同時,配合由原力靈機、螞蟻數科、百度智能云等 15 家企業參與的「數據生態聯盟」,中國具身智能終于開始打造屬于自己的第一條完整數據供應鏈。
![]()
千萬小時量級的動作、視覺、力覺協同數據數據,有望打破 Corner Case 的魔咒,讓 AI 開始反向定義硬件,徹底把機器人從特定場景推向真正的通用化。
掌握了真實數據,就掌握了通向物理 AI 世界的話語權。在這個邏輯下,星海圖希望對行業的游戲規則進行一次底層重構。
重新定義商業終局
過去,外界看具身智能公司,最常用的標準是賣了多少臺機器人、跑進了多少場景、能否形成訂單。這些指標依然重要,因為它們決定了企業能否活下來。但從更長期的產業視角看,具身智能的商業模式可能會經歷一次深層變化。
星海圖提出,未來具身智能的商業模式會從「整機銷售」,走向「方案訂閱」,最終進入「Token 銷售」,這也是具身智能商業模式中,最具想象力的部分。
![]()
第一階段與智能解耦,只是單純賣鐵,而星海圖追求的是智能驅動的第二乃至第三階段的領先。
通過開放「大腦」與構筑「真實數據互聯網」,星海圖正在發展成為具身智能時代所有開發者都繞不開的基礎設施供應商。沒有任何一家公司能夠獨自定義這個時代,但當半個具身智能產業鏈今天都站在亦莊的會場里時,大幕已經拉開。
或許具身智能的確沒有 GPT 3.0 時刻,但我們能夠看到,它正在加速走向成熟。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.