![]()
索塔無界將在今年夏天展示完整大腦能力,包括世界模型、多模態 VLA 以及 Physica-Claw 機器人操作系統,并在實驗室跑通早期商業場景全流程。
作者|Li Yuan
編輯|靖宇
5 月 14 日,極客公園獲悉,開普勒機器人前 CEO 胡德波已開啟具身智能賽道的第二次創業,新公司名為「索塔無界」。
這一次,他選擇了一條和開普勒不同的路。
2023 年,人形機器人賽道剛剛升溫時,胡德波聯合創辦開普勒機器人,切入全棧雙足人形機器人、底盤雙臂和工業場景。兩年后,開普勒已成為國內工業場景人形機器人代表公司之一,并在今年 4 月完成億元級 A++ 輪融資。
但胡德波的新項目沒有繼續押注整機全棧,也沒有選擇工業落地場景。索塔無界更關注具身智能「大腦」本身:以世界動作模型、多模態 VLA 和數據采集體系為核心,試圖解決機器人真正進入物理世界時最難的一環——不是「看見」世界,而是理解接觸、動作、空間和物理變化。
在商業化路徑上,索塔無界也選擇了一條更「非典型」的路線:從歐美商超后臺的分揀切入,向門店補貨、貨架整理、電商揀貨等商業場景延展,并以全球客戶、數據閉環和中國硬件供應鏈協同作為早期壁壘。
在胡德波看來,海外市場對機器人勞動力替代的需求更迫切,但真正能完成交付的方案并不多;而從中國供應鏈出發,打通海外客戶、部署、運維與數據合規鏈條,本身就是一道不低的門檻。
01
世界動作模型路線,
先期使用 Agent 模式
在胡德波看來,當前具身智能的瓶頸,并不是機器人完全不能干活,而是底層范式還沒有收斂。
文本和圖像本質上是離散信息,而機器人面對的是連續、非線性的物理空間:瓶子會滾動、柔性物體會變形,抓取會產生接觸力,動作和環境之間還存在實時反饋。機器人不僅要識別「這是什么」,還要判斷「我應該從哪里抓、用多大力、繞過什么障礙、下一步會發生什么」。
這也是許多現有技術路線在真實場景中遇到的問題。VLA、多模態 VLA 已經能夠完成一部分抓取和操作任務,但它更接近于從大量示范中習得動作模式。當場景里的物體姿態、遮擋關系、接觸狀態發生變化時,模型需要的不只是「模仿過去怎么做」,而是真正理解空間關系、物理規律和動作后果。
因此,索塔無界將核心投入放在世界動作模型上。
![]()
模型思考|圖片來源:索塔無界
按照胡德波的判斷,世界模型的價值在于,它不只是讓機器人「看見」物理世界,而是讓機器人在內部形成對物理世界的預測能力:一個物體被推之后會怎么動,柔性物體受力后會怎樣變形,不同動作會導致什么結果。進一步到世界動作模型,則是把這種對世界的理解和動作生成結合起來,讓機器人能夠基于物理狀態直接規劃和輸出動作。
索塔無界希望建立的是一個以統一潛空間世界動作模型為核心的物理智能大腦。它不僅使用視覺、語言和動作數據,也會納入 Ego 視頻、觸覺、末端執行器狀態、接觸過程和任務邏輯等多模態信息。換句話說,模型從訓練底座開始,就不是單純學習「被觀看的世界」,而是學習「一個身體如何在世界中行動」。
![]()
模型思考|圖片來源:索塔無界
不過,在世界動作模型真正成熟之前,索塔無界不會把所有能力都押在一個端到端模型上。它現階段采用的是一套 agentic AI 架構,內部稱為 Physica-Claw。
這套架構更像一個機器人操作系統:上層負責用戶交互、任務理解、調度和編排,下層接入不同 skills。對于規則明確、環境穩定的任務,可以調用傳統運動控制、路徑規劃、抓取放置等模塊;對于需要識別、判斷和泛化的環節,可以調用多模態 VLA;對于需要空間推理、物理預測和復雜操作的任務,則交給世界模型或世界動作模型。
這種架構的好處是,它能讓機器人先「干起來」。真實商業場景不可能等到一個完美的端到端大模型出現后才部署。
胡德波認為,agent 架構只是現階段解決方案的一部分,不是最終形態。長期看,如果世界動作模型足夠強,原本分散在 VLM、VLA、任務拆解、傳統規控和多個 skill 中的能力,會逐漸被模型內化。那時,機器人大腦的架構反而會變得更簡單,也更容易 scale。因為模塊越多,串聯越復雜,系統越難通過數據和算力持續提升;而真正能 scale 的智能,往往來自更統一、更簡潔的模型結構。
要走到這一步,數據是另一個繞不過去的瓶頸。
現在具身智能行業普遍缺少高質量物理交互數據。互聯網視頻可以提供豐富的視覺信息,但它無法完整記錄動作、力、接觸和身體狀態;傳統機器人遙操作數據更接近任務本身,但成本高、效率低,很難大規模擴展。胡德波并不看好單純依靠全真機遙操作采集數據的路線,因為這種方式成本太高、采集效率太低,很難成為真正可規模化的數據范式。
因此,索塔無界會自己做數據采集設備,包括頭戴式 Ego 視覺采集設備和全模態 UMI 手持式采集設備,希望采集的不只是視覺和動作,還包括觸覺、接觸狀態、末端執行器姿態等全模態信息。
在胡德波的設想中,索塔無界的數據來源會分成幾層:第一層是 Ego 視頻、公開數據集和視頻數據,解決數據規模,用于內化廣泛的世界知識與操作多樣性;第二層是全模態 UMI 采集,用于盡可能低成本地擴充物理交互數據,解決具身對齊;第三層是機器人進入真實商業場景后的部署數據,用于后訓練、強化學習和場景成功率提升。
02
把中國供應鏈帶到海外場景里
如果說索塔無界在技術上押注的是具身智能大腦,那么在商業化上,它押注的則是另一種「全棧」能力:不是從電機、關節模組到底盤、本體全部自研,而是圍繞真實場景,把大腦、操作系統、末端執行器、數據采集、硬件集成、海外交付和運維體系串起來。
這也是胡德波這次創業最大的特色之一。
當前,機器人硬件供應鏈已經發生了變化。關節、底盤、電池、控制板、結構件等零部件越來越成熟,中國供應鏈的響應速度、成本和工程能力也足以支撐更多場景化機器人方案。
因此,索塔無界沒有選擇重新做一個完整人形機器人本體,而是采用更開放的生態合作模式:與核心零部件供應鏈伙伴開放合作,根據不同場景做本體集成和定制。胡德波認為,這樣不僅能降低研發成本和周期,也能讓公司在不同場景里更靈活地選擇最合適的硬件組合。
但這并不意味著索塔無界只做軟件。
在胡德波看來,具身智能里的軟硬一體仍然重要,只是軟硬一體的重點已經發生變化。
因此,索塔無界在硬件側最重視的,并不是從零自研整機,而是末端執行器和數據采集設備。
索塔無界考慮先從三指末端執行器切入。相比傳統兩指夾爪,三指能覆蓋更多抓取姿態,在穩定性和操作復雜度之間取得平衡;相比五指靈巧手,它又更容易工程化、控制難度更低、成本和可靠性更適合早期商業落地。對索塔無界來說,三指不是一個單獨的硬件選擇,而是為了讓數據采集、模型訓練和真實執行盡量對齊。
這也是公司自研全模態 UMI 手持式數據采集設備的原因。它希望采集的不只是視覺軌跡,還包括末端執行器狀態、觸覺、接觸過程、動作約束等信息。只有當采集設備、末端執行器和未來部署形態盡量一致,數據才更可能轉化為模型能力,而不是在映射過程中損耗。
![]()
數據思考|圖片來源:索塔無界
在機器人形態上,索塔無界早期仍會采用更務實的底盤雙臂方案,服務于快速落地。
目前,索塔無界已經與歐美商業巨頭、制造和物流集團等達成合作意向。其中,進展最快的是歐洲商超場景。公司已經與歐洲頭部商超集團簽署長期框架協議,第一階段將從POC開始;若測試通過,對方給出的訂單預測近千臺。
胡德波判斷,海外市場的機器人勞動力缺口更大,但可選方案并不多。尤其是在歐美商超、物流、制造等場景中,很多崗位人工成本高、重復性強、招工困難,卻又尚未被傳統自動化充分覆蓋。對機器人公司來說,這類場景既有明確需求,也更容易算清 ROI。
03
胡德波的二次創業,仍然關注全球化
索塔無界之所以從一開始就把海外商業場景作為主戰場,也和胡德波本人的經歷有關。
胡德波是一位 70 后創業者,也是一位在全球市場里打過多年硬仗的「老兵」。1999 年,他加入中興通信進入通信行業,2001 年開始負責歐洲、俄羅斯、亞太等海外業務。2006 年,他成為華為海外國家代表,深度參與華為歐洲高端市場拓展。
這段經歷讓他很早意識到,中國科技公司真正的全球化,不只是把產品賣到海外,而是要進入當地客戶體系,建立銷售、交付、服務、合規和長期信任關系。
2015 年,胡德波預判「機器人 + AI」會成為未來數十年的重要技術浪潮,轉身進入無人機與水下機器人創業。其間,他曾聯手華為海思打造視覺 AI 無人機,產品進入數十個國家,也進一步積累了機器人硬件、AI 能力和全球化渠道經驗。
2023 年,人形機器人賽道剛剛升溫時,胡德波聯合創辦開普勒機器人,切入雙足人形、底盤雙臂和工業場景。此后,開普勒逐漸成長為國內工業場景人形機器人代表公司之一,并在今年 4 月完成億元級 A++ 輪融資。
![]()
胡德波與納德拉交流|圖片來源:索塔無界
這一次,胡德波想做的是通過索塔無界把物理原生智能體帶入全球各個角落。
在他看來,具身智能真正走向商業化時,中國公司的優勢不只在算法,也不只在單一本體,而在于能否把成熟硬件供應鏈、物理智能大腦、海外真實需求和長期交付體系連接起來。國內機器人硬件供應鏈足夠強,但多數硬件公司并不具備直接進入海外客戶體系的能力;而海外客戶有明確的勞動力替代需求,卻缺少真正成熟、可交付、可維護的方案。
![]()
商超場景|圖片來源:索塔無界
索塔無界想扮演的,正是中間的連接者:一端連接中國機器人供應鏈和具身智能技術,一端連接歐美商超、物流、制造等真實商業場景。它不只是把機器人賣到海外,而是試圖圍繞客戶需求重構方案、完成部署、建立數據閉環,并在合規框架下長期迭代。
這也是胡德波所說的「全球生態」能力。對于一家具身智能公司而言,出海并不只是銷售問題,而是系統能力問題:客戶在哪里、場景如何定義、硬件如何適配、運維如何覆蓋、數據如何回流、隱私和合規如何處理,每一環都會影響機器人能否真正規模化落地。
從這個角度看,索塔無界與其他同行并不是競爭關系。胡德波把物理智能 AGI 比作一座珠峰:不同公司可能從不同山坡攀登,目標相同,但路徑并不一樣。
按計劃,索塔無界將在今年夏天展示完整大腦能力,包括世界模型、多模態 VLA 以及 Physica-Claw 機器人操作系統,并在實驗室跑通早期商業場景全流程;年底前,公司計劃前往歐洲客戶現場進行POC測試,重點不只是驗證單個場景能否跑通,也包括打通真實部署后的數據、交付和合規閉環。
*頭圖來源:索塔無界
本文為極客公園原創文章,轉載請聯系極客君微信 geekparkGO
現在市面上的 AI 工具,都在解決同一件事:讓你干活更快。但沒有人問下一個問題:你干得這么快,然后呢?
今晚 20:00,極客公園視頻號直播間,極客公園創始人 & 總裁張鵬對話三位創業者:OpenHex 創始人、前Meta/WhatsApp 核心特級架構師的董舒、Naughty Labs CEO 楊天潤、Delta X 迭代未來 聯合創始人劉暢,一起聊聊:AI 時代,如何讓你的能力真正變現、越來越值錢?
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.