文 | 高恒說
靈初智能最近接連發布模型、開源數據和融資消息,但這些動作真正指向的,不是又一家機器人公司站上風口,而是具身智能行業正在換一道題:機器人到底從哪里學會干活。
按照公司披露,靈初智能新一代具身智能模型Psi-R2在MolmoSpaces榜單中超過PI、DreamZero等模型,位列全球第一;同時發布Psi-W0,并開源1000小時高質量人類操作全模態數據集。隨后,公司宣布完成新一輪融資,投資方包括國投先導、京西瑞瓴。
靈初智能的野心也藏在這里。它押注的不是整機出貨,而是人類操作數據、靈巧手、世界模型和物流場景里的數據閉環。換句話說,它想搶的不是一臺機器人,而是機器人學會干活之前最稀缺的數據入口。但這條路能不能走通,最終不看榜單,也不看融資,而要看這些數據能不能進入模型、進入倉庫,并變成客戶愿意持續付費的生產力。
01:多輪融資背后,資本押的是數據入口
靈初智能被資本看見,首先是因為它踩中了具身智能最熱的融資窗口。但比“又一家機器人公司拿錢”更值得看的,是它把故事講到了一個更底層的問題上:機器人訓練數據從哪里來。
公開報道顯示,靈初智能已完成天使輪及Pre-A輪合計20億元融資。天使輪投資方包括國開金融、國中資本、央視融媒體產業投資基金、某千億上市公司旗下戰投、長飛光纖旗下基金等;Pre-A輪由上海國資徐匯資本等領投,部分地方國資及市場化基金跟投。4月12日,公司官方公眾號又宣布獲得國投先導、京西瑞瓴的新一輪投資。
這些融資動作要放在整個具身智能賽道里看。投中嘉川CVSource數據顯示,2025年具身智能融資規模達到329億元。另有媒體報道,據不完全統計,2026年至今,中國具身智能及機器人賽道已披露融資合計約200億元。短短幾個月,行業里多出七家新晉獨角獸,銀河通用、千尋智能、自變量機器人、智平方、星動紀元等公司,都在資本熱潮里被快速推高估值。
但錢多并不代表商業模式已經清楚。具身智能現在至少有三種下注路徑:有人押機器人本體,有人押“大腦”模型,也有人押更底層的數據入口。靈初智能更接近第三種。它不是一家典型的整機公司,按照公司和相關報道中的定位,它更像“小全棧”:不重資產押整機制造,而是把重心放在端到端VLA模型、靈巧操作、數據采集工具鏈和部分硬件設計上。
這條路線有現實基礎。大語言模型可以從互聯網上獲得大量文本,自動駕駛可以靠車隊路測積累數據,但機器人學會折紙盒、掃條碼、裝手機、抓衣服,不能只靠網頁和視頻。它必須在真實世界里理解物體、動作、觸覺、空間位置和作業節拍。具身智能行業已經不缺會展示的機器人,缺的是可以規模化訓練機器人的真實數據。
這也是靈初智能被資本押注的核心邏輯:它試圖先卡住機器人訓練所需要的數據入口,再通過模型和靈巧操作能力,把數據轉化為場景里的生產力。
但問題也在這里。數據采集看起來像機器人時代的“賣鏟子”生意,可它是不是長期生意,還沒有答案。等機器人真正大規模部署以后,數據可能從實際作業中自然回流。到那時,單純采數據未必有足夠壁壘。靈初智能必須證明,它不只是能采數據,還能把數據變成模型能力,再變成客戶愿意付費的生產力。
02:它為什么押人類操作數據
如果說多輪融資解釋了資本為什么看見靈初智能,那么Psi-R2、Psi-W0和近10萬小時人類操作數據,解釋的是它想怎么卡住這個數據入口。
按照公司披露,Psi-R2的預訓練同時使用真機數據和人類數據。其中,真機數據來自 Psi-MobiDex數據集,規模為5417小時;人類數據規模達到95472小時,覆蓋294種場景、4821種任務和1382種物體。與此同時,公司還開源了1000小時高質量人類操作全模態數據集。
這組數據的關鍵,不在人類操作數據“接近10萬小時”這個數字本身,而在它回答了一個行業難題:機器人訓練數據到底從哪里來?
過去,行業常用真機遙操作。人盯著屏幕控制機械臂,讓機器人一遍遍完成任務。這條路直接,但成本高、速度慢,還需要專業設備和場地。更關鍵的是,遙操作的節奏往往跟不上真實生產。一個模型如果要從簡單抓取走向長程作業,只靠這種方式很難堆出足夠數據。
仿真也能快速生成數據,便于并行訓練,但它的問題同樣明顯:仿真和現實之間存在差距。真實世界里的摩擦、變形、遮擋、接觸誤差,很難被完全還原。尤其在靈巧操作里,差一毫米,結果可能就完全不同。
靈初智能選擇回到人身上。
人類本來就在倉庫、便利店、工廠里完成大量高頻動作:抓取、掃碼、分揀、裝配、折疊、插接。這些動作天然帶著任務目標、物體關系和工作節拍。靈初智能的設想是,讓人戴上多模態數據手套,在真實場景里干活,把視覺、觸覺、關節角等信息采下來,再把這些人類操作數據轉化成機器人可用的數據。
這和單純視頻學習、傳統遙操作都不一樣。視頻主要記錄“人看到了什么”,數據手套試圖記錄的是“人的手具體怎么動”:關節如何變化、觸覺何時出現、動作軌跡如何完成。對機器人來說,這些才是學會操作的關鍵細節。
它的模型分工也圍繞這個目標展開。Psi-R2 是策略模型,負責學習“這件事該怎么做”;Psi-W0 是世界模型,負責推演“換種做法會怎樣”。公司披露,Psi-W0 在訓練中加入了約30%的失敗樣本,讓模型不只學習成功軌跡,也理解失敗如何發生。
這一步很重要。真正難的不是讓機器人模仿一次成功動作,而是讓它知道為什么會失敗,以及失敗后怎么調整。對高精度任務來說,人類抓蘋果的動作映射到機器人身上,可能只差一點點就抓不起來。世界模型的價值,就是在真實執行之前,先幫機器人在模型里試錯。
不過,這條路線不能被簡單理解成“數據越多越好”。真正決定數據價值的,不只是規模,而是信噪比、精度和節拍。任務多樣性比物體多樣性更重要,物體多樣性又比場景多樣性更重要;在感知模態上,精準3D位姿的價值高于觸覺,觸覺又高于普通2D圖像特征。
這說明,人類操作數據雖然豐富,但并不天然等于機器人能力。人手和機械手結構不同,人的動作不能直接平移到機器人身上;純第一視角視頻成本低,但精度不足;觸覺數據有價值,但不同硬件格式難統一。
這也是靈初智能這條路線最大的門檻:采到人類數據只是第一步,把人的操作穩定遷移成機器人的能力,才是真正的難題。
03:最終答案不在榜單,在倉庫里
模型能不能成立,最終要回到場景里驗證。對靈初智能來說,這個場景暫時不是家庭,也不是舞臺上更容易傳播的人形機器人表演,而是物流和零售。
但物流和零售不是一個籠統場景,真正有價值的是其中高頻、可量化、又有足夠復雜度的細分環節。靈初智能首站選擇服裝倉儲,是因為這個場景貫通倉庫、門店和C端,SKU極其豐富,顏色、包裝、尺寸各不相同,天然能產生大量多樣性數據。
這個選擇相對務實。家庭場景極端情況太多,短期內難閉環;傳統工廠數據又太封閉,遷移價值有限。服裝倉儲介于兩者之間,既復雜,又相對可控。一個“掃碼”動作看似簡單,但要做到99.9% 以上成功率,還要跟上穩定作業節拍,已經足以檢驗機器人是不是具備真實生產力。
公開報道提到,靈初智能的數據手套已經實現硬件落地,北京地區100套設備正在部署;此前公司已完成1萬小時量級真實手套數據驗證,2026 年目標是突破100萬小時量級。公司還計劃把分布式數據采集和微支付結合,用戶可以購買或租賃數據手套,在家完成簡單操作3分鐘獲得1—1.5美元報酬。
這意味著,靈初智能不是只想做一次性數據采集,而是想把數據采集做成可持續擴張的網絡。這個設想有想象力,也有明顯的不確定性:分布式采集能降低成本,擴大數據來源,但越分散的數據,越考驗質量控制、任務標準化和后續清洗對齊能力。如果采來的數據不能穩定轉化成機器人可執行軌跡,規模越大,噪聲也可能越大。
更關鍵的是,即便數據和模型跑通,具身智能公司也必須面對一個更現實的問題:客戶到底愿不愿意持續付費。
人形機器人場景應用聯盟的不完全統計顯示,2025 年中國市場公開披露的人形機器人中標項目超過292個,披露合同金額合計超18.1億元;但其中235個項目金額在500萬元以下,單筆過億元項目只有4個。多位投資人和行業人士還提到,部分具身智能訂單存在“水分”,不少更像展示采購、意向訂單或數據采集合作,而不是真正意義上的生產力替代。
這才是靈初智能接下來真正要面對的市場。MolmoSpaces榜單第一、接近10萬小時人類操作數據、1000小時開源數據集,都能證明它在技術和數據上有動作。但客戶最終不會為榜單付費,只會為更低成本、更高效率、更穩定的作業結果付費。
所以,靈初智能最值得看的,不是它又融了多少錢,而是它能不能跑通一條閉環:用數據手套采到真實人類操作數據,用Psi-R2和Psi-W0把數據轉成模型能力,再讓機器人進入物流和零售場景干活,最后從真實作業里繼續回流數據。
如果這條鏈路跑通,它就不只是具身智能融資潮里的一家公司,而可能成為機器人時代的數據基礎設施公司。可如果鏈路跑不通,它也會被卷進行業共同困境:Demo很多,訂單很薄,技術看起來很近,真正替代生產力還很遠。
2026年的具身智能,不宜簡單說成商業化爆發元年。更準確地說,它是商業化驗證年,也是淘汰賽開始的一年。靈初智能站在了一個有利位置,但位置不等于結果。真正的答案,不在融資,也不在模型榜單,而在倉庫、貨架和客戶每天計算的那本賬里。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.