在具身智能熱潮中,很多討論都圍繞大模型展開。但在它石智航創始人兼 CEO 陳亦倫看來,如果沒有高質量真實世界數據,具身智能很難真正走向泛化。
在與線性資本 CEO 王淮的對話中,陳亦倫反復強調一個判斷:機器人不是只要“看見世界”就夠了,它還要理解人與物理世界交互時的動作、接觸、力、反饋和結果。
![]()
這也是它石智航選擇 Human-centric 路線的重要原因。
不同于只采集視頻或末端軌跡的方式,它石更關注人類在真實場景中自然完成任務時產生的多模態數據。陳亦倫認為,如果目標是訓練跨場景、可泛化的具身基礎模型,數據質量和數據規模同樣關鍵。
“具身智能面對的是更開放、更復雜、更高維的真實物理世界。要解決這個問題,數據來源必須先被解決。”他說。
在陳亦倫看來,機器人學習的難點并不只是“看懂畫面”,而是要真正理解物理世界中連續發生的變化:手如何接近物體,接觸如何產生,力如何作用,物體狀態如何變化,動作結果又如何反饋到下一步決策中。這些信息如果只依靠單一視覺或低維軌跡,很難完整表達。
![]()
因此,它石選擇從真實世界的人類操作數據出發,希望通過更自然、更低干擾的方式,采集人類完成任務過程中的多模態信息,讓模型學習人與物理世界交互的底層規律。
這也是它石沒有從簡單搬運類任務開始,而是選擇工業柔性操作作為突破口的原因。
工業制造中,很多剛體、結構化、位置確定的問題,傳統自動化已經解決得很好。但柔性、細小、復雜、需要力控和視覺反饋的任務,依然是長期難題。它們對感知、規劃、控制、數據和模型都提出了更高要求。
高精度柔性線束,正是這類難題的代表。線束不是剛體,形態會隨著抓取、移動、插接不斷變化;同時,它對位置精度、力控穩定性和實時糾錯能力要求很高。對機器人來說,這不是簡單的“拿起”和“放下”,而是一個需要持續感知、動態調整和精細執行的復雜過程。
在陳亦倫看來,這類問題恰恰是具身智能真正應該解決的問題。
如果機器人只能在可控環境里完成預設任務,它仍然停留在原型驗證階段;而如果機器人能夠在真實物理環境中穩定完成復雜任務,并具備跨場景遷移與泛化能力,具身智能才真正進入新的階段。
這也是它石提出“具身智能2.0”的底層邏輯。
王淮問,為什么它石要選擇這么難的場景?
陳亦倫說,難題不是為了證明自己,而是因為它本身具有足夠高的產業價值。真正的技術突破,不應該只停留在演示里,而要進入真實生產系統,解決真實問題。
![]()
它石曾用刺繡機器人做過一次更直觀的展示。相比工業場景,刺繡更容易被普通觀眾理解,也更能直接呈現機器人在復雜精細操作中的泛化能力。但陳亦倫強調,刺繡不是它石長期投入最多的場景,而是底層能力的一次外化。
對它石而言,真正重要的是形成閉環:高質量真實數據進入模型,模型能力反哺機器人操作,機器人在真實場景中持續驗證和迭代。
這也是陳亦倫對具身智能路線的核心判斷:未來的競爭,不只是單點模型能力的競爭,而是數據、模型、硬件、工程和真實場景之間系統閉環的競爭。
從 Human-centric 數據路線,到高精度柔性線束任務,它石智航選擇的并不是一條最容易講清楚的路,而是一條更接近真實產業問題的路。它要求團隊同時具備數據采集、模型訓練、硬件執行、工程集成和場景落地能力,也要求技術路線經得起真實任務的反復驗證。
對陳亦倫和它石而言,具身智能的終點不是“會演示”的機器人,而是能夠在真實環境中穩定工作、持續泛化、真正創造生產力的機器人。越難的問題,越能檢驗技術的真實邊界;而真正解決這些問題,才可能把具身智能從實驗室和展臺,推向產業現場。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.