允中 發自 凹非寺
量子位 | 公眾號 QbitAI
過去兩年,具身智能的資源與研究重心高度集中于視覺感知,聚焦于“讓機器人看懂世界”。
但在真實精細化操作場景中,核心挑戰往往不在視覺識別本身,而在物理接觸后的交互環節
能夠完成USB接口的視覺對準,卻難以判斷插入過程中的受力變化與合適力度;能夠夾起衣物,卻無法實時感知布料的滑移狀態與張力分布,難以完成精準的褶皺整理。
絕大多數精細化操作的失敗節點,并非視覺識別階段,而是物理接觸發生之后的交互過程。
這一行業共性痛點,正是新智具身選擇觸覺具身智能賽道的核心切入點。
5月27日,上海新智具身智能科技有限公司(NeoteAI,以下簡稱“新智具身”)宣布完成近億元天使輪融資,本輪由上海國投旗下上海科創集團,以及復旦科創聯合領投,上海科創集團旗下策源基金等共同投資,多維資本擔任獨家財務顧問。
![]()
據公開信息顯示,新智具身源自復旦大學可信具身智能研究院,背靠產學研與地方政策雙重加持,作為復旦大學與靜安區戰略合作的重要落地成果,公司在初創期便獲得靜安區科經委與市北高新集團的大力培育,先后獲得靜安區戰略性資金及上海市經信委促進產業高質量發展專項資金的支持,上海市科委也針對其核心視觸覺傳感器的研發給予了專項經費支持,全面加速公司的技術攻關進程。
在行業持續押注視覺、VLA和大模型的時候,新智具身選擇把一個更底層的物理問題放回機器人訓練主干:
機器人不只要看懂世界,還要在碰到世界之后,知道自己碰到了什么、碰得對不對、下一步該怎么動。
簡單說,它賭的是觸覺。
機器人缺的不只是視覺,還有手感
機器人精細化操作的絕大多數失敗,都發生在與物理世界產生接觸的瞬間及后續過程。
對于人類而言,很多判斷幾乎是下意識完成的:
- 手指觸碰到接口邊緣時,手腕會根據阻力反饋自然微調角度;
- 拿起紙杯時,指尖會依據杯壁形變實時調整夾持力度;
- 整理布料時,手部會順著張力變化動態改變拉動方向。
而這些,正是當前機器人感知體系中缺失的關鍵一環。
新智具身的核心行業判斷是,具身智能正從單一“視覺中心主義”,向“視覺+觸覺雙中心”的感知體系演進:視覺負責全局定位與語義理解,觸覺則承擔接觸后的物理狀態反饋與動態調整
只要機器人與物理世界產生交互接觸,觸覺信息就是不可或缺的核心感知要素。
但觸覺感知的落地,絕非簡單加裝一個傳感器就能實現。
若觸覺信息僅停留在孤立的硬件讀數層面,便無法真正轉化為機器人的操作能力。
新智具身的核心目標,是將觸覺感知轉化為可訓練的標準化數據,使其深度融入具身模型的訓練與推理全鏈路。
新智具身的核心團隊源自復旦大學可信具身智能研究院,具備深厚的產學研融合基因。
CEO趙世豪本碩畢業于復旦大學,博士就讀于香港大學,曾作為核心研究員在微軟全球研究院、阿里通義實驗室深耕前沿模型研發,研究覆蓋視頻世界模型、生成式模型;
![]()
首席科學家吳祖煊為復旦大學可信具身智能研究院副院長,曾任職于Meta,長期深耕視頻模型、多模態模型等核心領域;
![]()
COO董道國則是兼具學術與產業經驗的跨界人才,具有近20年的產業界經歷,曾任華為榮耀Magic一代首席架構師,現任復旦大學可信具身智能研究院研究員,主要為公司的技術商業化保駕護航。
![]()
正是基于團隊在多模態模型領域的深厚積累,新智具身并未選擇單一硬件的切入路徑,而是同步布局視觸覺傳感器、精細化數據采集平臺與觸覺具身大模型三大核心板塊,構建完整的技術閉環。
先把觸覺信號采回來
新智具身技術落地的首要環節,是實現機器人末端執行器接觸信息的高精度采集
公司自主研發的視觸覺傳感器,可全面適配工業夾爪與靈巧手等末端執行器,能夠精準采集接觸過程中的力值、滑移、形變與邊界輪廓等多維度物理信息。
![]()
△新智具身·視觸覺傳感器
這一技術路線的核心在于視觸覺感知范式。
傳統壓阻式、電容式觸覺傳感器多輸出低維離散點信號,僅能反饋單點受力狀態,無法完整還原接觸面的幾何輪廓、滑移方向、表面紋理與形變邊界等關鍵信息。
更為關鍵的是,此類方案的感知性能上限在硬件出廠時即已基本固化,難以通過后續算法迭代實現能力提升。
視觸覺技術采用全新的感知原理:傳感器內部集成微型光學相機,通過拍攝柔性硅膠表層在接觸物體時產生的亞毫米級形變圖像,再由端側深度學習模型解耦出六維力信息、滑移軌跡、物體表面輪廓與像素級力場分布。
這一技術路線具備兩大核心優勢:
其一,感知信息密度顯著提升,能夠提供傳統傳感器無法實現的全域接觸表征
其二,輸出數據格式與視覺數據高度兼容,可與現有Transformer架構及視覺數據實現自然融合,大幅降低了觸覺模態接入已有具身模型的技術門檻。
新智具身的視觸覺傳感器,主要由復旦可信具身智能研究院研究員陳文明及其博士生羅虎主導研發,這也是公司與復旦大學產學研融合的首個標志性成果。
觸覺具身數據Scaling up
傳感器的突破只是觸覺具身智能的第一步。
觸覺感知能力的真正釋放,依賴于大規模、高質量的觸覺交互數據支撐。
為解決行業觸覺數據稀缺的痛點,新智具身搭建了超千平方米的專業化觸覺具身數據采集中心
![]()
△新智具身·大規模觸覺+視覺的具身數據采集
數據采集任務圍繞精細化操作場景展開,包括USB插接、螺絲擰入、內存條安裝等接觸操作;線束裝配、薄壁容器抓取、彈性部件處理等對力度控制要求較高的任務;織物整理、紙張折疊、膠帶粘貼等易變形物體的操作。
上述任務的核心難點在于,操作成敗的關鍵信息僅存在于接觸過程中。
新智具身構建了互補式的觸覺具身數據采集體系:
真機采集線通過標準化的機械臂,保證數據的精度、一致性與多模態同步性,所有采集單元均集成自研視觸覺傳感器與力反饋系統
全自研觸覺UMI便攜式采集終端則降低了數據采集的部署成本與周期,同時支持跨品牌、跨型號機械臂的數據遷移與適配。
在數據規模的認知上,新智具身采用了跨行業的對比視角。
當前具身領域數據量大約還在千萬級別,而語言模型則從十億甚至百億起步,這種數量級的差距直接限制了具身模型的泛化能力與魯棒性。
因此,公司將數據規模化積累作為現階段的最高優先級,采取“先做大規模,再優化成本”的發展路徑。
目前所有采集數據均優先供給內部模型訓練,待數據體系與采集流程成熟后,再逐步探索數據服務等商業化模式。
不止于數據,觸覺如何賦能模型
數據的終極價值,在于深度融入模型訓練與推理鏈路,轉化為機器人的實際操作能力。
新智具身的目標是將觸覺接入預訓練具身大模型(VTLA與Tactile世界模型),并結合融入觸覺模態的強化學習技術路線,系統性構建觸覺賦能的具身智能能力,并在多個精細化操作任務中取得了重大突破。
傳統VLA依賴視覺與語言輸出動作,面對精細操作容易因為感知盲區而失敗。
新智具身的VTLA模型可實時獲取接觸反饋:夾持、滑移、到位、形變等真實狀態,精準指導操作的完成。
世界模型需學習動作與環境變化的關聯,純視覺難以應對柔性材料、精密裝配等精細化任務。
新智具身的觸覺世界模型補齊了物理信息短板,極大的提高了精細化操作的成功率。
到了強化學習里,觸覺則成為實時修正動作的信號。阻力異常、夾持不穩、發生滑移,都可以被模型用來調整下一步動作。
先在工廠里驗證
商業化上,新智具身的第一站是工廠
原因不復雜:任務結構清楚,效果可量化,泛化要求低于家用場景,觸覺帶來的增益也更容易被驗證。
線束裝配、內存條插拔、柔性材料整理、家紡操作,都是典型的精細化操作場景。
它們長期依賴人工,不是因為視覺定位做不到,而是接觸之后的狀態變化太復雜。
上海本地完善的產業生態,也為技術落地提供了得天獨厚的土壤。
汽車、3C、家紡等產業高度集聚,涉及大量精細化操作場景,與新智具身重點布局的數據采集與技術驗證方向高度契合。
當前,公司已在多個工業細分場景落地POC驗證訂單
后發者要換一個入口
新智具身的競爭視角也比較明確。
團隊的后發判斷是,純視覺路線經過多年的高速發展,已進入資源密集型競爭階段,研發成本不斷攀升,但其在精細操作領域的固有局限也日益凸顯。
對于后發企業而言,沿著先行者的軌跡亦步亦趨難以實現突破,唯有找到行業尚未解決的核心難題,從新的技術變量切入,才能構建起不可替代的競爭壁壘。
而新智具身的判斷正是將觸覺從可選模態變為機器人的標配
看懂任務只是具身智能的入門要求,能否在物理交互過程中實時調整動作、穩定完成任務,才是下一階段行業競爭的核心分水嶺。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.