網易首頁 > 網易號 > 正文申請入駐

千覺機器人：讓觸覺成為與視覺并列的“認知模態”

2026-06-09 09:04:46　來源: 鈦媒體APP

北京舉報

分享至

2026年，帶觸覺的數據飛輪將成為具身智能的下一個關鍵戰場。

在工廠里，機器人能掃描零件輪廓、定位裝配孔位；在實驗室里，它能讀取實驗數據、識別儀器狀態；在商場里，它能識別人臉、引導顧客路線。視覺讓機器人"看"得很清楚，但當它伸手去夾起一塊軟布、拿起一張薄紙、握住一顆雞蛋的時候，它還需要知道用了多大的力度、是否抓穩、是否發生滑移、以及下一步應該如何調整。這些能力，正是觸覺感知要解決的問題。

“機器人真正進入現實世界，不能只有視覺。視覺讓機器人‘看見’世界，而觸覺讓機器人有機會真正‘操作’世界。”千覺機器人創始人馬道林向鈦媒體創投家表示。

2024年起，主流靈巧手公司開始嘗試搭載傳統觸覺傳感器；到了2025年下半年至2026年年初，技術風向逐步向視觸覺（Vision-Based Tactile）收斂。視觸覺的輸出是圖像，機器人的視覺和大模型輸入的主體也是圖像，這意味著，算法端可以直接復用過去幾年大模型時代積累的視覺編碼器、多模態方法以及Token化技術，進而降低邊際成本。

觸覺成為具身智能從看見世界走向理解物理世界的關鍵一環。Ego（第一人稱視角）、UMI（通用操作接口）、真機數據這三條數據管線誰先跑通，誰就握住了下一代具身基礎模型的入場券。

從“盲操作”到“摸得準”

在全球機器人領域旗艦會議ICRA 2026大會上，千覺機器人展出了一臺雙臂機器人，在沒有預設軌跡的情況下，自主完成紙盒成型的全過程。

紙板是典型的弱柔性物料，輕薄、易變形，每一次抓取和折邊的接觸狀態都隨操作動態變化。傳統工業機器人依賴固定軌跡編程和純視覺引導，在面對此類物料時極易因形變誤差導致操作失敗；傳統的力控方案又難以捕捉微觀的動態滑移。

傳統VLA模型主要依賴視覺+語言指令驅動動作，只有“看”和“做”，這種架構在結構化環境中表現尚可，一旦遇到弱柔性物料、微小形變、動態滑移等場景，就會因為缺乏實時物理反饋而陷入“盲操作”。

千覺機器人的解決方案是自研VTLA（Vision-Tactile-Language-Action）模型，這套模型的核心創新在于，將觸覺從傳統控制系統中的反饋信號提升為與視覺同等級的認知模態。視覺負責理解環境與物體狀態，觸覺負責理解接觸過程與物理交互狀態，兩者共同構成機器人對物理世界的完整感知基礎。

VTLA模型并非簡單地增加一種新的傳感器輸入，而是讓機器人同時具備“看見世界”和“感知接觸世界”的能力。視覺回答“物體在哪里”，觸覺回答“接觸發生了什么”，兩者共同驅動機器人在復雜接觸場景中的決策與操作。

疊紙盒演示中，面對輕薄易變形的紙板，搭載VTLA模型的機器人不但通過實時感知“紙板的受力狀態”，連續完成抓取、展開、折邊和壓實等操作，順利完成紙盒成型的任務。還保持了持續外部干擾下的穩定執行，充分體現了其在干擾條件下的魯棒性與泛化能力。

干擾情況下，VTLA模型驅動雙臂機器人長序列紙盒成型仍能自主完成作業。

“觸覺不是機器人能力上的‘錦上添花’，而是機器人從實驗室演示走向產業應用的重要底層能力。尤其在人形機器人、精密制造、智能檢測等場景中，真正決定落地效果的，往往不是機器人‘能不能動’，而是在復雜物理接觸中能不能穩定、可靠、可復制地完成任務。”馬道林表示。

VTLA模型解決了“怎么用觸覺”的問題，但高質量、多模態的觸覺數據從哪里來，這正是TacCap-Gripper存在的技術邏輯。

TacCap-Gripper觸覺數采設備

這是一款專為機器人物理交互數據采集打造的硬件，集成了高精度視觸覺傳感器、IMU慣性測量單元與高分辨率編碼器，能夠實現動作、視覺、觸覺多維度數據的同步采集與精準匹配。

人類演示者戴上它完成一次抓取，產出的不僅是一段視頻，而是一組包含手指姿態、接觸力分布、物體形變過程的完整數據包，直接轉化為VTLA模型訓練的標準化“養料”。

然而，在工程落地層面，視觸覺路線有著極高的硬性門檻。傳統視觸覺傳感器往往面臨體積臃腫、高頻動態響應不足、硅膠涂層易磨損以及量產一致性差等痛點。每一項都是橫亙在實驗室與市場之間的分水嶺。

針對上述痛點，千覺機器人通過自研工藝，使其指尖觸覺傳感器在保持高精度微觀形變、紋理變化捕捉能力的同時，實現了大幅度的小型化與結構優化，可精準支撐對位、撥動、滾動、精細抓取等高精度操作。

千覺機器人多模態觸覺傳感器產品矩陣

目前，千覺機器人已形成全系列多模態觸覺傳感器產品矩陣，全面覆蓋指尖、夾爪、平面、曲面等全形態硬件，能夠適配靈巧手、工業機械臂、人形機器人等各類具身智能體。

產品已應用于智元、谷歌、自變量、銀河通用、眾擎等眾多國內外知名具身企業，且已與寧德時代、理想汽車、海爾等開展場景合作。

MIT博士后帶隊

作為一家硬科技企業，千覺機器人有著鮮明的學術與產業雙棲基因。

馬道林于2024年5月創立了千覺機器人，他畢業于北京大學，在北大取得博士學位后進入了MIT Mcube 實驗室從事博士后研究，師從國際機器人操作與觸覺感知領域的領軍學者Alberto Rodriguez（現任波士頓動力Robot Behavior負責人，MIT前副教授），目前在上海交通大學任副教授、博士生導師。憑借在觸覺感知與具身智能領域的長期深耕，他斬獲了國際機器人學界公認的最高學術榮譽—ICRA 2021全球唯一最佳論文獎。

千覺機器人創始人：北京大學力學博士與MIT博士后、上海交通大學副教授馬道林

其團隊匯聚了來自MIT、北京大學、清華大學、上海交通大學、復旦大學、UCL、悉尼大學等國內外頂尖院校的跨學科人才，千覺在機器人操作與觸覺感知領域持續攻堅，打通了從底層傳感器設計、高價值數據采集，到感知算法迭代與觸覺模型研發的全鏈條技術閉環。這種從“底層感知”到“機器人操作控制”的完整技術積累，構成了千覺難以復制的核心壁壘。

在視觸覺領域，全球頂尖人才主要來自于MIT，而馬道林則是其中為數不多的回國創業者。這種系統性的技術判斷力和工程攻堅能力，迅速吸引了資本市場的關注。

成立僅一年半，千覺機器人就完成了天使輪、Pre-A輪融資，累計融資數億元人民幣，投資方包括高瓴創投、理想汽車、元禾原點、孚騰資本（上海具身智能產業基金）、智元等知名投資機構和產業方。

“接下來一兩年，純單品的硬件公司將面臨巨大壓力，產業競爭正迅速從碎片化的算法研究、單點傳感器的內卷，升級為‘傳感器+全棧模型+場景數據’的系統級對決。”馬道林表示：“千覺機器人圍繞觸覺硬件、數據采集、模型訓練和產業應用，構建機器人理解真實物理世界的底層能力。”

在目前的具身智能產業鏈中，通用大模型與整機結構的生態主導權往往掌握在主機廠或AI巨頭手中。對于千覺這類技術型初創企業而言，將戰略重心錨定在底層的觸覺能力上，推動硬件標準化、數采規范化以及跨模態對齊，是在巨頭環伺的生態中切入細分市場的一種務實選擇。

從“看見世界”到“操作世界”，機器人還需要補上觸覺這一課。

回看人工智能的發展歷程，計算機視覺的爆發建立在海量標準化開源數據集與軟硬件高度對齊的基礎之上；而當前的觸覺領域，無論在高質量數據規模、物理接口標準還是大規模預訓練模型的適配上，都仍處于相對早期的探索階段。

觸覺感知何時能從技術亮點變為行業標配，這取決于三個關鍵變量：

第一，成本門檻。觸覺傳感器雖在靈巧手整體 BOM 成本中占比不占大頭，但其高昂的軟硬件一體維護、校準與一體化集成成本，對追求大規模量產經濟性的主機廠而言，仍是一道現實的門檻。

第二，數據規模。盡管行業已有部分百萬幀級別的局部開源圖像，但真正具備多物體、多形態、跨場景且帶物理真值標簽的操作軌跡數據集依然極度匱乏。觸覺數據飛輪能否真正轉起來，直接決定了其控制模型的泛化能力。

第三，市場驗證。主機廠是否愿意為“摸得準”支付溢價，畢竟，在人形機器人尚未真正走進家庭之前，觸覺的 ROI 仍需市場驗證。機器人想要真正做到“摸得準、做得穩”，不僅取決于千覺等技術提供商在硬件和軟硬件融合上的迭代速度，更取決于整個具身智能產業鏈對觸覺價值的實際買單意愿。

行業的真正質變，往往就發生在那些傳統視覺遭遇盲區、力控陷入遲鈍的物理縫隙里。當機器人不僅能夠用視覺去旁觀世界，更能夠用觸覺去試探世界時，具身智能才算真正拿到了通往物理現實的解密鑰匙。（本文首發鈦媒體APP，文 | 智客Zhiker，作者｜郭虹妘）

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.