網易首頁 > 網易號 > 正文 申請入駐

VLA不夠了?觸覺,將改寫具身智能新格局

0
分享至



機器之心發布

2026 年,「數據」正成為具身智能競賽的新焦點,京東、百度等科技巨頭紛紛入局。然而,喧囂之中,一個根本問題懸而未決:什么樣的數據,才是具身智能真正需要的?

近日,全球最大的工程與應用科學專業組織 IEEE(電氣電子工程師學會)旗下的旗艦出版物 IEEE Spectrum,對機器人學家王煜進行了一次深度專訪。

這位深耕機器人領域近 40 年的學者給出了自己的判斷:當前主流的 VLA(視覺 - 語言 - 動作)架構不足以支撐機器人真正走向落地,包含物理交互信息的數據,才是機器人理解現實世界、實現穩定操作的關鍵所在。



  • 訪談鏈接:https://spectrum.ieee.org/daimon-robotics-physical-ai
  • 原文作者:Sujeet Dutta,Wiley 科學與工程部高級編輯

上世紀80年代,作為中國首批公派留學生,王煜進入卡內基梅隆大學機器人研究所,成為時任所長的 Matt Mason 教授招收的第一位博士生,專攻機器人抓取力學與操作規劃——這正是當下具身智能操作能力的學術源頭。他曾在多所院校任教,與李澤湘共同創辦香港科技大學機器人研究院,培養了大批活躍于今日產業一線的人才。

王煜被斯坦福大學評為全球前 2% 頂尖科學家,并作為 IEEE 機器人與自動化協會管理委員會唯一代表中國機構的學者,持續在國際具身智能領域傳遞中國聲音。

從液壓到電動、從工業到生活場景,再到如今的人工智能時代,王煜經歷了現代機器人學的每一次范式轉換。因此,他對當下狂熱中的思考格外值得傾聽。

在王煜看來,機器人下一個亟待解鎖的能力是「操作」(manipulation),且時機日臻成熟。

如今機器人能完成驚艷的 demo,卻仍難以在真實環境中自主感知、決策并穩定執行操作,根本原因在于對視覺的過度依賴—— 當機器人嘗試拿起一只玻璃杯、采摘一顆草莓、插拔一根電線時,視覺只能告訴它「物體在哪兒」,卻無法告知它力度是否恰當、角度是否到位、操作是否完成。

材質、摩擦、接觸力、形變,這些決定操作成敗的物理反饋信息,恰恰是視覺的盲區,也是機器人操作中長期缺失的一環。

王煜認為,觸覺是打開這扇大門的鑰匙。觸覺包含了接觸力、接觸狀態、形變、紋理與材質等信息,能夠填補視覺的盲區與錯覺,讓機器人從「識別物體」走向「理解物體、操控物體」。

基于這一判斷,他與團隊提出了 VTLA(視覺 - 觸覺 - 語言 - 動作)框架,在主流 VLA 架構中引入觸覺,將其視作與視覺同等重要的感知模態。



王煜教授

這些主張并未停留在論文里。幾年前,王煜與博士后段江嘩共同創立「戴盟機器人」,將多年積累的觸覺感知研究推向工程化落地。這家公司過去以含觸覺感知的硬件研發為聞名,2026 年第一季度的營收已超過去年全年。

上個月,戴盟正式發布含觸覺模態的物理世界具身數據集 Daimon Infinity,并開源其中 10000 小時數據,正式入場眼下最熱的具身數據賽道。

一位以「操作」為研究命題的學者,為何在此刻選擇加入數據之爭?這背后的判斷,或許能讓我們窺見未來幾年的具身智能走向。

在這次專訪中,王煜系統闡釋了他對機器人操作、觸覺感知、具身數據與物理 AI 的思考:為什么 VLA 架構會遭遇瓶頸?觸覺數據為何被長期忽視,又為何不可或缺?所謂「物理智能」究竟意味著什么?作為一位見證了機器人學半個世紀發展的研究者,他如何看待人形機器人未來的可能性與邊界?

以下為 IEEE Spectrum 專訪王煜的譯文,出于篇幅考慮略有刪減:

提問:今年 4 月,戴盟機器人聯合多家頭部學術機構和企業,共同發布規模最大、最全面的具身操作數據集。為何選擇現在發布數據集,而不是繼續專注硬件開發?

王煜:隨著具身智能的發展,越來越多人意識到數據的重要性:數據不足是目前具身智能發展的瓶頸,尤其是包含物理交互信息的數據,這將是提升機器人在現實世界操作能力的關鍵。

數據的質量、可靠性和成本,已成為研發和商業落地需要重點關注的問題。

這恰好也是戴盟擅長的事。依托領先的視觸覺技術,我們能夠提供含多模態觸覺的高質量數據 ——不僅包含接觸力,還有接觸形變、接觸狀態、滑移摩擦、物體材質與紋理等信息,完整還原物理交互的過程?;谶^往的技術積累,我們也研發了數據處理管線,將觸覺與視覺、動作軌跡、語音文本等模態精準融合,轉化為模型訓練可用的數據。

面對行業的數據空缺,我想采集數據是我們戴盟能做好、也應該做的事情。



今年 4 月,戴盟發布含觸覺全模態物理世界數據集 Daimon-Infinity

提問:戴盟聲稱數據集年底能達到超百萬小時規模,你們是如何做到這一點的?

王煜:我們打造了全球最大規模的外發式具身數據采集網絡—— 依托于輕便化設備,數據采集不再局限于數采場,而是可以進入各類真實場景,不受空間限制,實現了低成本、跨場景、高度真實性的采集,從而具備了每年數百萬小時數據的生產能力。

提問:Daimon-Infinity 由多家機構聯合發布,他們如何參與其中?

王煜:此次數據集,我們聯合了全球數十家機構合作共建,包括北京大學、清華大學、香港科技大學等中國高校,以及 DeepMind、美國西北大學、新加坡國立大學等全球頂尖研究團隊,另外還有中國移動、匯川技術、上聲電子等產業方。他們選擇與戴盟合作,是對我們將觸覺加入具身數據這一路線的認可。

通過在科研、制造等實際場景下進行采集,這些合作方幫助我們收集到了高度真實、以實際場景為驅動的數據;反過來,他們將這些數據用于自己的模型訓練。此外,我們開源了 10000 小時數據,希望含觸覺的數據能推動更多具身模型的進化。

提問:目前機器人領域的主流范式是 VLA 模型,但戴盟團隊提出了 VTLA 框架。為什么加入了觸覺?

王煜:觸覺信息對于機器人的操作能力至關重要,它能提供與物體接觸時的物理反饋, 引導機器人手進行可靠的操作。如果沒有觸覺,機器人可能無法在黑暗環境中判斷物體的位置,可能因無法感知滑移狀態而導致玻璃杯掉落,更有可能因為無法控制力度而導致操作任務失敗,甚至造成損害。

VLA 已經不足以滿足機器人操作的需求,因此我們擴展了框架,納入觸覺數據,創建了 VTLA。

重要的是,我們采用的視觸覺感知技術,與 VLA 所基于的視覺框架非常契合。它捕捉指尖表面的形變,將觸覺信息轉化為視覺圖像,并從中推斷出力和其他接觸狀態 —— 而圖像數據天然適合集成到 VLA 中,這降低了框架擴展的門檻。



搭載視觸覺傳感器的夾爪,通過精準感知觸覺,賦能精細操作

提問:您和團隊開發了世界上首個單色光視觸覺技術,為什么選擇了這條技術路線?

王煜:從開始研究觸覺感知時,我們就明確了自身需求:我們想要的是能夠高度模擬人類指尖皮膚觸覺的傳感器。

生理學研究已充分證實人類指尖所具備的能力 —— 知道我們觸摸了什么、是什么材質、力如何分布,以及當大腦控制手時,它是否移動到正確的位置。我們知道,在機器人手上復制這些能力將大有裨益。

在調研現有技術時,我們發現了多種類型的觸覺感知技術,包括三色光視觸覺傳感及其他更簡單的設計。我們將這些技術的優勢整合到一個解決方案中,使其在保持良好性能的同時又不會過于復雜,并將成本、可靠性和靈敏度控制在令人滿意的范圍內,最終研發了單色光視觸覺技術。隨著人們對觸覺認知的日益加深,這些技術將攜手并進。



全模態觸覺信息,包含力 / 力矩、形狀、材質、接觸信息四大維度

提問:你們的視觸覺傳感器正是基于這一技術,相比傳統觸覺傳感器有什么核心優勢?

王煜:我們在去年推出了全球首個多維高分辨率高頻率視觸覺傳感器,在指尖大小的模塊上裝載了 11 萬個感知單元,是業內目前最高的密度。

另一個優勢是頻率和帶寬,即我們檢測觸覺變化、傳輸并實時處理信號的速度。其他方面則主要與工程技術相關,如可靠性、漂移、硅膠表面耐用性及對電磁、光學及其他環境因素的抗干擾能力。

觸覺的重要性正被越來越多人意識到,我們的視觸覺傳感器也得到了更多人的使用,我相信這會讓整個行業都邁上一個新臺階。

我們的一位潛在客戶正在便利店中部署人形機器人,在密密麻麻的貨架上,機器人需要伸入非常狹小的空間才能取出物品 —— 人類至少需要三根纖細的手指才能完成抓取任務。諸如此類的場景,我們看到了對于觸覺的非常具體的需求。



戴盟視觸覺傳感器具有高感知單元密度

提問:戴盟目前的商業模式和戰略重點是什么?數據集在其中是什么角色?

王煜:我們最初專注于制造高性能的觸覺感知設備,尤其是搭載于機器人手的傳感器。但隨著具身智能的發展,大家逐漸意識到,行業需要不僅僅是一個組件,而是整個技術鏈:設備、大規模高質量的數據,以及最終能夠在實際應用環境中構建、訓練和部署機器人模型的框架。

現在,我們將自己的商業戰略定位為「3D」:設備(Devices)、數據(Data)和部署(Deployment)。我們研發用于數據采集和構建觸覺生態的設備,并通過在合作伙伴的應用場景里部署,完成含觸覺數據的落地與閉環驗證。在這個模式里,任何一環都不可或缺。

提問:您之前提出了「具身技能」的概念,認為這是人形機器人超越「僅擁有先進人工智能大腦」的關鍵。您為什么會提出這一觀點?過去兩年行業快速發展,您對具身技能的定義是否有所改變?

王煜:機器人的發展一路走來,如今已到了電氣、電子和機電一體化硬件技術融合的階段,這是過去 20 年里取得的巨大進步。由于硬件的快速發展,機器人現在完全是電動的,不再需要液壓系統?,F代電子技術提供了高帶寬和高扭矩,如果我們能將智能融入這些機械系統,就能創造出真正意義上的人形機器人 —— 能夠在非結構化環境中運行、決策并自主穩定地執行操作的機器人。

人工智能的出現恰逢其時,大量資源投入其中,特別是大語言模型。它們如今被推廣到世界模型中,賦能物理智能(physical AI)—— 我們希望這些能力最終能在現實世界中落地。如今研究重點更加明確,例如在家庭環境中,人們更傾向于使用人形機器人。這是一個令人興奮的領域,如果我們最終能夠制造出安全、可靠且經濟高效的機器人,它將為社會帶來巨大的益處。



搭載了戴盟觸覺感知技術的機器人在工廠線上部署

提問:機器人如今能進行令人印象深刻的 demo,但距離真正進入實際應用仍存在差距。什么因素可能觸發實際部署?哪些場景最有可能率先實現大規模部署?

王煜:我認為通用機器人的大規模部署之路仍然漫長,但我們已經看到特定領域的可行性。

這與自動駕駛汽車非常相似,無人駕駛出租車尚未全面部署,但移動機器人在酒店業已經得到廣泛應用。在中國,幾乎所有大型酒店都配備了送餐機器人 —— 沒有機械臂,只是一臺從酒店大堂取外賣的小型機器人。外賣員只需放置食物并選擇房間號,機器人便會自行導航、自行使用電梯,最終將食物送達客房。

酒店及餐廳的機器人,為其他場景的應用提供了范本,例如夜間藥店和便利店。我預計在短期內,這些場所將全面部署人形機器人,并在之后擴展到其他領域。我們可以期待,在未來,包括人形機器人在內的自主機器人將逐步滲透到特定行業,為行業創造價值。

我們的愿景始終是讓機器人實現強大的操控能力,并發展成為人類可靠的合作伙伴。未來,機器人或許會無縫融入我們的日常生活,真正造福并服務于人類。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
奪冠不到24小時!英球迷質疑艾倫關鍵球,要求嚴查 還回冠軍

奪冠不到24小時!英球迷質疑艾倫關鍵球,要求嚴查 還回冠軍

林子說事
2026-05-06 09:42:04
“排隊3小時,打卡1分鐘”,多景區迎“潑天流量”

“排隊3小時,打卡1分鐘”,多景區迎“潑天流量”

澎湃新聞
2026-05-06 00:04:10
中國機器人在美“出差”買票坐飛機:坐靠窗位,電池超標致航班延誤,現場表演逗樂乘客

中國機器人在美“出差”買票坐飛機:坐靠窗位,電池超標致航班延誤,現場表演逗樂乘客

紅星新聞
2026-05-04 15:44:20
女子在酒店露臺私人溫泉泡湯時突然有無人機飛過,酒店最新回應:其他房客的小孩放飛,未開啟拍攝功能,警方已進行處罰

女子在酒店露臺私人溫泉泡湯時突然有無人機飛過,酒店最新回應:其他房客的小孩放飛,未開啟拍攝功能,警方已進行處罰

魯中晨報
2026-05-06 11:30:15
吳宜澤決賽間歇收到奧沙利文短信支招,火箭:我只幫合得來的球員

吳宜澤決賽間歇收到奧沙利文短信支招,火箭:我只幫合得來的球員

楊華評論
2026-05-05 17:03:56
16歲女子玩懸崖秋千墜亡:生前17秒視頻曝光,旁人哄笑,錯失救援

16歲女子玩懸崖秋千墜亡:生前17秒視頻曝光,旁人哄笑,錯失救援

李晚書
2026-05-06 10:46:28
阿姨的氣質讓小哥擋不住

阿姨的氣質讓小哥擋不住

貴圈真亂
2026-05-06 10:13:32
大快人心!白洋淀五一徹底涼涼,靠宰客斂財的景區終于迎來了報應

大快人心!白洋淀五一徹底涼涼,靠宰客斂財的景區終于迎來了報應

社會日日鮮
2026-05-05 20:11:56
虧損超1.5億!《寒戰1994》票房崩塌,我感慨:這塊金字招牌砸了

虧損超1.5億!《寒戰1994》票房崩塌,我感慨:這塊金字招牌砸了

靠譜電影君
2026-05-05 10:40:44
吳宜澤抽煙照曝光!外網調侃:我們沉迷于電子煙 中國人都抽香煙

吳宜澤抽煙照曝光!外網調侃:我們沉迷于電子煙 中國人都抽香煙

念洲
2026-05-06 07:42:45
中美同時向全球下達禁令,各國都傻眼了!美媒:中國此舉史無前例

中美同時向全球下達禁令,各國都傻眼了!美媒:中國此舉史無前例

桑啟紅原
2026-05-06 05:00:41
奪冠僅1天,人民日報接連點名吳宜澤,釋放3個強烈信號,字字珠璣

奪冠僅1天,人民日報接連點名吳宜澤,釋放3個強烈信號,字字珠璣

尋墨閣
2026-05-06 06:33:51
游客墜落前喊了兩遍“沒綁緊”,視頻中有人笑,整個過程不到20秒

游客墜落前喊了兩遍“沒綁緊”,視頻中有人笑,整個過程不到20秒

魔都姐姐雜談
2026-05-05 22:13:52
女性跑步:暴露這個隱私,是性感嗎?

女性跑步:暴露這個隱私,是性感嗎?

馬拉松跑步健身
2026-05-05 19:18:07
太豪了!諾蘭的史詩級巨制,終于來了

太豪了!諾蘭的史詩級巨制,終于來了

來看美劇
2026-05-05 21:47:15
謝娜演唱會群星璀璨,李小冉與她合唱便利貼,張杰全程護航寵妻

謝娜演唱會群星璀璨,李小冉與她合唱便利貼,張杰全程護航寵妻

露珠聊影視
2026-05-05 22:59:46
1-0!薩卡立大功,阿森納淘汰馬競,挺進歐冠決賽,目標直指冠軍

1-0!薩卡立大功,阿森納淘汰馬競,挺進歐冠決賽,目標直指冠軍

足球狗說
2026-05-06 04:54:03
坎寧安23+7活塞擊退騎士1-0,哈里斯20+8哈登22+8+7

坎寧安23+7活塞擊退騎士1-0,哈里斯20+8哈登22+8+7

湖人崛起
2026-05-06 09:38:38
雷霆G1還沒發力湖人就輸了!防守資源+替補厚度碾壓,根本沒法打

雷霆G1還沒發力湖人就輸了!防守資源+替補厚度碾壓,根本沒法打

籃球資訊達人
2026-05-06 12:33:32
瀏陽爆炸煙花廠附近居民:多名中老年婦女在廠內工作,一女性從圍墻洞口逃生

瀏陽爆炸煙花廠附近居民:多名中老年婦女在廠內工作,一女性從圍墻洞口逃生

雞蛋bot
2026-05-05 15:44:51
2026-05-06 12:52:49
機器之心Pro incentive-icons
機器之心Pro
專業的人工智能媒體
12922文章數 142643關注度
往期回顧 全部

科技要聞

“馬斯克不懂AI”:OpenAI當庭戳老底

頭條要聞

綏化兩名十一二歲女孩失聯多日遭遇不測 警方回應

頭條要聞

綏化兩名十一二歲女孩失聯多日遭遇不測 警方回應

體育要聞

活塞1比0騎士:坎寧安不再是一個人了

娛樂要聞

神仙友誼!楊紫連續10年為張一山慶生

財經要聞

人形機器人七小龍:誰真能賣 誰在講故事?

汽車要聞

吉利原生新能源越野架構亮相 AI如何帶來極致越野

態度原創

數碼
本地
時尚
親子
公開課

數碼要聞

小米POCO C Pad即將登陸全球市場 搭載驍龍6s Gen 2

本地新聞

用青花瓷的方式,打開西溪濕地

卷首語|這屆年輕人,全員渡劫奧德賽

親子要聞

孩子咳喘總反復,根源或是咳喘共患病

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版