網易首頁 > 網易號 > 正文 申請入駐

獨家對話清華AIR教授曹婷:具身最被忽視的問題,就是物理智能體

0
分享至

“清華系”是具身智能領域里繞不過去的大山,這座大山上刻著銀河通用的王鶴、星動紀元的陳建宇、它石智航的陳亦倫、加速進化的程昊、千尋智能的高陽等一長串閃光的名字,據清華電子系統計,其校友創辦的具身相關企業已近20家。而清華系的版圖里,AIR(清華大學智能產業研究院)的定位則更加明確。它不僅產出學術論文,更著力于把實驗室的前沿技術扎實地鋪進產業。它石智航的陳亦倫就曾是AIR智能機器人方向的首席科學家。

2026年初,“具身智能”被正式寫入“十五五”規劃綱要,成為國家戰略級別的未來產業。與此同時,一批在企業研究院深耕多年的科學家,也選擇陸續回到國內高校,從單純的企業研究體系重新走進一批兼顧學術研究和產業培育的高校研究院。

曹婷的選擇正是清華AIR。


曹婷,清華大學智能產業研究院教授,北京市高層次引進人才

在微軟研究院工作了七年,2025年夏天,曹婷成為清華大學智能產業研究院(AIR)的教授。多年來,她始終聚焦 “極致智能密度” 與 “頂尖執行性能” 的核心目標,在智能計算前沿領域持續攻堅,突破極低比特模型量化、基于查表的大模型高效推理、全幀率實時多模態大模型架構、存算一體模型加速器等一系列關鍵技術,構建起從算法到硬件創新的完整技術體系。

在微軟期間,這些技術的應用使她能帶領團隊在業界首次賦能復雜神經網絡模型從云端遷移到手機、PC甚至IoT設備上,服務于百萬用戶,保護用戶隱私的同時節省百億次的云端調用成本。但這次,她做出了新的選擇。

我們還獨家獲悉,曹婷教授及團隊正計劃孵化一家新公司,專注于可以持續進化的物理智能體,新公司目前仍在籌備階段。

以下為與曹婷教授的對話全文,略有刪減:

從工業研究院到高校

創投家:您當時選擇來清華也在媒體引起了不小的關注,為什么選擇在這個時候來清華?

曹婷:企業研究院對我來說,是一段非常重要、也非常感恩的經歷。無論是在華為還是在微軟,我都經歷了從前沿研究到系統落地、再到真正被大規模用戶使用的完整過程。你會看到一個技術怎么從論文里的想法,變成可以在手機、PC、IoT設備上穩定運行的能力,也會真切體會到,自己的工作被百萬、千萬用戶用起來是什么感覺。這種訓練和成就感,對我今天做很多判斷都非常重要。

但到了職業生涯的這個階段,我會更想跳出已經熟悉的路徑,去定義新的問題,探索新的產品方向和應用空間。企業研究院讓我把一個清晰的問題做到極致,而接下來我更想去做那些還沒有標準答案、也還沒有人把路徑真正走通的事情。具身智能這件事,正在從"想象"變成"可以做",不是五年后,是現在。這個判斷讓我覺得,現在進來,時機是對的。

清華AIR劉云新老師比我早幾年做這個選擇,他在MSRA工作了將近二十年,也是我在端側智能方向上最重要的合作者之一。他五年前來到這里,對我觸動很大。一個在工業界深耕這么多年的人,選擇把后半程放在學術研究和產業培育上,背后一定有很深的判斷。這也讓我更愿意在這個時間點來到清華,去做一些更長期、也更難的事情。

創投家:清華AIR這邊,跟企業研究院最大的不同在哪里?

曹婷:我覺得是問題的來源和時間尺度不一樣。企業研究院面對的,往往是已經有產品基礎、有用戶場景、有業務重心的問題空間。研究院要做的是怎么提出一個新想法,而是把它變成可以進入產品鏈條、進入系統棧、最終服務真實用戶的能力。我很多關于技術價值的判斷,都是在這樣的訓練里形成的。

而清華AIR吸引我的地方,在于它能讓我把研究、產業和長期問題定義放在同一個坐標系里思考。具身智能被寫入‘十五五’規劃,不是因為它是一個好聽的概念,而是因為它關系到中國下一步的產業競爭力。制造業的柔性升級、物流的無人化、能源設施的巡檢、老齡化社會的照護,這些問題都不是靠傳統自動化就能解決的,它們需要真正的物理智能。

所以對我來說,來到清華AIR,不是離開產業,而是把視角再往前推一步,有耐心去做五年甚至十年后國家和社會真正需要的事情,這一點對我非常有吸引力。

具身智能的窗口與缺口

創投家:具身智能寫進了國家規劃。你覺得這個時間節點選得準嗎?

曹婷:我覺得這個時間點選得非常準。具身智能今天被寫進國家規劃,是因為它已經進入了一個從前沿探索走向產業布局的關鍵階段。機器人本體逐漸成熟,成本和穩定性都在改善;中國又恰恰擁有全球最完整的制造業體系、最強的供應鏈協同能力,以及在如制造業、物流、養老、城市管理這些密度最高、類型最豐富的真實應用場景。這樣的組合,在別的國家并不容易同時具備。

所以中國今天推進具身智能,有點像當年布局電動車。真正重要的不是某一個單點技術,而是技術成熟度、產業基礎、場景需求和政策牽引在同一個時間點形成了合力。一旦這種合力出現,產業窗口往往很快就會打開,往往不會持續太久。誰能盡快把真正有價值的東西做出來,誰就有機會定義下一階段的產業格局。

創投家:你說的"有價值的東西",指的是什么?

曹婷:真正能在開放世界里持續進化的物理智能體。

現在的具身智能,本質上還停留在工具階段。哪怕VLA或者世界模型訓練得很強,它們多數還是在做擰螺絲、搬運、分揀、抓取這類單點任務,像一個工具箱,但還不是一個真正會成長的可靠員工。

市場真正需要的,是能在真實崗位上、在和物理世界反復交互中,能自己總結經驗、發現問題、修正策略。比如今天清管道,下一次就會記住哪里容易打滑,要動作幅度小一點、慢一點;今天打掃衛生間,下次就會記住污漬分布和臺面材質,知道怎么擦更穩、更不傷表面。脫離工具,越來越像一個模范員工,才是具身智能目前急缺的那一塊。

創投家:你看這個賽道,有沒有什么大家低估或者回避的問題?

曹婷:物理智能體決定具身能不能真的落地,但恰恰是這點是大家忽視的,講的少,做的更少,做起來極具挑戰。

數字世界里的智能體,很多時候面對的是穩定接口和確定規則;但物理世界不是這樣,訓練時沒見過的情況每天都會出現,而且每臺機器本體、每個場景、每次交互都不一樣。它不能只靠預訓練的模型,經驗必須在真實環境里自己去摸索和持續積累,才能在自己的場景下把每臺本體能力發揮好。

也正因為這樣,物理智能體比數字智能體更必要,也更難。難點不只是讓機器做出動作,更難的是讓它在真實交互中積累經驗、形成記憶,并把這些經驗轉化成下一次更穩、更好的執行。怎么理解物理環境,怎么表示交互經驗,怎么構建長期多模態記憶,怎么形成持續進化的閉環,這些問題到今天都還沒有成熟解法,而這正是我們提早投入、也已看到初步成果的方向。

創投家:產業側還有哪些實際的障礙?

曹婷:上面說的物理智能體,其實科研側和產業側都繞不開。在產業側,還有另一個非常具體的矛盾:真正有用的物理智能體需要在端側部署。

你可能會想,數字智能體能部署在云端,為什么物理智能體要在端側?一是延遲,機器人的輸入是物理世界、是連續的視頻、點云、傳感器等等這些多模態的數據,往云端傳個幾幀數據十幾秒可能就過去了,根本不能支撐實時動作的生成;二是網絡,很多真實場景是弱網或離網的,比如剛提到的管網清潔場景;三是隱私,無論是家庭場景還是工業場景,用戶圖像敢不敢傳到云端去?

所以具身智能體必須在端側跑。但端側的算力是有限的。這就要求你在模型的推理效率上做到極致,不是"差不多",是真正的極致。這個軟硬件協同的挑戰,正是我們團隊的強項。

從實驗室再回到產業中去

創投家:你們是怎么思考這些挑戰的?

曹婷:我們不是把物理智能看成一個單點模型問題,而是把它看成一條完整的能力鏈。

物理智能體要真正成立,至少有幾件事要同時做好:它得持續理解物理世界正在發生什么,得根據當前任務和過往經驗組織行動,得把一次次交互沉淀成可復用的技能,還得能在端側真正跑起來,這是我們目前要突破的技術核心。

第一是實時理解。具身智能體要一邊理解事件怎么發生,一邊決定下一步動作怎么觸發。比如倒水,水位到哪里該停生成新的動作,當下就要判斷。這里最難的是,認知復雜度很高,但又不能為了準確率犧牲實時性,所以我們一直在做流式視頻理解并發表Streammind、Em-Garde等系列工作,希望讓系統真正具備‘prompt the world’的能力。

第二是智能體本身的能力。光看懂還不夠,它還要結合過去的經驗記憶、當前的任務、環境觀測和歷史動作,持續維護一個內在持久狀態,知道下一步該拆成什么子任務、該生成什么輸入、該怎么把有限的具身能力高效使用。這部分我們也發表了AdaNav VLN等工作,通過自主思考維護內在狀態和任務拆解。

第三是記憶和經驗提取。對物理智能體來說,memory bank要和具體本體的能力邊界、動作結果和環境反饋一起工作。它要做的是在反復交互里不斷篩掉冗余和噪聲,把真正有用的經驗提煉成穩定的技能,同時維護一個前后一致的長期記憶。比如剛才提到的它記得‘某次走滑了’,在這類地面上應該小步走、減速走。這個方向我們發表了像AVA等工作,近期也將有更多成果展示。

最后是端側高效部署。物理智能體必須在端側實時感知、實時決策、實時執行,這就要求整個系統在算力、時延和能耗上都做到非常極致。我們把理解、決策、記憶和部署放在同一個閉環里一起做。這部分是我們組的傳統強項,發表了一系列如T-MAC、BitDistiller、Pregated-MoE、LUT Tensor core等出圈的工作,被一百多家媒體轉發,被集成到各種大模型推理框架,獲得幾萬顆星。

創投家:你們在上面幾個方向做到了什么程度?

曹婷:現在我們的前期驗證結果非常可觀,在業界和社區共認最難的長程復雜任務評測基準上,任務完成精度比行業里比較主流的方案高出兩三倍;在端側推理速度上,是主流方案的四倍以上。

更重要的是物理智能體持續演進的效果。我們做過實驗:機器人在一個環境里反復執行相似任務,每次失敗后從記憶里學習,任務精度持續提升,最高能提升超過20個百分點。這不是重新訓練,是真正的在線演進。

創投家:所以這些技術也會產業化?

曹婷:是的,我們正計劃孵化一家公司,把這些年積累的持續進化能力從實驗室帶到產業中去。目前還在籌備階段,在和一些投資人接觸。AIR本身就是產業研究院,只做論文不是我們的終點,技術要真的落地,有產業,有轉化,才算完成閉環。

創投家:做這件事,你們的優勢是什么?

曹婷:我覺得我們的優勢,首先是全棧。物理智能體落地不是單做模型就行,它一定是算法、系統、硬件一起協同,訓練、推理、部署都要打通,這個能力不是哪個組都具備的。我們過去長期做端側智能和高效推理,所以從一開始看這個問題,就會同時考慮它怎么訓、怎么跑、怎么真正部署到本體上。

我們也不是只會做論文。組里很多同學和合作伙伴都有頭部基模團隊的經驗,也一直在真實場景里打磨技術,所以從前沿模型到工程實現、再到產業落地,這條鏈路我們是比較完整的。另外更重要的就是現在清華AIR的平臺優勢。

清華的學生有頂尖的創造力,這在沒有現成答案的領域是稀缺資源。合作伙伴上,劉云新老師在AIoT和端側智能有二十年積累,IEEE Fellow,在微軟時我們就是同一個團隊的合作者,現在我們依舊在一起突破物理智能體技術。我們還有很多外部合作者,比如南大的吳昊研究員,他讀博士的時候就在我組里做research intern,工作后又來到MSRA訪問,我們一直緊密合作,現在他已經是中央部委高層次創新人才了。

當然還有清華AIR“產學研打通”的定位,讓我們能持續接觸企業真實場景的數據和需求,比如物流、能源、環境等中國特有的豐富場景,是研究物理智能體不可或缺的土壤。

創投家:你有沒有想象過,十年后具身智能是什么樣子?

曹婷:我不太喜歡把十年后的事情說得太具體,容易過于樂觀。我覺得具身智能可能像十多年前的電動車一樣,都處在一個關鍵拐點上:技術開始過線,產業鏈開始補齊,真實需求開始集中出現,政策也開始把它放到更高的戰略坐標里。一旦這幾股力量匯合,后面的發展往往會比很多人想得更快。今天大家看到的,可能還是一些單點能力和演示;十年后真正重要的,是它會不會變成制造、物流、能源、家庭服務這些場景里的默認能力。

到那個時候,人們關心的可能不再是‘這是不是具身智能’,而是它已經自然地在那里工作了。工廠里高危、重復、枯燥的任務被接過去,物流和巡檢系統可以更自主地運行,家庭里一些照護和輔助性的工作有人分擔,很多以前只能靠人硬扛的事情,開始有了新的解法。真正成熟的技術,最后都不是因為概念響亮,而是因為它改變了社會運行的方式。

所以我現在更關心的,是十年后我們能不能真的把一些重要場景做出來,讓物理智能體在真實世界里穩定工作、持續進化,變成社會基礎能力的一部分。如果這件事能發生,我會覺得今天做的很多選擇都是值得的。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
最高可判死刑!奧巴馬結局已定?美國司法部介入,特朗普準備收網

最高可判死刑!奧巴馬結局已定?美國司法部介入,特朗普準備收網

阿天愛旅行
2026-04-26 11:30:56
扮豬吃虎?隱忍四個月,委代總統撕下面具,率幾十萬大軍硬剛美國

扮豬吃虎?隱忍四個月,委代總統撕下面具,率幾十萬大軍硬剛美國

好賢觀史記
2026-04-23 16:53:57
伊朗戰爭,意外幫中國做了一件20年沒做成的事

伊朗戰爭,意外幫中國做了一件20年沒做成的事

三石記
2026-04-27 12:54:02
不露面不知道,一露面嚇一跳,這些明星怎么都老成這個樣子了

不露面不知道,一露面嚇一跳,這些明星怎么都老成這個樣子了

孤城落日
2026-04-20 19:26:14
半導體月漲39%!高盛對沖基金主管:互聯網泡沫以來從未出現,這個市場,我不會追

半導體月漲39%!高盛對沖基金主管:互聯網泡沫以來從未出現,這個市場,我不會追

華爾街見聞官方
2026-04-27 21:16:54
一個“過氣”APP,吃透已婚女人的錢包

一個“過氣”APP,吃透已婚女人的錢包

DT商業觀察
2026-04-21 11:58:59
男子趕集,聞見陌生姑娘身上有土腥味,道士說:快去找一盆黑狗血

男子趕集,聞見陌生姑娘身上有土腥味,道士說:快去找一盆黑狗血

千秋文化
2026-04-04 21:32:27
亞冠冠軍次數榜:新月4冠歷史第一;韓國球隊共12次奪冠最多

亞冠冠軍次數榜:新月4冠歷史第一;韓國球隊共12次奪冠最多

懂球帝
2026-04-27 12:29:18
西方為何不敢招惹中國?只因中越712炮戰,我軍1天發射3400噸炮彈

西方為何不敢招惹中國?只因中越712炮戰,我軍1天發射3400噸炮彈

鶴羽說個事
2026-04-25 22:19:50
隱婚生子?移民國外?央視主持李梓萌現狀曝光,傳聞終于真相大白

隱婚生子?移民國外?央視主持李梓萌現狀曝光,傳聞終于真相大白

不似少年游
2026-04-27 14:47:46
小玥兒過生日,張蘭汪小菲馬筱梅都保持沉默,冷落絕非本意

小玥兒過生日,張蘭汪小菲馬筱梅都保持沉默,冷落絕非本意

娛貝勒
2026-04-27 22:39:30
楊冪懷二胎了???

楊冪懷二胎了?。?/a>

八卦瘋叔
2026-04-27 10:49:40
青春風“豹”:中超最燃一戰,17歲首發+10名U23

青春風“豹”:中超最燃一戰,17歲首發+10名U23

劉哥談體育
2026-04-27 08:21:57
蛇吞象?生產殲-20的中國軍工巨頭174億就被收購了,用意耐人尋味

蛇吞象?生產殲-20的中國軍工巨頭174億就被收購了,用意耐人尋味

趣文說娛
2026-04-23 19:52:36
終于等到這一天!中國國防部發出最強音!

終于等到這一天!中國國防部發出最強音!

做個平凡的軒友
2026-04-27 06:55:08
65至85歲抓緊4月申報,錯過又要等一整年時間!

65至85歲抓緊4月申報,錯過又要等一整年時間!

小蜜情感說
2026-04-25 13:08:24
知名女星“瘦成皮包骨”引熱議!研究表明,極端節食會損傷腸菌,時間越長越傷身!

知名女星“瘦成皮包骨”引熱議!研究表明,極端節食會損傷腸菌,時間越長越傷身!

腸菌科普
2026-04-25 07:04:44
湖州南潯古鎮有艘“核動力觀光船”?景區回應:售票牌翻譯錯誤,會進行整改

湖州南潯古鎮有艘“核動力觀光船”?景區回應:售票牌翻譯錯誤,會進行整改

上游新聞
2026-04-27 13:01:24
表現沒有任何問題!開拓者敢不敢讓這位替補內線大閘進入先發?

表現沒有任何問題!開拓者敢不敢讓這位替補內線大閘進入先發?

稻谷與小麥
2026-04-27 22:38:02
何守信最新飯局個個都係影視圈猛人,多間公司CEO齊齊食飯

何守信最新飯局個個都係影視圈猛人,多間公司CEO齊齊食飯

粵睇先生
2026-04-27 19:42:05
2026-04-27 23:32:49
鈦媒體APP incentive-icons
鈦媒體APP
獨立財經科技媒體
132851文章數 862118關注度
往期回顧 全部

科技要聞

DeepSeek V4上線三天,第一批實測出來了

頭條要聞

水庫放水21人被困下游河灘 有人讓家人踩肩頭爬樹避險

頭條要聞

水庫放水21人被困下游河灘 有人讓家人踩肩頭爬樹避險

體育要聞

最抽象的天才,正在改變瓜迪奧拉

娛樂要聞

黃楊鈿甜為“耳環風波”出鏡道歉:謠言已澄清

財經要聞

Meta 140億收購Manus遭中國發改委否決

汽車要聞

不那么小眾也可以 smart的路會越走越寬

態度原創

時尚
藝術
房產
旅游
軍事航空

絲巾的10種系法,愛美的女人必看

藝術要聞

你絕對想不到,攝影能讓她成為女神!

房產要聞

信號!海南商業版圖,迎來大變局!

旅游要聞

聽過花開的聲音嗎?4月28日到5月10日去新天地!

軍事要聞

伊朗外長折返伊斯蘭堡內情披露

無障礙瀏覽 進入關懷版