无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

“VLA和世界模型都不是終局,會有物理世界獨有的模型”

0
分享至

大模型的爆發,吃的是互聯網幾十年積累的數據紅利。

可當AI從數字世界邁向物理世界,螞蟻靈波科技首席科學家沈宇軍發現:機器人的數據,幾乎還是一片空白

此前,他曾在公開演講中率先提出AIGA的概念——AI 2.0下半場,人工智能要從數字世界的“娛樂”走向物理世界的“干活”,從Content(內容)生成走向Action(動作)生成。

在2026中國AIGC產業峰會的GenAI Talk環節,沈宇軍與量子位聯合創始人兼總編輯李根圍繞這一話題展開了一場深度對話,主題為《AI 2.0下半場:從AIGC到AIGA》。

也正是從“數據”這條主線出發,他拋出了一個讓現場做VLA、做世界模型的人都“小小一震”的判斷:

單獨的VLA和世界模型,都不會是具身智能的終局

就像人類既能把各種信息融合在一起,也會預測未來事情的走向,從智能的角度,二者勢必要結合,缺一不可。

而它們最終會走向什么?沈宇軍目前給出的答案是——一個獨屬于物理世界的模型



為了完整體現沈宇軍的思考,在不改變原意的基礎上,量子位對演講內容進行了編輯整理,希望能給你帶來更多啟發。

2026中國AIGC產業峰會是由量子位主辦的行業峰會,近20位產業代表與會討論。線下參會觀眾超千人,線上直播觀眾近400萬,獲得了主流媒體的廣泛關注與報道。

核心觀點梳理

  • 大模型踩中了互聯網過去幾十年的數據紅利,但機器人的物理世界數據還存在很大的空白,AI下半場更關鍵的是數據如何從數字世界過渡到物理世界
  • 想要做存在于物理世界的通用機器人大腦,關鍵的一環是空間感知能力。如何把傳感器的輸入變成更好的信息傳遞給模型,從傳感器的輸入開始去理解這個世界,很關鍵。
  • 對于VLA和世界模型的技術路線之爭,首先無論技術路線怎么演進,數據都是離不開的。其次,這兩條路都不會是終局。機器人數據量積累到一定程度的時候,二者一定會走向融合,催生出獨屬物理世界的模型。
  • 判斷:1~2年后,會出現一些標桿樣例,讓模型真實投產;2~3年,該樣例會被批量復制,越來越多產業會應用模型;在這之后,機器人會嘗試以某種方式進入C端;然后逐漸真正普及到家庭。
  • 人人都能為機器人產生數據的時候,就是具身智能的ChatGPT時刻。

以下為對話全文:

“大模型踩中了互聯網幾十年的數據紅利”

李根:AIGC上半場大家都在談焦慮,但看得更遠一點,方向確定后,剩下的就是實踐。我們每年都希望找一位既有學術前沿洞察,又是產業實踐者的嘉賓——既懂Know,也懂Know how。沈博就是這樣的嘉賓。我們先從過去到現在,AI 2.0從ChatGPT起步,經歷了寫作、畫畫到編程,你怎么看這條路徑?



沈宇軍:大模型從ChatGPT的突破起步,最開始大家覺得好玩,后來慢慢走向實用,尤其是最近Coding能力的爆發。我本身做機器人行業,從這個視角看,大模型其實是踩中了互聯網過去幾十年積累的數據紅利

怎么說呢?互聯網積累了海量的文字、圖像、視頻素材,這些數據恰好碰上了算力的發展,兩者融合到一起,在爆發的時候正好把互聯網幾十年的數據積累用起來了。

再進一步看,自動駕駛也發展了將近十幾年,慢慢積累了屬于自己的數據——從最初車上沒那么多傳感器,到現在人類開車時數據可以被自動記錄下來。反觀機器人行業,數據目前還是一個很大的空白。我們沒有幾十年的互聯網積累,也沒有十年的自動駕駛沉淀,機器人現在的數據非常短缺。

有人說AI終于走到下半場,從數字世界往物理世界走,我們也提出了AIGA(AI生成Action)的概念。但做模型的核心其實是在做數據。我覺得更關鍵的問題是:數據到底怎么演變?怎么讓數據真正從數字世界過渡到物理世界?

李根:所以物理空間的數據是空白,也是新大陸?

沈宇軍:對。過去一年本體廠商越來越多,本體本身發展得也不錯。今年能看到一個明顯的趨勢:各種各樣的數據采集方式開始涌現。這說明大家逐漸意識到,具身智能——具身是一部分,智能是一部分——要做智能就離不開數據。只是大家還沒想清楚:物理智能到底需要什么樣的數據?以及怎么盡可能地把數據標準化?

標準化是很重要的事。Call back一下,大模型的成功很大程度上得益于互聯網把數據標準化了。Coding、對話這些領域,互聯網已經搞得非常好了,現在更多是去享受這個紅利。

但到了物理世界,從眼下五花八門的數采方式來看,大家雖然意識到了數據的重要性,卻還沒有找到那條最正確的路。我相信在不遠的將來,數據這件事也會逐漸收斂。

“AIGC還不夠,模型要能生產生產力”

李根:你們提出了AIGA的應用范式,能分享一下嗎?為什么提AIGA?

沈宇軍:還是從模型落地的角度來講。大家從最開始做Chat,到現在做Coding,模型正在慢慢往生產方向遷移。在數字世界,編程、內容創作都是很好的生產方向。但我們畢竟活在物理世界,真正想要的有體感的服務,還是需要物理世界中的具體交互。

所以我們覺得只有AIGC可能還不夠。到最后,智能到底能不能幫我們解決一些具體的問題?大家都說Agent,Agent能在數字世界幫我們解決很多流程問題、調用一些工具,但很多讓人真正有體感的東西還是要有操作。比如我現在就是想喝一杯咖啡——這個場景可能有點老生常談了。

尤其我們做具身的,更希望這個模型不止能生產內容,更能生產所謂的生產力



李根:這個生產力有什么樣的想象力和落地場景?

沈宇軍:這應該是過去一段時間行業一直在探討的。比如,機器人已經進入工廠、物流、倉庫,去搬貨、做分揀。我們也和本體廠商合作,在這些場景中做了一些探索。前不久,我們的機器人還進入了藥房的線下零售門店。

如果真的有幸能看到那么一天——機器人發展得非常好、非常智能——那生活中的方方面面都可以落地。舉個例子,剛才上臺前,需要工作人員把椅子搬上來,工作人員要專門在那里等著。如果時間上有調整,他就得一直在旁邊等著。

如果有一天這件事機器人能做,它站在那里也無所謂,它知道什么時候該上場,并且把事做好,那就能釋放出很多勞動力,讓大家去做更有價值的事情。我相信機器人會逐漸滲透到生活的方方面面。

李根:所以每一個需要人的地方,未來都可能有機器人替代或執行?

沈宇軍:對,我覺得更多是把人釋放到更需要人的事情上,比如創造、文化這些更偏人類活動的方面,而不是去做枯燥重復的體力活。

“靈波的定位是做通用大腦,有點像手機的操作系統”

李根:螞蟻靈波的技術選擇和定位是什么?

沈宇軍:靈波的定位比較清晰:做智能側。怎么理解?

我打個不一定恰當的比方——有點像手機的操作系統。在我們看來,機器人不管是進入企業還是進入千家萬戶,大家對硬件的訴求一定是不一樣的,不可能只有一款統一的機器人。就像大家用手機,華為、小米、蘋果,各有各的偏好,這是個性的需求。企業更是如此:有的地方需要力氣大的機器人,有的需要更敏捷的機器人。

但這些機器人有一個共同的需求:智能。智能不是工業機器人那種按固定軌跡、在固定時間做固定的事。生活中很多事是隨機的,智能的含義就是要能應對這些隨機性。像我剛才說的,大會時間調整了,它能不能知道什么時候該上場搬椅子?這是一個簡單的例子。

所以靈波的定位很清晰:我們希望做一個相對通用的“大腦”,讓所有機器人在這個大腦下更好地完成任務



物理世界相比數字世界有兩個優勢。

第一,模態肯定更多——有聽覺、溫度、觸覺等等。這些模態在數字世界不太好獲得,但不代表它們不重要,因為很多時候智能正是通過越來越多的模態疊加來實現的。現在數字世界講多模態,其實還是逃不開文本、圖像、視頻、聲音。你能讓它感受到“力”嗎?不太能。所以物理世界因為模態更豐富,反而可能催生出更強的智能。

第二,物理世界能拿到真實的反饋。在數字世界,任務大多是人為定義的——人給一個標準,希望模型給出某種輸出。但在物理世界,很多東西是大自然定義的:比如一個蘋果,你松手它一定會落地,不需要任何人定義,這是現實規律。因為有了與物理世界的連接,智能很可能能從現實里直接學習,甚至超出人為設定的損失函數或獎勵函數。

基于這兩點優勢,物理智能的想象空間非常大。當然,目前變量太多,需要驗證的東西也太多,很多因素耦合在一起,行業會先分出很多派別,但慢慢一定會收斂。

“VLA和世界模型都不是終局,會有物理世界獨有的模型”

李根:總結一下,靈波做的是宇樹等本體廠商的補充,提供大腦/操作系統;物理AI可能催生更本質的智能。現在大家對路線有不同探討,比如VLA、世界模型等。你怎么看?

沈宇軍:回答VLA之前,我先說一下對具身智能技術路線的整體判斷。

大家經常討論怎么做模態融合,主要是VLA和世界模型兩條路。但我想提另一個點——靈波要做通用大腦,而且是存在于物理世界的大腦,我們布局中有一個很關鍵、但行業很少提到的環節:空間感知能力,也有人叫空間智能

機器人生活在物理世界,輸入來自各種傳感器,不是簡單的文字或照片。物理世界有深度、距離、力等傳感器。把這些輸入變成有效信息,是具身智能非常重要的一環。但現在大家更熱衷于討論最核心的那塊——怎么把傳感器輸入變成更好的信息傳給模型,反而容易忽略輸入端。

我的看法是,不管最終核心模型的技術路線怎么變,從傳感器輸入開始更好地理解這個世界,是非常關鍵的。靈波在做具身大腦的過程中,很關鍵的一環就是從輸入端開始,做好空間感知。

再回到大家最愛聊的核心部分。今年1月底我們對外講了一些看法,兩條路線我們都摸過:VLA和VA(現在也叫WAM,世界動作模型)。

我的體感是:第一,核心還是數據。不管范式怎么變,把數據摸清楚是關鍵能力。現在大家喜歡提數據量——幾萬小時、十幾萬小時,甚至百萬小時。但只提數量不提質量是不科學的。到底什么樣的數據是好數據?這很關鍵。

我們過去做VLA,很重要的一件事就是把數據這條路趟通——拿到一條數據,該怎么處理、該不該送給模型,這是核心鏈路。不管技術路線怎么演進,數據是逃不開的。

第二,我們兩條路都摸了,我的判斷是:兩條路線都不會是終局。為什么?因為VLA和世界模型解決的是不同問題。VLA擅長人機交互,它是從多模態模型往后延伸一步,相當于多模態模型在物理世界的應用。世界模型則像視頻生成模型往物理世界的應用,更擅長對未來的判斷。



我覺得人類這兩方面能力都具備:一方面能融合各種信息,另一方面對未來有預判,做事之前會大概想想結果會怎樣。對機器人而言,這兩種能力必須結合,缺一不可——不能只能預測未來卻無法融合模態,也不能只能融合模態卻無法預測未來。

在我看來,VLA在產業界更好落地、效率更高,所以做的人更多。但世界模型如果真能預測未來,對機器人一定有幫助。我判斷,當機器人數據量積累到一定程度時,這兩條路線一定會深度融合。

這種融合甚至不是像現在這樣——把數字世界的模型拿來做物理應用,而是可能催生出物理世界獨有的模型。這個模型從一開始就是基于物理世界更多模態設計的,專為機器人應用而生。它可能不能跟人對話,但能更好地執行任務。

總結起來還是三點:第一,物理智能離不開傳感器輸入的空間感知,靈波會從輸入端開始,讓機器人更好理解世界;第二,不管技術路線如何演進,數據是逃不開的,我們要把機器人需要的數據研究明白,甚至推動制定標準;第三,現在大家討論的技術路線都不是終局,未來一定會有物理世界獨有的模型出現。

“人人都能為機器人產生數據時,就是具身智能的ChatGPT時刻”

李根:謝謝沈博如此不繞彎子,那么具身大腦的發展節奏和里程碑是什么?

沈宇軍:短期看有幾個變化。一是硬件會越來越收斂——不是形態收斂,而是供應鏈會收斂,變成模塊化的東西,不再完全耦合在一起。硬件和傳感器會越來越標準化。二是數據的標準也會越來越收斂。

這兩點收斂后,模型層面的技術路線爭論會越來越激烈。因為前兩樣定了,變量就在建模上。模型爭論一段時間后,范式可能也會收斂。模型收斂之后,會反向推動硬件進行一次升級——那時的硬件已經不是上一代的了,而是專門為具身智能打造的下一代硬件。就像這樣的周期:硬件震蕩、收斂,然后模型迭代。這是可以期待的。

從產業落地角度看,也應該有一些期待。今年到明年,會有一些標桿案例讓模型真正投產,不再是demo,而是投入商業應用。2-3年后,這些案例會被批量復制,越來越多產業會用到模型。之后,機器人會嘗試以某種方式進入C端,可能不是所有事都能做,但能找到一個切入點。然后逐漸進入家庭,就像現在新能源車一樣普及開來。

李根:什么時候會出現具身智能的“ChatGPT時刻”?

沈宇軍:大模型的訓練是一個持續過程,從GPT 1.0、2.0到3.0。但Chat為什么成為標志性時刻?因為它真正走進了千家萬戶,人人都能用、都能體驗到。類比到具身智能,什么時候能讓大部分人參與進來,那就是我認為的具身智能的ChatGPT時刻。

參與有兩個層面。最直觀的理解是具身智能普惠到每個人——那個可能還比較遙遠。但在那之前還有一個階段:數據階段。就像現在大家開車,會為自動駕駛提供人類駕駛經驗一樣。

什么時候能有一個數據標準,讓我們每天的行為都可以成為訓練機器人的數據?當人人都能為機器人產生數據的時候,在我看來,那就是具身智能的ChatGPT時刻



李根:你覺得這個還有多長時間?

沈宇軍:現在已經有好多做數據的公司出來了,只是流派不同。接下來一兩年,應該是做模型的公司和做數據的公司之間磨合的過程。因為數據標準一定是由模型來定義的,但模型提出的需求,硬件迭代也需要周期。經過一兩年磨合,大概在2028年左右,可以期待每個人都能成為具身智能的數據提供方

從那一刻開始,具身智能的腳步會走得更快一些。

李根:那會不會同時出現類似安卓和iOS的操作系統?

沈宇軍:對,現在已經有這個區分了。靈波走的是通用大腦路線,也有一些公司比如特斯拉,既造自己的本體,也做自己的大腦——模型專門為本體服務。機器人就像手機一樣,大家不可能都用同一款,因為總有個性化訴求。所以我們比較堅定地走通用大腦模式。

李根:所以螞蟻靈波希望成為機器人時代的安卓系統?

沈宇軍:對,這是我們的一個美好愿景。

李根:總結一下,AI 2.0下半場隨著物理世界開拓而展開,范式從AIGC走向AIGA。數據是核心,技術路線正在收斂,2028年左右可能迎來具身大腦的收斂。螞蟻靈波志在成為其中的安卓。謝謝沈博!

沈宇軍:謝謝!

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
AI 編程終于有全局視野了!3 萬 Star 項目補齊最大短板

AI 編程終于有全局視野了!3 萬 Star 項目補齊最大短板

鈦媒體APP
2026-05-30 10:22:27
為什么今年沒人提“消費降級”了?

為什么今年沒人提“消費降級”了?

黯泉
2026-05-20 17:47:21
董卿被傳離婚6年后,婚姻真相大白,如今隱居上海,低調陪父母

董卿被傳離婚6年后,婚姻真相大白,如今隱居上海,低調陪父母

尋墨閣
2026-04-16 02:57:15
1998年數萬華人遭屠殺,中國為何沒出兵?26年后答案讓人沉默

1998年數萬華人遭屠殺,中國為何沒出兵?26年后答案讓人沉默

哄動一時啊
2026-02-17 22:21:25
原來他們是父子,《主角》他是星二代,弟弟也是演員,1家人太像

原來他們是父子,《主角》他是星二代,弟弟也是演員,1家人太像

娛君墜星河
2026-05-30 15:35:10
恭喜廣東隊!上海最強控衛被朱芳雨截胡,近10年后衛線最強一簽!

恭喜廣東隊!上海最強控衛被朱芳雨截胡,近10年后衛線最強一簽!

緋雨兒
2026-05-31 09:37:58
電車的“免費午餐”結束了:養路費改革的必然與公平

電車的“免費午餐”結束了:養路費改革的必然與公平

民間胡扯老哥
2026-05-30 06:39:32
賈玲的最新動作!侯明昊給虞書欣抬轎!

賈玲的最新動作!侯明昊給虞書欣抬轎!

八卦瘋叔
2026-05-31 09:35:22
不要忙著打日本,中國應該去全國各地的武器倉庫突擊大檢查

不要忙著打日本,中國應該去全國各地的武器倉庫突擊大檢查

阿七說史
2026-05-21 15:45:10
陪玩陪睡都是毛毛雨!王思聰前女友曝“丑聞”,王家徹底坐不住了

陪玩陪睡都是毛毛雨!王思聰前女友曝“丑聞”,王家徹底坐不住了

一曲一場談
2026-04-09 13:56:12
海南一三甲醫院空調外機安在室內走廊,患者吐槽“看病比室外還熱”,院方回應

海南一三甲醫院空調外機安在室內走廊,患者吐槽“看病比室外還熱”,院方回應

上游新聞
2026-05-30 16:05:05
又是“科技與狠活”!繼泡藥楊梅后又一水果塌房,我們還能吃什么

又是“科技與狠活”!繼泡藥楊梅后又一水果塌房,我們還能吃什么

蜉蝣說
2026-05-30 23:31:05
周亦卿家族46億爭產案開庭,大姐狀告五妹,不滿吳家樂妻獨獲股份

周亦卿家族46億爭產案開庭,大姐狀告五妹,不滿吳家樂妻獨獲股份

樹娃
2026-05-30 14:30:13
阿爾維斯:在監獄里打掃衛生賺113歐元,比踢球賺數百萬歐更重要

阿爾維斯:在監獄里打掃衛生賺113歐元,比踢球賺數百萬歐更重要

畫夕
2026-05-30 07:14:08
我們為什么養出了一堆沒有教養的“廢物”?

我們為什么養出了一堆沒有教養的“廢物”?

教育人陳志文
2026-05-25 11:24:47
科學家挖出2000年前種子,嘗試種植后,竟長出滅絕1500多年的植物

科學家挖出2000年前種子,嘗試種植后,竟長出滅絕1500多年的植物

春風秋雨
2026-05-27 19:25:06
喜訊!重量級歸化終于在本輪代表申花替補登場,曾效力五大聯賽

喜訊!重量級歸化終于在本輪代表申花替補登場,曾效力五大聯賽

劉笤說體壇
2026-05-31 10:59:00
香會第二天,美防長就全盤托出,美國已認知到中國的能力與實力

香會第二天,美防長就全盤托出,美國已認知到中國的能力與實力

史行途
2026-05-31 10:44:22
信號中斷、燒成火球!神舟二十二號返回遭黑障區,過程有多驚險?

信號中斷、燒成火球!神舟二十二號返回遭黑障區,過程有多驚險?

甜到你心坎
2026-05-30 16:34:25
劉愷威新戀情曝光,女方胸挺屁股翹,兩人十指緊扣大方與人打招呼

劉愷威新戀情曝光,女方胸挺屁股翹,兩人十指緊扣大方與人打招呼

凡知
2026-05-29 16:46:20
2026-05-31 11:27:00
量子位 incentive-icons
量子位
追蹤人工智能動態
12710文章數 176474關注度
往期回顧 全部

科技要聞

戴爾諾基亞又回來了!AI重估老牌科技公司

頭條要聞

稻城亞丁景區是否有權在省道上"設卡" 央媒調查

頭條要聞

稻城亞丁景區是否有權在省道上"設卡" 央媒調查

體育要聞

巴黎再度捧起歐冠獎杯 槍手眾將黯然神傷

娛樂要聞

賈玲最新動作!侯明昊給虞書欣抬轎!

財經要聞

字節跳動的 "一盤大棋"

汽車要聞

900V+3.2秒破百 領克10+&領克10上市16.99萬元起

態度原創

游戲
親子
本地
健康
手機

PS5獨占《漫威金剛狼》售價曝光!疑似即將開啟預購

親子要聞

人能自私到什么地步?網友:把寶寶退燒藥喝了,說孩子可以再生

本地新聞

用剪紙的方式,打開江蘇揚州

嘗試干細胞療法如何避免踩坑?

手機要聞

nova十周年大作!華為nova 16系列下周亮相:頂流代言+麒麟9系芯片

無障礙瀏覽 進入關懷版