網易首頁 > 網易號 > 正文 申請入駐

具身智能頂流圓桌:VLA難以解決機器人關鍵瓶頸

0
分享至

6月6日,2025北京智源大會開幕。在當天以具身智能為主題的圓桌環節中,幾家國內外知名的機器人企業代表出席參加,并發表了對行業的最新看法。本次圓桌嘉賓包括:

王興興|宇樹科技CEO

熊友軍| 北京人形機器人創新中心總經理

王 鶴| 北京大學助理教授、智源具身智能研究中心主任、銀河通用創始人兼CTO

盧策吾| 穹徹智能聯合創始人、上海交通大學教授、上海創智學院副院長

Karol Hausman| Physical Intelligence聯合創始人兼CEO

主持人:王仲遠| 智源研究院院長

RoboX對他們的鮮明觀點進行了篩選摘要,整理如下:

再談人形載體

王興興:過去幾年,我在一些活動中已公開說過多次,我并不堅持一定要做人形。對于宇樹來說,做機器狗和人形其實都是順理成章的事情。

在下肢層面,輪子、底盤都還是非常實用的。之所以大家現在喜歡用人形,尤其是上半身人形,還是主要因為現在的AI多數還是基于人的數據來進行采集和訓練,讓機器人與人體動作保持一致,數據采集會方便很多。另外,如果不做成人形,跳舞或者格斗基本都沒辦法做成。

不過,在真正AGI實現后,機器人會產生千奇百怪的形態,甚至可能比現在要多100倍。

熊友軍:我同意王興興的說法。具身智能的形態不一定局限于人形,人形只是具身智能里面一個比較好的載體。不過我比較認可人「形機器人應該是具身智能研究的最佳載體」,這是從未來市場容量這方面來考慮的。

1、未來機器人最大的市場應該是商用服務場景,包括家庭場景。今天工廠的應用場景只是一個開胃小菜。

2、從人機交互來看,人形的交互更自然,更容易被人接受。

3、我們所處的環境大部分都是為人類設計的,人形機器人在部署的過程中,適應起來是更加便利的。它可以方便地使用我們的工具,不需要做太多改造。

所以從這幾個角度來說,人形機器人應該是最好的一種選擇。

我明白大家的顧慮是覺得目前人形的成本和技術不占優勢,但如果放在一條長的時間線上來看的話,我堅持人形一定還會是一個較好的載體。

VLA只是一個起點

王鶴:自動駕駛驗證了一件事情,就是端到端的方案具備更好的擴展性。它能通過數據去真正地驅動模型,而不是靠無窮無盡的規則。

這條路其實自動駕駛走了很多年,但是現在鋪開的在全國各地都能開的車,其實不是通過模塊化的方案,而是端到端的。

從這個角度上講,VLA的意義在于什么?

VLA可以通過視覺觀測、自然語言下達的命令等信息,端到端地輸出動作,不經過任何的中間產物。它能夠真正地充分吸收數據背后的知識,發揮出最大的性能,而不受制于一些模塊化方案中間階段的誤差,以及無窮無盡的規則兜底等問題。

那么VLA究竟要突破什么?我相信也是有不同的觀點的。有些人認為應該把人類能做的一切事情,都快速地做進VLA,然后形成一個基座模型。

我覺得這是有點太著急了:我們人類其實除了視覺輸入,還有觸覺、聽覺、嗅覺、味覺,和溫覺。

所以VLA只能是一個起點

要真想做到人類級別的具身智能,那只能不斷地融合新的模態。目前最適合做的,就是移動、抓取和放置。這幾個技能基本以視覺為主,末端再加上觸覺或力覺的傳感器,就能夠很好地執行。

而且它在工業、商業服務中有非常廣泛的應用。如果我們能把這樣的VLA先做好應用,在各種場景里都能部署進去,我們就會見證具身智能第一個真正高潮的到來。

盧策吾:V代表理解世界,L溝通交互,A改變世界,這是集合了機器人這幾年要干的事情。

而且這里的L很妙——語言是一種粘合劑,她能通過數據將各種高層應用連接在一起。

它確實有很好的擴展性,但也存在很大的限制,需要我們去推進。

我們也會想要星辰大海,走向通用智能,但相比于無人車來說,機器人的任務和交互復雜度太高了。所以,如果想做通用,那就得要壓縮它的不確定性。

VLA相當于是火鍋底料,現在只能清湯寡水,服務一部分人。要想服務更多人,我們需要不停地在里面加東西,也就是更多額外的信息,使得VLA更加powerful,能在兼容的框架里加更多的信息,壓縮不確定性。

在這樣的端對端的模型里,壓縮的方式有很多種。比如穹徹一直在做的力反饋。有了力反饋之后,它的穩定性會更高。

另外,在理解世界層面,如果能在視覺基礎上,加深對物理層面的理解,那也可以進一步地壓縮不確定空間。

所以在穹徹第二版的大腦中,又加了很多東西:比如優化數據資產的方法,以及力反饋帶來的新的試驗模型,數據需求量會大大下降。

我們很期待找到更聰明、更加理解世界的方式,一步一步推進到通用的拐點。

Karol Hausman:我認為目前仍存在一些瓶頸。最大的一個瓶頸就是這些模型的成功率尚未達到必要的水平。這不僅僅是收集數據的問題,似乎還需要在算法上進行一些改進。

我認為,即使我們擁有無限量的數據,也無法僅憑現有的算法,在復雜、長期且需要高度靈巧的任務中實現100%的成功率。

我認為這需要新的技術,這也是我們正在努力解決的問題。

如果你幾個月前問我這個問題,我會說最大的瓶頸是泛化能力。但基于PI已經分享的成果,我相信我們已經掌握了如何改進泛化能力的方法。而且我認為,解決泛化能力問題的答案主要來自于數據。

然而,當涉及到性能問題時,我認為這更多是一個算法問題,而非數據問題。

各企業的最新進展

王興興:無論是在春晚上的集群表演,還是格斗比賽,我們都希望給大家展示出當前的機器人技術發展狀況,也希望帶動整個行業的發展。

目前機器人還不能直接去家里或工廠干活,但在實現之前,我們已經取得了一些技術成果,也進行了一些商業化拓展及嘗試。

我相信類似于機器人格斗的賽事,明年會成為在全球都備受歡迎的體育賽事。

(在現場,參加機器人格斗競技的宇樹G1上臺進行了拳擊表演,擬人度與靈活度極高。)

熊友軍:天工1.0在半程馬拉松比賽上,跑出了2小時40分的成績,被證明是最能跑的機器人。而我們希望天工2.0能做更多的事情,所以重點升級了上肢部分,所以它有更多的自由度,同時加裝了靈巧手,也有了更多的負重能力。

這是一次系統性的更新,包括了4方面平臺能力的升級:

1、硬件平臺:主打草地、沙地、丘陵、石子等各種路形地面的適應能力。

2、大腦升級:今年3月,北京人形機器人創新中心發布了通用的具身智能「慧思開物」平臺,它是一腦多機的平臺,包含了具身智能的大腦和小腦。

3、中心構建了大型的數據采集和機器人訓練中心,包含了20多個場景,方便虛實結合的數據采集。

4、中心構建了數據采集處理、服務人才培養的一整套體系,用來升級不斷迭代和升級慧思開物的智能體。

(在現場,熊友軍用語音指令讓天工2.0「準備一些茶點」,后者聽懂指令并選取了幾種食品)

王鶴:今年我們利用VLA技術,打造了適用性更強的端到端具身大模型,更貼近一般商超貨架的這樣的場景。

該模型能夠對貨架上琳瑯滿目的、形態各異貨品進行識別抓取。

從技術特點來看,我們不同于PI,訓練數據主要使用了合成數據,而且是價格非常的低廉、能夠擴增的合成數據。

(王鶴用一臺輪式底盤的人形機器人進行了演示,他通過語音指令,讓機器人從密集的貨架上,成功取下安慕希酸奶和果粒爽果凍。)

盧策吾:我們去年發布了穹徹具身大腦的V1版本,接下來會在7月發布V2版本,新版本體現了對于世界物理的理解和交互。

這里我們要強調力反饋——人類在做很多動作的時候,其實人都是下意識的。

比如刮胡子就是一個很典型的案例,在連續接觸皮膚的過程中,力氣大一點的話會刮傷皮膚,力氣小一點又會刮不干凈,所以力反饋就是魯棒性極高的、模仿人類的下意識動作的關鍵技術。

還有一個案例是挖冰淇淋。它每次抓取時都需要應對變化,動作要非常精確。尤其當凍得比較硬的時候,如果不具備力反饋,是挖不出來的。

接下來,將力反饋擴展到生活場景中是非常必要的,比如照顧人時幫忙擦臉、按摩等多種交互。

(盧策吾還演示了刮冰淇淋的人形機器人,并表示該功能已經在食品加工行業批量化落地。)

Karol Hausman:我覺得目前機器人還遠未達到應有的水平。我們希望將機器人通用大模型提供給所有人,讓那些正在執行實質任務、改變世界的機器人都能從中受益。

在很長一段時間里,我們都認為讓機器人適應一個完全陌生的環境是不可能的。

在此背景下,我們選擇以終極挑戰——家庭環境作為測試場景。對我們而言,這就是檢驗其泛化能力的最高標準——工廠環境往往比較相似,但家庭環境卻并非如此。

在開展這項研究時,我們面臨一個重大問題:機器人需要見識多少種不同的數據,才能具備在全新家庭環境中泛化的能力?結果發現,這個數字其實并不大

我們發現,機器人只需見識100個不同的家庭,就能具備在第101個家庭環境中泛化的能力。

當然,這并不意味著每次都能成功,機器人仍然會經常失敗,但我認為這已經展現出了非常好的前景——或許我們并不需要那么多的數據,機器人也不需要見識數據集中如此龐大的多樣性,就能真正具備泛化能力。

我們才剛剛起步,但這已經是一個極具希望的跡象,也是我們未曾預料到的。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
中組部有關負責同志宣布中央決定:陳東明履新

中組部有關負責同志宣布中央決定:陳東明履新

上觀新聞
2026-04-24 17:21:07
馬齒莧立功!研究發現:其天然成分4周降脂33%,還能減少血管斑塊

馬齒莧立功!研究發現:其天然成分4周降脂33%,還能減少血管斑塊

思思夜話
2026-04-25 11:16:17
曝24歲美女謝垚心梗去世,經常跑半馬,父親痛別,帶女兒照片看海

曝24歲美女謝垚心梗去世,經常跑半馬,父親痛別,帶女兒照片看海

天天熱點見聞
2026-04-23 19:23:09
10國簽反華協議!沉默一天后,中方出手,不得未經允許接受美資

10國簽反華協議!沉默一天后,中方出手,不得未經允許接受美資

清歡百味
2026-04-25 16:25:29
全紅嬋瘦了一圈后首露面!距亞運選拔僅剩41天,抉擇引全網牽掛

全紅嬋瘦了一圈后首露面!距亞運選拔僅剩41天,抉擇引全網牽掛

行者聊官
2026-04-25 14:50:51
商務部新聞發言人就歐盟第20輪對俄制裁列單中國企業答記者問

商務部新聞發言人就歐盟第20輪對俄制裁列單中國企業答記者問

界面新聞
2026-04-25 19:51:38
烏度卡談最后崩盤:我不知道他們是太年輕,還是懼怕關鍵時刻

烏度卡談最后崩盤:我不知道他們是太年輕,還是懼怕關鍵時刻

懂球帝
2026-04-25 12:18:07
上海人終于體會到了引進印度人的“快樂”!

上海人終于體會到了引進印度人的“快樂”!

步論天下事
2026-04-25 09:34:47
德云社墨爾本團建,董事長王惠和郭汾陽都在,郭德綱的莊園真氣派

德云社墨爾本團建,董事長王惠和郭汾陽都在,郭德綱的莊園真氣派

以茶帶書
2026-04-25 15:06:21
破中國球員8年季后賽數據荒!楊瀚森37秒1籃板 兩場季后賽仍0分

破中國球員8年季后賽數據荒!楊瀚森37秒1籃板 兩場季后賽仍0分

醉臥浮生
2026-04-25 13:30:20
雅迪電動車集體鎖死:智能系統的代價

雅迪電動車集體鎖死:智能系統的代價

算力游俠
2026-04-23 15:12:24
賴清德飛機被拒,美國急得跳腳:你連領空都不給過,我這“站臺”站了個寂寞?

賴清德飛機被拒,美國急得跳腳:你連領空都不給過,我這“站臺”站了個寂寞?

兩岸觀點
2026-04-23 12:30:15
四川成都一小區火災致5死2傷,深圳電動車早就不能進樓棟了

四川成都一小區火災致5死2傷,深圳電動車早就不能進樓棟了

九方魚論
2026-04-25 14:29:53
雷克薩斯全新一代ES:不做越級,而做躍級

雷克薩斯全新一代ES:不做越級,而做躍級

網上車市
2026-04-24 21:32:03
醫院判定腦積水 7歲“腦癱”男童被查出出生就遭受顱骨骨折

醫院判定腦積水 7歲“腦癱”男童被查出出生就遭受顱骨骨折

大象新聞
2026-04-25 10:21:09
30多家法院集體引用一部“空氣法”:這不是荒唐劇,是恐怖片

30多家法院集體引用一部“空氣法”:這不是荒唐劇,是恐怖片

迷世書童H9527
2026-04-25 14:15:25
深圳女子公交站臺勸滅煙時起沖突,當事人:涉事男子已道歉,事發地點是禁煙場所

深圳女子公交站臺勸滅煙時起沖突,當事人:涉事男子已道歉,事發地點是禁煙場所

封面新聞
2026-04-25 18:52:13
山西村支書駕鏟車掩埋村民,現場有多名民警。被埋村民仍在住院

山西村支書駕鏟車掩埋村民,現場有多名民警。被埋村民仍在住院

聽心堂
2026-04-24 21:15:50
張軍失聯前的荒誕細節:老婆去要人

張軍失聯前的荒誕細節:老婆去要人

魯八兩
2026-04-25 14:43:09
良品鋪子墜入深淵:連虧兩年、股東出逃、債務暴雷,困局難破

良品鋪子墜入深淵:連虧兩年、股東出逃、債務暴雷,困局難破

深潛atom
2026-04-24 10:08:58
2026-04-25 20:08:49
RoboX
RoboX
關注智能汽車、機器人在內的具身智能前沿科技
246文章數 2關注度
往期回顧 全部

科技要聞

DeepSeek V4發布!黃仁勛預言的"災難"降臨

頭條要聞

現場視頻:殲-15掛彈起飛硬剛外軍航母編隊滋擾

頭條要聞

現場視頻:殲-15掛彈起飛硬剛外軍航母編隊滋擾

體育要聞

火箭0-3觸發百分百出局定律:本季加時賽9戰8敗

娛樂要聞

鄧超最大的幸運,就是遇見孫儷

財經要聞

90%訂單消失,中東旺季沒了

汽車要聞

2026款樂道L90亮相北京車展 樂道L80正式官宣

態度原創

數碼
教育
健康
手機
親子

數碼要聞

雷達感應自動開關燈,Yeelight新品來了

教育要聞

我國“就業率逼近100%”的5所雙非大學,500多分就能上!

干細胞如何讓燒燙傷皮膚"再生"?

手機要聞

W16周排名出爐:vivo第四、小米第五,冠軍還是它

親子要聞

我國兒童腫瘤生存率首次納入年報體系!5年達76%,不同癌種差異顯著

無障礙瀏覽 進入關懷版