无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

英偉達把8個AI和8臺機器人關在一起,它們學會了自己做實驗

0
分享至



如果未來的機器人實驗室里沒有人類研究員,會發生什么?

今天,英偉達高級研究科學家、具身智能負責人 Jim Fan 公布了一個名為 “ENPIRE ”的新項目。在這個實驗室里,8 個 AI coding agent 與 8 臺機器人組成了一支“科研團隊”:它們自己設計實驗、自己修改代碼、自己驗證結果,并持續優化機器人策略,而人類研究員只負責設定目標和觀察結果。


圖|ENPIRE 機器人實驗平臺(來源:NVIDIA)

8 個實驗單元上,各自配備了兩條 6 自由度 YAM 機械臂、一臺 Intel RealSense 深度攝像頭,以及一臺搭載單塊 NVIDIA RTX 5090 顯卡(32GB 顯存)的工作站。所有訓練、推理和 agent 運行均在本地完成,沒有依賴共享計算集群。

研究團隊同時測試了 Codex、Claude Code 和 Kimi Code 三種 coding agent。在模擬環境中三者都能夠完成任務,但在真實機器人上的表現存在明顯差異,其中 Codex 整體表現最好,達到目標成功率所需時間最短。

Jim Fan 將其稱為“AutoResearch(自動科研)進入物理世界的一次嘗試”。他還在帖子中打趣說,希望以后團隊能全員溜號去度假,實驗室全靠機器人和 AI 自己跑,老板黃仁勛都發現不了。

玩笑歸玩笑,這句話也交代了 ENPIRE 的一個重要目標:讓機器人在真實環境中的研發逐步實現自主循環。

這也是 NVIDIA GEAR(Generalist Embodied Agent Research)實驗室近年來 Physical AI 路線的延伸。此前團隊重點關注機器人基礎模型、世界模型和仿真平臺,而 ENPIRE 則進一步將 attention 轉向機器人研發流程。目前,相關技術論文已經同步上線,官方表示全部代碼和系統在未來都將開源。


(來源:NVIDIA)

給 AI 一個機器人身體

在 ENPIRE 中,核心角色是AI coding agent,即能夠自主編寫、執行和調試代碼的 AI 系統。與傳統聊天機器人不同,它們能夠主動調用工具、運行程序,并根據反饋持續修改代碼。

過去,它們只能在屏幕里寫代碼、跑程序;現在,它們在 ENPIRE 中第一次擁有了真實世界中的機械臂、攝像頭和實驗對象。它們寫下的代碼,不只是生成一個數字結果,而是直接驅動機器人去抓取、插入、剪切和操作真實物體。

過去幾年里,自動化科研已經在數字世界取得了不少進展。去年 Andrej Karpathy 開源的 autoresearch 項目,可以讓 AI 自動完成模型訓練和實驗管理;AI Scientist 等系統則已經能夠自動生成研究方案、運行實驗并撰寫論文。

但這些系統有一個共同特點:它們始終運行在數字環境之中。代碼運行完成就會得到結果,模擬器里的物理規律是確定的,一次失敗可以零成本重新開始。

真實世界則完全不同。機器人碰撞時的摩擦力會發生變化,物體位置無法被精確復原,光照條件和傳感器噪聲也始終在波動。論文中提到,在模擬環境中的“Push-T”(機器人通過推動而非抓取的方式,將一個 T 形積木移動到指定區域)任務里,三個被測試的 coding agent 全部成功完成了任務;但當同樣的方法被部署到真實機器人上時,其中兩個 agent 都失敗了。

所以,為了應對真實世界的非確定性,ENPIRE 整個系統被拆分為兩個階段。

第一階段需要少量人類參與。coding agent 首先在人類指導下搭建一套“環境基礎設施”,包括安全邊界、自動重置和自動驗證機制。所謂安全邊界,就是規定機器人不能執行哪些危險動作;自動重置負責在實驗結束后恢復場景;自動驗證則負責判斷一次操作究竟成功還是失敗。這些模塊一旦完成,就不再修改,而是作為后續所有實驗共享的基礎設施。

第二階段則完全自主。獲得環境接口之后,coding agent 開始真正意義上的“研究工作”。它們會閱讀相關論文尋找靈感,提出新的算法假設,修改訓練代碼,調整強化學習和行為克隆策略的超參數,然后部署到真實機器人上驗證效果,再根據實驗結果繼續改進。

Jim Fan 用一句話概括了這個過程:“我們所做的只是為 Codex 提供了一個通往原子世界的 API,其余的一切都是涌現?!?/p>


(來源:論文)

AI 如何在真實世界做實驗

為了驗證這一框架,研究團隊設計了多個真實機器人任務。一個是上文提到的 Push-T 任務,團隊要求機器人通過推的方式將一個 T 形積木移動到指定區域;還有一個是插針任務,要求機器人把大頭針準確插入直徑僅 4 毫米的孔洞;GPU 插入任務則是真正將 GPU 插進主板插槽;而剪扎帶任務則要求機器人拿起剪刀并剪斷扎帶尾部。

這些任務都涉及高精度操作,其中不少還需要實時視覺反饋和復雜接觸控制。在團隊發布的演示視頻中,GPU 插入和剪扎帶也是重點展示的內容:前者要求機器人將 GPU 精確插入主板插槽,后者則涉及抓取剪刀并完成工具使用。

在插針任務中,agent 的表現尤其值得關注。為了提高成功率,它們自主嘗試了行為克隆、在線強化學習、離線強化學習以及多種混合方案,并不斷調整批量大小、策略更新頻率和正則化參數。最終,系統實現了連續 50 次成功插針的目標。

更有意思的是,這支 agent 團隊并不是簡單地進行參數搜索。團隊的論文附錄展示了一棵“假設演化樹(Idea Tree)”,記錄了 agent 在實驗過程中提出、驗證和放棄的各種改進思路。不同 agent 會圍繞獎勵設計、訓練方式、超參數設置等方向展開探索,再根據實驗結果決定哪些路線繼續保留、哪些路線被淘汰。

其中,僅調整行為克隆中的一個正則化項,就帶來了 10.8% 的成功率提升,成為整個實驗過程中貢獻最大的單項改動。而最終的收斂速度也超過了此前依賴人類持續參與的機器人強化學習方法。

機器人數量成為新的 scaling 資源?

不過,這些都還不是這個項目最引人關注的部分。

研究團隊還發現,當機器人和 coding agent 的數量增加時,達到同樣性能目標所需的研發時間會明顯縮短。為此,他們搭建了由 1 臺、4 臺和 8 臺機器人組成的不同規模實驗系統。結果顯示,在插針任務中,1 臺機器人需要超過 1.5 小時才能達到接近完美的成功率;4 臺機器人縮短到約 50 分鐘;8 臺機器人則進一步縮短到約 40 分鐘。


(來源:論文)

多個 coding agent 會同時探索不同路線。有的嘗試新的強化學習算法,有的修改獎勵函數,還有的負責調整訓練基礎設施。一旦某個方向被證明有效,其他代理會通過 Git 自動復制、合并甚至直接復用這些成果;而效果不佳的路線則被快速淘汰。

從形式上看,這有些像一個由 AI 組成的研究團隊:多個 agent 并行開展實驗,并持續共享彼此的發現。這或許也意味著機器人實驗室開始出現類似 AI 領域的“擴展效應(scaling effect)”。

過去,大模型能力的提升往往來自更多 GPU、更多數據和更大的參數規模;而在 ENPIRE 中,研究團隊開始嘗試回答另一個問題:如果增加機器人數量和并行實驗規模,是否也能持續加快機器人的學習和研發過程。

但這種加速也有相應的代價。論文顯示,隨著代理數量增加,總 token 消耗呈現超線性增長。原因在于,每個代理不僅要做自己的實驗,還需要持續閱讀和理解其他代理的研究進展。換句話說,系統用更高的計算成本換來了更短的研發時間。

另一個有趣的發現來自知識遷移。

完成插針任務之后,研究人員要求 agent 總結自己學到的經驗,并生成一份 Markdown 文檔。當新的 GPU 插入任務開始時,這份總結被直接附加到任務說明中。結果顯示,這些文字形式的經驗總結能夠幫助 agent 更快掌握新任務。這說明,在 autoresearch 的過程中被遷移的不是模型參數,也不是訓練數據,而是方法論。這與人類研究者記錄實驗筆記、總結經驗再應用到新課題的方式頗為相似。

但目前來看,ENPIRE 還是存在一定的局限性。首先,系統并非完全自主運行。研究人員仍需要提前搭建實驗環境、定義安全邊界、設計自動驗證機制,并為不同任務開發對應的重置流程。agent 能夠自主改進策略,但實驗平臺仍然依賴大量前期工程投入。

其次,ENPIRE 目前驗證的任務規模仍然相對有限,無論是 Push-T、插針還是 GPU 插入,本質上都屬于結構化程度較高的桌面操作任務。系統能否擴展到更開放、更復雜的真實環境,仍有待進一步驗證。

1.https://x.com/DrJimFan/status/2066921736369766762

2.https://research.nvidia.com/labs/gear/enpire/

運營/排版:何晨龍

注:封面/首圖由 AI 輔助生成

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
洗頭后,吹風機與自然干,哪個更傷頭發?研究結果打臉了

洗頭后,吹風機與自然干,哪個更傷頭發?研究結果打臉了

名醫在線網
2026-06-17 10:57:40
廣西一家3口中毒死亡,官方公布調查報告:妻子洗澡時緊閉門窗通風不暢,致一家3人一氧化碳中毒死亡,4人銷售運輸“黑氣”被采取強制措施

廣西一家3口中毒死亡,官方公布調查報告:妻子洗澡時緊閉門窗通風不暢,致一家3人一氧化碳中毒死亡,4人銷售運輸“黑氣”被采取強制措施

大風新聞
2026-06-17 15:46:49
離婚時老公給我套破屋子,10年后推開門愣?。豪锩孀≈乓患?>
    </a>
        <h3>
      <a href=墨染塵香
2026-06-17 10:15:26
葡萄牙戰平C羅隱身,世界杯進球僅為梅西一半,梅羅之爭高下已分

葡萄牙戰平C羅隱身,世界杯進球僅為梅西一半,梅羅之爭高下已分

姜大叔侃球
2026-06-18 11:06:33
11種自閉癥小鼠模型曝大腦連接兩極分化,科學家發現兩大生物學亞型

11種自閉癥小鼠模型曝大腦連接兩極分化,科學家發現兩大生物學亞型

地球觀察日記
2026-06-16 22:14:04
1.3億要價攔不?。±锲中聨淈c名引援,世界杯期間有望敲定轉會

1.3億要價攔不??!利物浦新帥點名引援,世界杯期間有望敲定轉會

夜白侃球
2026-06-18 11:53:27
2026年養老金調整即將啟動,補發7個月,養老金3500元補多少?

2026年養老金調整即將啟動,補發7個月,養老金3500元補多少?

云鵬敘事
2026-06-17 19:44:26
向佐擺爛期妻子幫畫眼線:我的硬漢人設,在郭碧婷面前碎了一地

向佐擺爛期妻子幫畫眼線:我的硬漢人設,在郭碧婷面前碎了一地

喵喵娛樂團
2026-06-17 15:17:52
炸裂,騎士快船醞釀史詩級交易,倫納德再次聯手哈登?東部大結局

炸裂,騎士快船醞釀史詩級交易,倫納德再次聯手哈登?東部大結局

行舟問茶
2026-06-18 02:06:48
工信部司長,履新211黨委書記!

工信部司長,履新211黨委書記!

TOP大學來了
2026-06-18 11:32:58
亨利批C羅只想自己進球!C羅連續10場大賽零進球,已成葡萄牙隱患

亨利批C羅只想自己進球!C羅連續10場大賽零進球,已成葡萄牙隱患

夜白侃球
2026-06-18 12:41:33
他把現金堆成山,高調捐款20億后“消失”,如今現身卻在家種地

他把現金堆成山,高調捐款20億后“消失”,如今現身卻在家種地

閱微札記
2026-06-17 19:32:40
經理也蒙在鼓里?每體:阿隆索通過羅馬諾社媒才得知庫庫離隊

經理也蒙在鼓里?每體:阿隆索通過羅馬諾社媒才得知庫庫離隊

懂球帝
2026-06-18 06:05:15
博士畢業后才明白:進高校、進體制、進企業,根本不是差一點半點

博士畢業后才明白:進高校、進體制、進企業,根本不是差一點半點

王姐懶人家常菜
2026-06-14 06:52:51
A股:全體股民做好心理準備了,今天6.18,A股或又一次歷史重演!

A股:全體股民做好心理準備了,今天6.18,A股或又一次歷史重演!

趨勢清風俠
2026-06-18 06:52:40
里子面子都丟了!管不住下半身的那英,還是為自己的狂妄付出代價

里子面子都丟了!管不住下半身的那英,還是為自己的狂妄付出代價

掌秋看世界
2026-06-18 04:10:10
歌手陳紅曬全家福,大方回應網友前夫糾纏是想和她復婚

歌手陳紅曬全家福,大方回應網友前夫糾纏是想和她復婚

上官晚安
2026-06-18 01:05:27
中國制造“直道”超車!國產魚雷終結美60年壟斷,改寫全球航空史

中國制造“直道”超車!國產魚雷終結美60年壟斷,改寫全球航空史

云上烏托邦
2026-06-17 18:56:40
德法西意全炸鍋了!梅西帽子戲法刷屏頭版,用詞一個比一個狠

德法西意全炸鍋了!梅西帽子戲法刷屏頭版,用詞一個比一個狠

魚語昱雨軒
2026-06-18 09:09:47
油價徹底失控!別再跟風換電車了:90%車主都踩了同一個致命誤區

油價徹底失控!別再跟風換電車了:90%車主都踩了同一個致命誤區

阿芒娛樂說
2026-06-17 13:42:30
2026-06-18 12:59:00
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技評論獨家合作
16848文章數 515029關注度
往期回顧 全部

科技要聞

庫克承認扛不住了,蘋果漲價“不可避免”

頭條要聞

曹炯芳被點名:違規新增舉債435億 留下33個爛尾工程

頭條要聞

曹炯芳被點名:違規新增舉債435億 留下33個爛尾工程

體育要聞

英格蘭4比2克羅地亞:本屆迄今,最佳比賽

娛樂要聞

60歲鞏俐近況曝光!

財經要聞

沃什“首秀”:刻意的模糊?

汽車要聞

強化運動屬性/1.6T版本動力升級 艾瑞澤8征服版限時售10.29萬起

態度原創

旅游
親子
本地
房產
公開課

旅游要聞

河南老君山:多彩民俗活動濃情迎端午

親子要聞

梁建章:談談男性的育兒責任

本地新聞

世界杯黑馬佛得角:河北人開超市,溫州人當老板

房產要聞

最新房價:海口、三亞;新房、二手房全線下跌!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版