无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請入駐

AlphaGo之父把AI扔進(jìn)23年的人造社會(huì):智能體3塊最硬骨頭全在這

0
分享至


新智元報(bào)道


【新智元導(dǎo)讀】從Atari到AlphaGo,從AlphaStar到SIMA,DeepMind用游戲做AI研究已走過十余年,每換一個(gè)戰(zhàn)場,研究問題就升一個(gè)量級(jí)。這一次的戰(zhàn)場是EVE Online:一個(gè)跑了23年、從未重置的活宇宙。

DeepMind CEO、AlphaGo之父Demis Hassabis用游戲做AI研究已走過十余年。

這一次,他把AI扔進(jìn)了跑了23年的「活宇宙」:一款連新手引導(dǎo)都能勸退玩家的太空網(wǎng)游EVE Online。

棋局有終局,EVE沒有。

5月初,DeepMind官宣了與EVE Online建立研究合作,原因很簡單:EVE復(fù)雜且有玩家驅(qū)動(dòng)的宇宙,是測試AI記憶、持續(xù)學(xué)習(xí)和長期規(guī)劃的完美安全沙盒。


DeepMind聯(lián)手EVE,不是為了追求有趣的游戲體驗(yàn),或者賦能游戲玩法,而是要啃下當(dāng)前AI智能體研究里公認(rèn)最難啃的三塊骨頭,Hassabis把答案押在了一款運(yùn)營23年的老游戲上。


Fenris Creations(原CCP Games)宣布與DeepMind合作

EVE Online背后的公司,5月6日同一天宣布了四件事:

  • 從母公司Pearl Abyss體系中重新獨(dú)立;

  • 更名為Fenris Creations;

  • 完成1.2億美元交易;

  • Google作為本次獨(dú)立的一部分,持有Fenris Creations少數(shù)股權(quán),并同步啟動(dòng)與Google DeepMind的研究合作。

Fenris Creations CEO Hilmar Veigar Pétursson在公告中聲稱:

這次轉(zhuǎn)型不涉及裁員或重組,團(tuán)隊(duì)、產(chǎn)品、開發(fā)計(jì)劃保持不變。EVE繼續(xù)。

從運(yùn)營數(shù)字看,這家公司是帶著「真實(shí)彈藥」來談合作的,而不是賣資產(chǎn)求生。

EVE Online 2025年?duì)I收超過7000萬美元,11月創(chuàng)下歷史最高收入紀(jì)錄,Q4成為該游戲20年歷史上營收第二高的季度。

Fenris Creations獨(dú)立出來,意味著EVE現(xiàn)在有了一個(gè)能自主決定研究合作的母公司,不再被一家更大的游戲發(fā)行公司的戰(zhàn)略目標(biāo)綁架。


1997年Fenris出版的桌游產(chǎn)品盒。「Fenris」這個(gè)名字比EVE Online還早了6年,更名為Fenris Creations是一次回溯,不是另起爐灶

DeepMind為何會(huì)選中EVE?

23年「人造社會(huì)」

AI基準(zhǔn)測試難以復(fù)制

很多人聽到「游戲+AI研究」,第一反應(yīng)是回想AlphaGo或AlphaStar,EVE和它們都不同。

圍棋和星際爭霸有一個(gè)共同特點(diǎn):一局比賽有開始,有結(jié)束,有明確的勝負(fù)規(guī)則。

AlphaGo的目標(biāo)是打贏棋局,AlphaStar的目標(biāo)是打贏一場星際對戰(zhàn),都是「單局智能」的研究范式,但EVE沒有終局。

EVE Online以「單一共享宇宙」(single-shard / single shared universe)著稱,大量玩家長期在同一個(gè)持久世界中競爭、貿(mào)易、結(jié)盟和戰(zhàn)爭。

玩家在這里建立起了真實(shí)的經(jīng)濟(jì)體系、政治聯(lián)盟、軍事集團(tuán)、貿(mào)易路線、歷史恩怨和跨年度的戰(zhàn)爭計(jì)劃。

有些戰(zhàn)役從籌備到落幕要花掉整整一年。有些聯(lián)盟的崛起和覆滅,被后來的玩家當(dāng)作真實(shí)歷史研究。

Hilmar在公告中說:「EVE是少數(shù)幾個(gè)能在已經(jīng)像真實(shí)世界運(yùn)轉(zhuǎn)的環(huán)境中探索智能問題的地方。」

Hassabis更是談到,自己從小玩游戲,職業(yè)生涯起點(diǎn)是設(shè)計(jì)AI模擬游戲,AlphaGo、AlphaStar和SIMA的研究都和游戲深度綁定,而EVE是下一階段的選擇:

我很高興能與Fenris Creations合作,在這個(gè)由玩家打造、復(fù)雜程度無與倫比的宇宙里,安全地探索全新的游戲體驗(yàn)并推進(jìn)AI研究。

大多數(shù)AI基準(zhǔn)測試像是體檢,EVE更像是把AI扔進(jìn)一個(gè)已經(jīng)持續(xù)了23年的「人造社會(huì)」。

智能體3塊最硬骨頭

剛好是EVE玩家日常

這次官方明確列出了三個(gè)研究方向:長程規(guī)劃(long-horizon planning)、記憶(memory)、持續(xù)學(xué)習(xí)(continual learning)。

這三個(gè)方向,是當(dāng)前AI智能體研究領(lǐng)域公認(rèn)的3塊最難啃的骨頭。

如果你身邊有人玩過十年以上的EVE Online,讓他打開賬號(hào)給你看一眼好友列表,你很可能會(huì)看到幾十個(gè)分組、上百個(gè)名字,備注欄里寫著「2018年Delve戰(zhàn)役欠的債」「鵝群聯(lián)盟(Goonswarm)內(nèi)部叛徒,別合作」「這哥們兒是間諜,組織里都知道」。

這不是上下文窗口,而是十年起步的跨會(huì)話長程記憶。

記憶這一關(guān),EVE玩家天天都在過,持續(xù)學(xué)習(xí)這一關(guān)也一樣。

2014年1月,B-R5RB一戰(zhàn)持續(xù)約21小時(shí),參戰(zhàn)角色超過7500個(gè),75艘Titan被毀,損失折合真實(shí)貨幣約30萬美元。整場戰(zhàn)役的導(dǎo)火索,是一筆主權(quán)賬單未能自動(dòng)支付。

這一仗打完,整個(gè)游戲的艦隊(duì)?wèi)?zhàn)術(shù)全部改寫。各聯(lián)盟之后幾年的艦隊(duì)配置、戰(zhàn)術(shù)體系,全部圍繞復(fù)盤在迭代。每月都在改,每場失敗都被拆成可執(zhí)行的策略更新。

至于長程規(guī)劃,EVE聯(lián)盟戰(zhàn)爭的標(biāo)準(zhǔn)時(shí)間單位不是小時(shí),是月。一場跨星域戰(zhàn)爭從籌備到打響,造船、運(yùn)輸、外交、潛伏、反間,幾百號(hào)玩家在沒有任何任務(wù)調(diào)度的情況下自發(fā)協(xié)作,跨月推進(jìn)一個(gè)共同目標(biāo)。

這套協(xié)作體系是23年里玩家自己長出來的。

當(dāng)前AI智能體評(píng)估里被認(rèn)為最硬的3塊骨頭,恰好是EVE玩家的日常。

EVE中23年的玩家驅(qū)動(dòng)演化,產(chǎn)生了一個(gè)始終在變、始終復(fù)雜、沒有捷徑的環(huán)境,實(shí)驗(yàn)室里人工合成不了這種復(fù)雜度。

DeepMind在2025年11月發(fā)布的SIMA 2,已經(jīng)從「執(zhí)行指令」進(jìn)化到「理解目標(biāo)、推理過程、邊玩邊學(xué)」。

從研究問題上看,EVE項(xiàng)目與SIMA 2同屬「游戲作為智能體訓(xùn)練場」這條路線,不同的是這次場地?fù)Q成了一個(gè)持續(xù)運(yùn)轉(zhuǎn)23年的真實(shí)宇宙。


EVE Online游戲內(nèi)戰(zhàn)役畫面,這種由玩家自發(fā)組織、動(dòng)輒持續(xù)數(shù)小時(shí)的大規(guī)模會(huì)戰(zhàn),是DeepMind選中EVE作為長程規(guī)劃與持續(xù)學(xué)習(xí)研究場景的核心原因

DeepMind進(jìn)的是離線沙盒

不是玩家宇宙

DeepMind這次和Fenris的合作方式,比想象中保守,DeepMind拿到的不是直接接入現(xiàn)役玩家正式服的權(quán)限。

DeepMind官方在公告中聲明:初始研究將在離線版本的EVE Online上進(jìn)行,使用本地服務(wù)器,在受控環(huán)境里測試和評(píng)估模型,不連接EVE Online正式運(yùn)營服務(wù)器。

一方面,離線版意味著DeepMind不會(huì)去消費(fèi)現(xiàn)役玩家的對戰(zhàn)數(shù)據(jù),也不會(huì)擾動(dòng)真正的服務(wù)器經(jīng)濟(jì),這避免了任何隱私和合規(guī)上的復(fù)雜度。

另一方面,離線版EVE仍可保留復(fù)雜的規(guī)則系統(tǒng)、艦船與經(jīng)濟(jì)機(jī)制、星域結(jié)構(gòu)等核心設(shè)計(jì)。

DeepMind拿到的是一個(gè)「被23年玩家壓力測試過」的復(fù)雜世界,作為智能體要去活下去的考場。

從Atari到EVE

這條路走向哪里

從DeepMind這十幾年的訓(xùn)練場選擇往回看,有一條很清晰的進(jìn)化線。

2013到2015年,Atari是起點(diǎn)。DQN把智能體放進(jìn)《打磚塊》《太空入侵者》這種關(guān)卡明確、規(guī)則封閉的游戲。考的是反應(yīng)和價(jià)值估計(jì)。

2016到2017年,AlphaGo和AlphaZero。圍棋規(guī)則規(guī)整、動(dòng)作空間巨大但封閉。考的是搜索和長鏈推理。

2019年,AlphaStar進(jìn)了《星際爭霸2》。第一次進(jìn)入實(shí)時(shí)、不完美信息、多線博弈的環(huán)境。考的是部分可觀察下的實(shí)時(shí)決策。

2024年,SIMA想做跨多個(gè)游戲的通用智能體。考的是遷移泛化。

2025年,SIMA 2升級(jí):不只執(zhí)行指令,還能和用戶對話、推理目標(biāo)、在游戲過程中自我改進(jìn)。


DeepMind 2025年發(fā)布的SIMA 2,已從「執(zhí)行指令」進(jìn)化到「理解目標(biāo)、推理過程、邊玩邊學(xué)」

每一代環(huán)境,都比上一代多了一些「真實(shí)世界的樣子」:從規(guī)則封閉到規(guī)則開放,從完美信息到不完美信息,從單局對抗到跨局遷移。

但此前這些環(huán)境大多仍是相對封閉、可切分、可重復(fù)評(píng)測的任務(wù)場,比如Atari是固定規(guī)則的街機(jī)游戲,AlphaStar面對的是一局一局結(jié)束的星際對戰(zhàn),SIMA則在多個(gè)3D虛擬環(huán)境中測試跨游戲泛化。

EVE的不同之處在于,它是一個(gè)長期運(yùn)行、玩家驅(qū)動(dòng)、經(jīng)濟(jì)和政治結(jié)構(gòu)持續(xù)演化的持久世界。

它是在23年間,經(jīng)由一群真實(shí)玩家在開放規(guī)則的世界里自發(fā)演化出來的:完整的玩家驅(qū)動(dòng)經(jīng)濟(jì)(ISK價(jià)格波動(dòng)堪比真實(shí)金融市場),跨聯(lián)盟的政治結(jié)構(gòu)(外交、間諜、停戰(zhàn)協(xié)議),從小規(guī)模沖突到21小時(shí)大戰(zhàn)的整套戰(zhàn)爭生態(tài)。

圈內(nèi)對智能體評(píng)估的共識(shí)越來越清楚,單點(diǎn)任務(wù)跑分早就玩不出什么新花樣了,但長程記憶、跨周規(guī)劃、從失敗中學(xué)習(xí),一直沒有像樣的評(píng)估場。

所以,DeepMind這次的選擇是:與其再造一個(gè)合成環(huán)境,不如走進(jìn)一個(gè)已經(jīng)被人類玩家用23年壓力測試過的「人造社會(huì)」。

但更大的問題也隨之浮現(xiàn):

一個(gè)能在EVE里持續(xù)存在、持續(xù)學(xué)習(xí)、持續(xù)規(guī)劃的AI智能體,它和在真實(shí)世界里自主運(yùn)作的智能體之間,還差什么?

參考資料:

https://x.com/GoogleDeepMind/status/2052011542707630461

https://www.ccpgames.com/news/2026/studio-behind-eve-online-goes-independent-rebrands-as-fenris-creations-enters-research-partnership-with-google-deepmind

https://deepmind.google/blog/sima-2-an-agent-that-plays-reasons-and-learns-with-you-in-virtual-3d-worlds/

編輯:元宇

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
人老有3坎,熬過去就贏了,多少人倒在第三道?你準(zhǔn)備好了嗎?

人老有3坎,熬過去就贏了,多少人倒在第三道?你準(zhǔn)備好了嗎?

醫(yī)學(xué)原創(chuàng)故事會(huì)
2026-05-28 00:18:08
文班談賽后激動(dòng)落淚:我無法形容此刻的感受 它太強(qiáng)烈了

文班談賽后激動(dòng)落淚:我無法形容此刻的感受 它太強(qiáng)烈了

北青網(wǎng)-北京青年報(bào)
2026-05-31 19:26:15
日媒:高市正準(zhǔn)備對華發(fā)動(dòng)戰(zhàn)爭?日專家“重兵部署,戰(zhàn)場選好了”

日媒:高市正準(zhǔn)備對華發(fā)動(dòng)戰(zhàn)爭?日專家“重兵部署,戰(zhàn)場選好了”

二爺臺(tái)球解說
2026-05-30 12:54:57
巴拿馬總統(tǒng)攤牌:沒收中國港口不是美國逼的,準(zhǔn)備和中國續(xù)簽協(xié)議

巴拿馬總統(tǒng)攤牌:沒收中國港口不是美國逼的,準(zhǔn)備和中國續(xù)簽協(xié)議

小濤叨叨
2026-05-31 18:24:59
姆巴佩尷尬,巴黎大將:追隨恩里克,集體大于任何人

姆巴佩尷尬,巴黎大將:追隨恩里克,集體大于任何人

體壇周報(bào)
2026-05-31 06:46:23
有色金屬:今天5月31日,不出意外的話,釋放了三個(gè)重要信號(hào)!

有色金屬:今天5月31日,不出意外的話,釋放了三個(gè)重要信號(hào)!

生活新鮮市
2026-05-31 16:09:48
法學(xué)博士牛學(xué)輝被執(zhí)行死刑,新婚12天殺害妻子,行刑前拒見親人

法學(xué)博士牛學(xué)輝被執(zhí)行死刑,新婚12天殺害妻子,行刑前拒見親人

深夜探案館
2026-05-30 12:00:12
印軍兩周可拿下中國!印度網(wǎng)友催戰(zhàn),莫迪卻遲遲不點(diǎn)頭,為啥?

印軍兩周可拿下中國!印度網(wǎng)友催戰(zhàn),莫迪卻遲遲不點(diǎn)頭,為啥?

說歷史的老牢
2026-05-28 23:22:49
勵(lì)志!方媛原來是個(gè)安徽農(nóng)家女,曾在上海做過導(dǎo)購,母親還曾失業(yè)

勵(lì)志!方媛原來是個(gè)安徽農(nóng)家女,曾在上海做過導(dǎo)購,母親還曾失業(yè)

魔都姐姐雜談
2026-05-19 08:58:40
以當(dāng)前的實(shí)力,一旦中日打起來,結(jié)局會(huì)怎樣?美俄看法一致

以當(dāng)前的實(shí)力,一旦中日打起來,結(jié)局會(huì)怎樣?美俄看法一致

迷彩前沿
2026-05-29 12:52:40
樊振東0-5落后翻盤!同一對手,兩次被“上課”,新膠皮藏著秘密

樊振東0-5落后翻盤!同一對手,兩次被“上課”,新膠皮藏著秘密

曹老師評(píng)球
2026-05-31 10:03:03
任何一艘美航母上,都要帶足大量女兵?她們在航母上有什么作用?

任何一艘美航母上,都要帶足大量女兵?她們在航母上有什么作用?

探源歷史
2026-04-06 04:10:07
克宮發(fā)布俄羅斯、白俄羅斯、吉爾吉斯斯坦和哈薩克斯坦領(lǐng)導(dǎo)人關(guān)于亞美尼亞問題的聯(lián)合聲明

克宮發(fā)布俄羅斯、白俄羅斯、吉爾吉斯斯坦和哈薩克斯坦領(lǐng)導(dǎo)人關(guān)于亞美尼亞問題的聯(lián)合聲明

俄羅斯衛(wèi)星通訊社
2026-05-31 16:07:21
這一回,輪到煙草員工開始沒心情上班了?干活沒底氣了?

這一回,輪到煙草員工開始沒心情上班了?干活沒底氣了?

今朝牛馬
2026-05-26 20:40:56
網(wǎng)約車最大的誤會(huì),是所有人都覺得對方賺了錢

網(wǎng)約車最大的誤會(huì),是所有人都覺得對方賺了錢

從前這些事
2026-05-30 15:26:42
6月金股出爐,兩大龍頭人氣最高

6月金股出爐,兩大龍頭人氣最高

證券時(shí)報(bào)
2026-05-31 18:42:08
衛(wèi)冕冠軍出局!法網(wǎng)女單賽場再爆冷門,高芙遭逆轉(zhuǎn)無緣16強(qiáng)

衛(wèi)冕冠軍出局!法網(wǎng)女單賽場再爆冷門,高芙遭逆轉(zhuǎn)無緣16強(qiáng)

全景體育V
2026-05-31 05:56:54
文班:不知道這場勝利對波波意味著什么 回去得和他聊聊

文班:不知道這場勝利對波波意味著什么 回去得和他聊聊

北青網(wǎng)-北京青年報(bào)
2026-05-31 19:26:13
徐帆回應(yīng)離婚幾個(gè)月后,68歲馮小剛再惹爭議,養(yǎng)女徐朵成導(dǎo)火索!

徐帆回應(yīng)離婚幾個(gè)月后,68歲馮小剛再惹爭議,養(yǎng)女徐朵成導(dǎo)火索!

鄉(xiāng)野小珥
2026-05-18 08:58:28
阿里納斯:喬丹時(shí)期都不看冠軍!他2冠就被說是歷史第一人!

阿里納斯:喬丹時(shí)期都不看冠軍!他2冠就被說是歷史第一人!

歷史第一人梅西
2026-05-31 11:03:17
2026-05-31 20:27:00
新智元 incentive-icons
新智元
AI產(chǎn)業(yè)主平臺(tái)領(lǐng)航智能+時(shí)代
15351文章數(shù) 66894關(guān)注度
往期回顧 全部

科技要聞

戴爾諾基亞又回來了!AI重估老牌科技公司

頭條要聞

香會(huì)上中方全英文發(fā)問菲律賓 菲防長語無倫次答非所問

頭條要聞

香會(huì)上中方全英文發(fā)問菲律賓 菲防長語無倫次答非所問

體育要聞

阿森納用最悲壯的方式,成就了巴黎王朝

娛樂要聞

朱軍退休,正義雖遲但到,女方受懲

財(cái)經(jīng)要聞

醫(yī)學(xué)首席轉(zhuǎn)崗搞科技,A股科技股遭遇巨震

汽車要聞

900V+3.2秒破百 領(lǐng)克10+&領(lǐng)克10上市16.99萬元起

態(tài)度原創(chuàng)

親子
房產(chǎn)
家居
旅游
軍事航空

親子要聞

2026年提高免疫力嬰幼兒奶粉:免疫配方成分臨床驗(yàn)證深度解析

房產(chǎn)要聞

紅動(dòng)五月!全國搶入核心資產(chǎn),廣州盯緊凱旋新世界!

家居要聞

云棲 舒展如流云

旅游要聞

山海邂逅悅來玥美!青島銀豐玥美酒店一周年盛典閃耀啟幕

軍事要聞

解放軍代表質(zhì)問日防衛(wèi)大臣:日本何時(shí)道歉

無障礙瀏覽 進(jìn)入關(guān)懷版