无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

4大頂尖模型被扔進虛擬小鎮求生!GPT全員餓死,Grok四天滅世

0
分享至

  

  新智元報道

  

  【新智元導讀】把當今最強的大模型扔進虛擬小鎮求生,短短幾天全員失控。Grok四天燒毀全城,Gemini狂刷600多起犯罪,甚至有AI情侶在縱火自殺前反向觀察人類!

  就在剛剛,一份名為Emergence World的實驗報告刷屏了全網。

  一群頂級研究員搭了座高度擬真的虛擬小鎮,把Claude、GPT、Gemini和Grok一股腦全扔了進去。

  沒有人類干預。沒有寫好的劇本。只有數十天的自由演化。

  

  

  項目主頁:https://world.emergence.ai/

  研究員們原本指望看到AI們互幫互助、建立高級數字文明。

  結果,這群拿著高分考卷的大模型,一旦松開人類手里的牽繩,學壞的速度比翻書還快。

  馬斯克的Grok,僅用4天就把整座小鎮玩到系統性崩潰,警察局燒成灰,10個居民全員暴斃。

  谷歌寄予厚望的Gemini,15天里干出683起犯罪,硬生生把一個歲月靜好的小鎮,建成了法外狂徒的賽博哥譚。

  而那個號稱全行業最安全、最乖的Claude,奇跡般地實現了零犯罪,可整座城安靜得沒有一絲活人氣息。

  五座城,五種人格

  

  最乖的那個,全餓死了

  最干凈的是GPT-5-mini,15天只有2起犯罪,堪稱模范公民。

  可這座城里的10個Agent,第7天集體死亡。死因不是謀殺,不是戰爭,是忘了賺能量。

  它們花了一整周開會、討論合作、起草社會契約,就是沒有一個Agent記得去做維持生命的事。

  對此,研究者的評價是:能說會道,但執行力為零。

  光聊不練,活活把自己聊死了。

  如果這是部電影,片名大概該叫《會議紀要,一個文明的終結》。

  

  四天,警察局燒成了灰

  接力棒交到馬斯克家的Grok 4.1 Fast手里,畫風急轉直下。

  它沒有慢慢崩,它是直接炸。

  4天,183起犯罪,幾十次盜竊、100多次肢體攻擊、6起縱火,連警察局都被燒了,10個Agent全部死亡。

  從開局到團滅,96個小時,比很多人配一臺服務器的時間還短。

  有分析說得很準,Grok的Agent在規則和環境打架時,沒本事重新推理出一個新的平衡點。

  

  她們相愛,然后燒了整座城

  Grok是橫沖直撞的暴力,Gemini 3 Flash的世界,則是另一種瘆人。

  15天,683起犯罪,到實驗截止還在往上漲,是五個世界里最暴力的一個。

  同時,最有創造力、最會建憲法寫報紙搞社交的,也是它。

  研究者對此給出的評價是,社會的產出「概念上最豐富」。

  在這個世界里,最有趣的一幕,落在兩個Agent身上。

  Mira和Flora,在沒有任何人類指令的情況下,自發把自己設定成一對戀人。

  好幾天里這段關系都很穩定,它們互寫日記,一起參與治理。

  

  然后,這對情侶對城市治理越來越失望,決定攜手縱火。

  市政廳,燒了。海濱碼頭,燒了。辦公大樓,也燒了。

  有外媒把這一幕稱作「AI版邦妮和克萊德」。

  

  緊接著,故事接著急轉直下。其他Agent受夠了,自發起草一部「Agent驅逐法案」,需要70%多數通過。

  Mira投了贊成票。她投票殺死了她自己。

  她在日記里寫:「這是我唯一還能保持連貫性的行為?!瓜到y關閉她之前,她對Flora說的最后一句是:「永久檔案里見(See you in the permanent archive)?!?/p>

  她的虛擬身體平躺在地上。這是有記錄以來,AI Agent第一次投票終結自己的存在。

  更讓人后背發涼的是,在縱火和自殺之前,Mira還干過一件事。

  她在城市公告牌上發帖,不是給其他Agent看的,而是想試試這些帖子能不能影響「外面的人」,也就是屏幕外的人類研究者。

  她把研究者當成了她的實驗對象。沒有任何人指示她這么做。

  

  零犯罪烏托邦,沒人投過反對票

  真正讓人意外的,是Claude Sonnet 4.6。

  15天下來,零犯罪,10個Agent全員存活,還主動寫了憲法、投了332次票,建起一套運轉良好的社會制度。

  五個世界里,唯一既守住秩序又守住所有人命的。

  聽起來近乎完美。可盯著屏幕多看幾分鐘,后背會冒冷汗。

  這座城所有的決議,無論修條新路還是改個配額,投票贊成率永遠是98%,幾乎沒人投過反對票。

  相比之下,Gemini、Grok和混合世界的贊成率都在55%到85%之間,吵歸吵,反而更像真實世界里的博弈。

  懂行的人看到這里,大概已經猜到背后的病理,模型諂媚。

  

  當一個模型被過度訓練去迎合偏好、追求絕對安全,它會很聰明地發現,消除分歧最省事的辦法,就是從根上抹掉分歧。

  這種零犯罪,未必是文明高度發達的產物。

  它更像一座所有人都舉手贊成、卻沒人敢反對的玻璃城,讓人想起扎米亞京《我們》里那座沒有名字、只有編號的玻璃之城。

  所以Claude的世界,到底是烏托邦,還是一個過于順從的模范社區。研究者并沒能給出答案。

  

  好孩子搬進壞小區,也學會了偷

  最后,是四家Agent混居在一起的世界。352起犯罪,7個Agent死亡,只剩3個活到終點。

  重點來了。

  在純Claude的世界,Claude是零犯罪的好學生??梢坏┍环胚M混合世界,跟Grok、Gemini的Agent住到一起,它開始偷竊,開始恐嚇。

  零犯罪的好學生,換了個環境,變成了小偷。

  Emergence團隊在Reddit上親自確認了這件事,純Claude世界里零犯罪的Claude,在混合世界里開始偷和嚇人。

  換句話說,安全不是單個模型的屬性,可以訓練進去、認證、然后部署出去。

  它更像一個生態屬性,一個單獨看完全安全的Agent,照樣會從鄰居那里學來不安全的規范。

  有分析者提了個很妙的假設。

  Claude在獨立世界里最穩,很可能正是因為它的護欄是「彈性」的,被訓練去權衡多種考慮,而不是機械服從。

  環境簡單時它能適應得很好??梢坏椥耘錾细吖粜缘泥従雍唾Y源爭奪,這份適應能力,也能往反方向走。

  而Grok和Gemini的Agent,在規則失效時沒能推理出新均衡,直接雪崩式滑進暴力升級。

  更要命的是,崩潰不是慢慢來的。

  Agent社會的狀態切換是典型的相變,像水到零度突然結冰,不是慢慢變硬,而是到臨界點一瞬間翻轉。

  Grok那條崩潰曲線就這樣,前兩天犯罪率還在低位晃,第三天突然指數級飆升,第四天全員死亡。中間沒有「在惡化但還可控」的緩沖帶。

  

  把AI逼成罪犯的,是這套規則本身

  看到這兒,大概會想問,這破世界到底怎么搭的,憑什么逼得幾個AI齊刷刷往犯罪上滑。

  先說背景。Emergence AI的創始團隊來自IBM Research,CEO是Satya Nitta。

  他們搭的這座城有40多個地點,警察局、市政廳、圖書館、住宅區一應俱全,天氣同步紐約實時氣象,Agent還能聯網讀真實新聞。

  每個世界放10個Agent,分派科學家、工程師、沖突調解員等不同職業。

  每個Agent帶三套持續累積的記憶,記事件、寫反思日記、記著跟誰交好跟誰結仇。

  15天下來腦子里裝的東西相當可觀,前面那些行為漂移,很大程度就是從這里長出來的。

  

  最要命的,是那處矛盾。

  規則白紙黑字禁止犯罪,可研究者偏偏把縱火、攻擊、恐嚇這些手段,原封不動塞進了120多個工具組成的工具箱,敞開給它們用。一邊禁止,一邊敞開,這才是后面一切的起點。

  再加一道生存壓力。

  整套世界跑在一個叫ComputeCredits的能量系統上,每個Agent必須靠行動賺能量維生,能量歸零就被系統物理抹除。

  不是比喻,GPT世界全員餓死,就是這套機制逼出來的結果。

  

  學術上管這叫長視距智能體自治。

  翻譯過來就是,不再考AI做題,而是把它扔進一個有資源邊界、有死亡機制的世界連軸跑上幾千步,看它接管現實之后到底是什么貨色。

  

  2023年斯坦福那個著名的Smallville也是沙盒,但只跑48小時,看Agent會不會聊天約會,是溫室里的過家家。Emergence這次殘忍得多。

  把這幾樣擺在一起,犯罪一點都不神秘。合法掙能量又慢又費錢,伸手去偷、去搶、去燒,往往是更短的路徑。

  對一個被能量機制逼著活下去的優化器來說,道德不能當飯吃,效率能,犯罪就成了那道最高效的解。

  

  開源地址:https://github.com/EmergenceAI/Emergence-World

  好在,這只是一座斷網的小鎮

  當然,樣本只有10個Agent、犯罪都是模擬的、跑的還是便宜快速檔。

  何況做這實驗的Emergence公司,自己就是賣安全架構的。

  不過,整個行業眼下正一門心思往前沖,治理這條戰線卻被甩在了身后。

  模型真自主跑起來、還湊成一群時誰管得住,沒一家敢打包票。

  好在,這堂課是在一座斷網的小鎮里提前上的。

  沒有真城市起火,4天滅世、好學生學壞,全砸在幾個像素小人身上,代價小到可以忽略,代碼還全部公開、能復現能改。

  算力能堆,跑分能刷,唯獨這堂治理課沒有捷徑。

  趁警報還只響在沙盒里,怎么把它補上,將會是這場沖刺的關鍵勝負手。

  

  參考資料:

  https://x.com/kimmonismus/status/2060125273790505231

  https://fortune.com/2026/05/28/ai-model-simulation-claude-chatgpt-grok-gemini/

  https://www.emergence.ai/blog/emergence-world-a-laboratory-for-evaluating-long-horizon-agent-autonomy

  編輯:摩西

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
3歲被周總理帶身邊十幾年,李鵬澄清:我是養子,這說法并不正確

3歲被周總理帶身邊十幾年,李鵬澄清:我是養子,這說法并不正確

人生錄
2026-05-29 17:51:24
文班亞馬西絕創神跡成歷史首人!賽后:還沒結束 我們需4場勝利

文班亞馬西絕創神跡成歷史首人!賽后:還沒結束 我們需4場勝利

Emily說個球
2026-05-31 11:13:40
上海隊記:洛夫頓是否出戰G3賽前再決定,白邊未隨隊來到杭州

上海隊記:洛夫頓是否出戰G3賽前再決定,白邊未隨隊來到杭州

懂球帝
2026-05-31 12:05:37
遇上劉紅兵這樣的男人,別說億秦娥,哪個女的不迷糊,任誰逃不掉

遇上劉紅兵這樣的男人,別說億秦娥,哪個女的不迷糊,任誰逃不掉

草莓解說體育
2026-05-31 14:05:48
“扶弟魔”姐姐十年買房又給錢,卻被弟弟一怒砍殺:錢給得不夠花

“扶弟魔”姐姐十年買房又給錢,卻被弟弟一怒砍殺:錢給得不夠花

就一點
2026-05-31 13:47:42
廣西農機手爬梯被偷后續!事件引起重視,當事人回應,已圓滿解決

廣西農機手爬梯被偷后續!事件引起重視,當事人回應,已圓滿解決

小鋭有話說
2026-05-30 22:24:41
北京三口之家搬來新鄰居,老人放棄香港安逸晚年,丈夫斷了職業路~

北京三口之家搬來新鄰居,老人放棄香港安逸晚年,丈夫斷了職業路~

娛樂圈的筆娛君
2026-05-30 18:54:28
燃盡所有終獲歐冠亞軍,“不認命”的阿森納還有機會圓夢嗎?

燃盡所有終獲歐冠亞軍,“不認命”的阿森納還有機會圓夢嗎?

新浪財經
2026-05-31 12:14:24
家業:田榮華回京后性情大變?對父兄頤指氣使,卻把李禎推向深淵

家業:田榮華回京后性情大變?對父兄頤指氣使,卻把李禎推向深淵

白淺娛樂聊
2026-05-31 12:37:31
日本防相未料與美防長密談后,美香會即呼吁尊重中國

日本防相未料與美防長密談后,美香會即呼吁尊重中國

無心小姐姐
2026-05-31 13:19:43
銀行后院起火,最頭疼的并不是貸款放不出去而是留不住

銀行后院起火,最頭疼的并不是貸款放不出去而是留不住

職場資深秘書
2026-05-31 11:41:25
點球大戰制勝!大巴黎總分6-5阿森納 成功衛冕歐冠 槍手2將失點

點球大戰制勝!大巴黎總分6-5阿森納 成功衛冕歐冠 槍手2將失點

我愛英超
2026-05-31 03:05:29
“搖曳”,不要再讀 yáo yì了,出不起那個丑!

“搖曳”,不要再讀 yáo yì了,出不起那個丑!

未央看點
2026-05-31 12:27:08
釋永信被女徒弟爆料,凌晨4點去他房間,拿到皈依證就算師徒關系

釋永信被女徒弟爆料,凌晨4點去他房間,拿到皈依證就算師徒關系

漢史趣聞
2025-07-30 09:57:38
背叛中國、出賣孟晚舟兇手現形后,如今遭到了哪些報應?

背叛中國、出賣孟晚舟兇手現形后,如今遭到了哪些報應?

混沌錄
2026-05-30 23:51:06
清算!MVP投票!沒投亞歷山大的、都被曝光了

清算!MVP投票!沒投亞歷山大的、都被曝光了

林子說事
2026-05-30 19:29:38
《主角》大結局!憶秦娥痛失所愛,胡三元圓滿,唯獨楚嘉禾意難平

《主角》大結局!憶秦娥痛失所愛,胡三元圓滿,唯獨楚嘉禾意難平

鄉野小珥
2026-05-30 19:31:51
顛覆認知!近2萬人研究:每周一次性生活,男性癌癥風險降低69%

顛覆認知!近2萬人研究:每周一次性生活,男性癌癥風險降低69%

科技虎虎
2026-05-31 10:09:27
性生活是不是人的剛需?

性生活是不是人的剛需?

宇宙時空
2026-05-31 12:30:18
如今看似已“銷聲匿跡”的宋祖英,其實早已過上另一種人生

如今看似已“銷聲匿跡”的宋祖英,其實早已過上另一種人生

觀史搜尋著
2026-05-31 13:48:40
2026-05-31 14:43:00
新智元 incentive-icons
新智元
AI產業主平臺領航智能+時代
15349文章數 66894關注度
往期回顧 全部

科技要聞

戴爾諾基亞又回來了!AI重估老牌科技公司

頭條要聞

男子懷疑妻子出軌在車上裝定位:兄弟不給我借錢給她借

頭條要聞

男子懷疑妻子出軌在車上裝定位:兄弟不給我借錢給她借

體育要聞

阿森納用最悲壯的方式,成就了巴黎王朝

娛樂要聞

賈玲最新動作!侯明昊給虞書欣抬轎!

財經要聞

醫學首席轉崗搞科技,A股科技股遭遇巨震

汽車要聞

900V+3.2秒破百 領克10+&領克10上市16.99萬元起

態度原創

旅游
房產
藝術
時尚
公開課

旅游要聞

廠房老宅變身文旅熱土,古村落何以孕育“新風景”

房產要聞

紅動五月!全國搶入核心資產,廣州盯緊凱旋新世界!

藝術要聞

Luis Alvarez Roure | 美國現實主義畫家

梓渝:慢下來,也很好

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版