網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

AI自己造AI，概率60%，2028年底前！Anthropic聯創坐不住了

2026-05-05 20:07:09　來源: 新智元

北京舉報

0

分享至

新智元報道

編輯：元宇

【新智元導讀】Anthropic聯合創始人Jack Clark讀完數百份公開數據，得出一個讓他自己也坐不住的結論：2028年底前，AI自己造AI的概率是60%。支撐他這一判斷的，是編程、科研復現、模型訓練優化等多條能力曲線：每一條都在向右上方飛，沒有減速跡象。

AI系統，可能很快就能自行構建自身了！

說這句話的人，是Anthropic聯合創始人Jack Clark。

5月4日，他在X上發帖：「我認為，遞歸自我改進（RSI）有60%的概率在2028年底之前發生?！?/p>

除了Anthropic聯合創始人身份之外，Clark還是《Import AI》的創辦者兼主筆，長期跟蹤AI能力進展。

這次發帖，他在《Import AI》上同時發布了一篇完整的分析文章。

https://importai.substack.com/p/import-ai-455-automating-ai-research

這是一件大事。我不知道該如何理解它。這是一個我不情愿接受的看法：其影響太過巨大，讓我感到自身渺小，而且我不確定，社會是否已準備好迎接自動化AI研發所帶來的變革。

Clark在文章里寫：如果這一天到來，人類將跨過一道「盧比孔河」，進入一個幾乎無法預測的未來。

他不認為這會發生在2026年，但他預判一兩年內可能在非前沿模型上，出現這樣的概念驗證：一個模型，端到端訓練出自己的繼任者。

支撐Clark結論的，主要來自公開信息：arXiv、bioRxiv、NBER上的論文，加上他對各大前沿實驗室產品的持續觀察，Clark以此拼湊出一幅關于AI進展的全景圖。

在他看來，AI工程化生產的所有組件，今天已經基本齊了。剩下的問題是：模型什么時候能積累足夠的創造力，開始像人類研究員一樣推動前沿演進。

四年

從30秒到12小時

Clark的核心論據，是一批能力進展曲線。

先看METR的時間軸圖。

https://metr.org/time-horizons/

METR是一個專注AI能力評估的機構，他們追蹤的是：AI系統能獨立完成一項任務，在50%成功率水平線上，這項任務如果讓一個熟練的人來做大概需要多少時間。

2022年，GPT-3.5的數字是：30秒；
2023年，GPT-4把這個數字推到了4分鐘；
2024年，o1推到了40分鐘；
2025年，GPT-5.2（高配版）跨到了6小時；
2026年，Claude Opus 4.6已經到了12小時。

四年，從30秒到12小時，翻了1440倍！

AI能力研究員Ajeya Cotra認為，2026年底之前，這個數字有望突破100小時。

如果達到100小時時間跨度，它將能覆蓋許多多日級軟件/研究輔助任務。

編程能力同樣也在起飛。

SWE-Bench衡量的是AI解決真實GitHub工程問題的能力。2023年底，Claude 2的得分是2%。到今年，Claude Mythos Preview達到93.9%，這個基準基本被打穿了。

CORE-Bench測的是另一件事：給AI一篇論文和對應的代碼庫，讓它獨立復現實驗結果，這是AI研究員最基本的日常工作之一。

2024年9月該測試推出時，最好成績是21.5%。2025年12月，Opus 4.5在Claude Code scaffold下verified accuracy 為77.78%，經人工校驗后為95.5%，項目方稱CORE-Bench已被解決。

https://hal.cs.princeton.edu/corebench_hard

15個月，從21.5%到95.5%。

MLE-Bench測的是AI獨立參加Kaggle競賽的能力，覆蓋75個真實比賽項目。

2024年10月發布時最高分16.9%，到2026年2月，Gemini 3加搜索工具的組合已經達到64.4%。

https://github.com/openai/mle-bench

Anthropic內部還有一個測試：讓模型優化一個僅使用CPU的小型語言模型訓練代碼，越快越好，以未優化版本的速度為基準。

2025年5月，Claude Opus 4：2.9倍；
2025年11月，Opus 4.5：16.5倍；
2026年2月，Opus 4.6：30倍；
2026年4月，Claude Mythos Preview：52倍。

不到一年，從2.9倍漲到52倍。

這是AI在優化AI訓練代碼這件事情上的進展速度。

99%的工程活

AI快接完了

這里有一個關鍵問題：AI研究這件事，到底有多少是純工程，多少是真正的創意？

Clark給出了一個框架，引用了愛迪生那句話：天才是1%的靈感和99%的汗水。

他認為，AI研究也是如此。

一個典型的AI研究循環是這樣的：拿一個現有系統，在某個維度上擴大規模，觀察什么地方開始出問題，修掉工程問題，再擴大一輪。

這個過程里，大部分工作是數據清洗、跑實驗、調參數、讀論文、復現結果，這些都是「汗水」，不是「靈感」。

偶爾會出現真正改變范式的發明，比如Transformer架構，比如混合專家模型（MoE）。但那是1%，而且這1%越來越不是瓶頸，因為那99%的工程工作正在被AI快速接管。

Clark列了幾個信號：

AI已經能管理其他AI。Claude Code、OpenCode這類工具里，單個AI可以扮演「項目經理」，把任務分發給多個子AI并行處理，之后匯總結果。

這和一個人類研究團隊的組織方式沒有本質區別。

PostTrainBench測試了一件事：AI能不能自己微調開源小模型，提升它在某個任務上的表現？

這個工作通常是前沿實驗室里有經驗的研究員在做。

截至2026年3月，AI系統在這個任務上能做到人類研究員效果的一半左右，大約是25%到28%的提升幅度，而人類基線是51%。

https://posttrainbench.com/

Anthropic內部還有一個「自動化對齊研究」的概念驗證：讓一組AI agent，在AI安全研究問題上自主攻關。

結果是，AI給出的方案超過了Anthropic人類研究員的基線。

https://www.anthropic.com/research/automated-alignment-researchers

Clark把這些證據串在一起的判斷是：AI今天已經能自動化AI工程的絕大部分，AI研究里有多少能自動化，還不完全清楚，但跡象已經很明顯。

質疑聲也來了

Clark的帖子發出后，行業里也出現了一些質疑。

華盛頓大學機器學習教授，《終極算法》作者Pedro Domingos回復到：「從LISP在50年代發明以來，AI就能構建自己了。問題在于，這個過程究竟能帶來遞增回報還是遞減回報——而目前沒有任何證據支持前者?！?/p>

遞歸自我改進聽起來很科幻，但能循環不等于循環有收益。如果每一代AI優化自己的效率只有邊際改善，而不是指數級放大，那這件事的影響范圍會非常有限。

還有人質疑概念邊界?！窻SI到底有沒有一個權威定義？」一位名叫Dan Brickley的研究員問道。

另一個更尖銳的觀察來自賬號@crepesupreme：

2027年30%，2028年60%。一年內概率跳升30個百分點，意味著2027到2028年之間存在某個不連續的能力事件。那個具體事件是什么？

Clark在通訊文章里回應了這個隱含問題：他認為AI研究仍需要某種創意突破才能真正進入「自我研發」循環：AI目前在這一塊還沒有變革性的表現。這正是他給2027年只打30%的原因；而如果這個缺口在2028年底前被填上，概率就升到60%。

但他同時也承認，自己預判的是概率，而不是確切的時間點。

還有人問他：「你在Anthropic工作，你為什么要去翻公開數據？直接走下樓去問研究員不就行了？」

Clark的答案是：用公開數據，是因為公開數據才有可信度。他要的不是內部判斷，是一個任何人都能獨立核驗的結論。

窗口還開著

但在縮窄

Clark在通訊文章里寫：他為什么不給2027年更高的概率？

因為他認為AI研究還包含一些對創意直覺的要求，而AI目前在這一塊只有「誘人的早期信號」，還沒有系統性突破。

他列了兩個信號：一個是Gemini模型參與攻克Erd?s數學問題，在700個問題里解出了1個被數學家認為有一定原創性的解。

另一個是斯坦福、UBC等機構與Google DeepMind合作，AI在發現新數學證明中起到了「非常實質性的作用」。

這些結果在AI能力演化的時間軸上，可能是某種早期信號。

Clark的估計是：如果2028年底沒有出現他描述的情況，那說明當前技術路徑存在某個根本性的能力天花板，需要人類的創意才能突破。

更關鍵的是「如果出現了」之后的問題。

Anthropic在2026年3月宣布成立The Anthropic Institute時，官方聲明里寫了這樣一句話：

如果AI系統的遞歸自我改進確實開始發生，那么世界上誰應該被告知，以及這些系統應該如何治理？

https://www.anthropic.com/news/the-anthropic-institute

連Anthropic自己，都還沒有這個問題的完整答案。

Clark在通訊文章里給出了一個更技術性的擔憂：今天的對齊技術，如果有99.9%的準確率，在遞歸迭代50代之后，準確率會跌到95.1%；迭代500代之后，跌到60.5%。

除非你的對齊方案在理論上能保證在更智能的系統上同樣有效，否則問題會很快出現。

也許，Clark想要說的是：治理窗口是有限的，而且它正在縮窄。他希望通過文章發出一個提醒：這件事留給討論、研究和治理設計的時間，比大多數人想象的短。

據奧特曼直播及媒體報道，OpenAI的目標是讓AI在2026年9月前達到「AI 研究實習生」水平，2028年達到更完整的自動化研究員；Anthropic自己也在發表自動化對齊研究的概念驗證；一家叫Recursive Superintelligence的新公司剛剛完成5億美元融資，其目標之一就是自動化AI研究。

整個行業已經在朝這個方向加速了。

Clark說，無論從哪個維度看，數據都指向同一個方向，而每一條曲線，都在向右上方飛，時間越長，能力越強，而且沒有任何一條顯示出減速的跡象。

參考資料：

https://x.com/chatgpt21/status/2051314386317295758

https://importai.substack.com/p/import-ai-455-automating-ai-research

https://www.anthropic.com/research/automated-alignment-researchers

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

Anthropic聯創定下deadline：2028年AI實現自我進化，沒有人類了

機器之心Pro 2026-05-05 15:18:37
3 跟貼 3
Anthropic驚悚報告：當AI開始破壞實驗室代碼，人類已無險可守

新智元 2026-05-03 19:13:21
57 跟貼 57

強化學習的進化：從PPO到MaxRL，LLM推理訓練的算法演進史

機器之心Pro 2026-05-05 14:16:31
0 跟貼 0

700多個「壞模型」喂出AI測謊儀？Anthropic審計神器讓AI自曝黑料

新智元 2026-05-05 13:16:24
0 跟貼 0
安心養蝦！從OpenClaw 看云上AI安全落地路徑

量子位 2026-04-18 19:55:39
0 跟貼 0

黃仁勛點名Anthropic達里奧，別一當CEO，就開「上帝視角」

機器之心Pro 2026-05-05 11:11:08
25 跟貼 25

神經計算機橫空出世：AI不再調用軟件，而是直接長成一臺計算機

DeepTech深科技 2026-05-03 18:24:37
30 跟貼 30
大型掛機現場：馬斯克的55萬英偉達GPU，利用率才11%

機器之心Pro 2026-05-05 20:02:20
0 跟貼 0

斯坦福宣布AI戰略重組：將HAI與數據科學合體，李飛飛任校長顧問

DeepTech深科技 2026-05-05 17:19:54
5 跟貼 5
支持遠程操控和通用GUI操作3

機器之心Pro 2026-03-02 13:36:13
0 跟貼 0
AI Agent是科技革命中的一次真正的范式轉移

量子位 2026-04-03 22:52:35
0 跟貼 0
亦莊機器人馬拉松現場名場面合集

量子位 2026-04-20 00:34:54
0 跟貼 0
大模型的魅力在于突發涌現的能力

量子位 2025-12-11 03:38:02
0 跟貼 0
荒野求生（機器狗全自主版），2025ATEC挑戰真實戶外無遙操

量子位 2025-12-08 19:24:34
0 跟貼 0
讓你的龍蝦秒變電影《Her》里的Samantha

量子位 2026-03-23 20:37:07
0 跟貼 0
MIT研究生用NotebookLM兩天學完一學期課程

量子位 2026-03-22 10:50:49
0 跟貼 0
00后小哥復刻Claude最強神話模型OpenMythos

量子位 2026-04-23 11:44:18
0 跟貼 0
LLM數據量大管飽，機器人數據卻連1%的起跑線都沒夠到？

量子位 2026-04-13 20:54:19
0 跟貼 0
博士生如何用龍蝦做知識管理？歡迎圍觀！

量子位 2026-03-26 23:23:30
0 跟貼 0
如何點亮小龍蝦的牛馬技能包?

量子位 2026-03-18 12:51:26
0 跟貼 0
百度沈抖自曝：老忘吃藥，用AI做了個小程序

量子位 2026-03-27 11:25:23
0 跟貼 0
這個時代必須以Agent為中心：三個趨勢回顧

量子位 2026-04-05 02:14:15
0 跟貼 0
陶哲軒：AI不能全用，深度思考不行

量子位 2026-03-19 01:35:49
0 跟貼 0
為什么當年的西方，要把先進高鐵技術，轉讓給中國？

心開動漫鑫鑫 2026-05-05 00:19:54
30 跟貼 30
CTO不香了？百億公司高管們為何集體轉身，去Anthropic當工程師

機器之心Pro 2026-05-03 18:06:39
12 跟貼 12
張雪峰直言錄電氣工程，別錯過這專業真相！

山野寄來信箋 2026-05-03 05:34:39
5 跟貼 5
吳宜澤斯諾克世錦賽奪冠成首位00后斯諾克世錦賽冠軍

央視新聞客戶端 2026-05-05 05:39:09
11589 跟貼 11589
頂級神箭手僅憑祖傳絕技曲線射箭，竟一人干掉整支弓獵手大隊

不哈電影 2026-05-04 15:43:09
7 跟貼 7
5月5日5點55分，GPT-5.5自己選客人開派對！Codex反超Claude Code

新智元 2026-05-05 17:07:29
0 跟貼 0
莫氏雞煲上線湯料包5分鐘售罄4000多份，累計賣出4萬多份，總銷售額破160萬元，記者實測：1分鐘搶到兩包

極目新聞 2026-05-04 09:46:46
8620 跟貼 8620
AReaL v1.0開源，智能體強化學習「一鍵接入」

機器之心Pro 2026-03-05 14:46:18
0 跟貼 0
一命換一命！教授營救至親溺水去世，年僅39歲，知情人透露更多！

云景侃記 2026-05-05 14:41:45
15 跟貼 15
用AI復刻童年游戲，零成本找回老玩家快樂

爬蟲飼養員 2026-05-05 10:29:32
0 跟貼 0
橫掃室內3D場景，港科大（廣州）打造單目開放詞匯占據預測新SOTA

機器之心Pro 2026-05-05 15:33:09
0 跟貼 0
頂級神箭手僅憑絕技曲線射箭，竟以一人之力團滅整個弓箭大隊

影中見影 2026-05-04 00:50:33
29 跟貼 29
全程自動化，也有瑕疵

蛇毒不毒 2026-05-04 13:59:21
1 跟貼 1
華為乾崑在做更難被復制的能力

財經網科技 2026-05-01 20:37:58
0 跟貼 0
CMU等團隊：PAT3D把文生3D從能看推進到能模擬、能交互

機器之心Pro 2026-05-05 15:03:22
0 跟貼 0
23歲業余愛好者靠ChatGPT破解60年數學難題

量子位 2026-04-30 10:33:26
0 跟貼 0
龍蝦軍團有了最強「視力」！一眼看圖直接寫代碼-1

機器之心Pro 2026-04-02 16:56:32
0 跟貼 0

湖雷G1傷情出爐，兩大球星缺席！東契奇回歸訓練+神射三分14中14

湖雷G1傷情出爐，兩大球星缺席！東契奇回歸訓練+神射三分14中14

鍋子籃球

2026-05-05 10:36:19

亮劍中趙剛死前透露：李云龍當年不顧降職也要斬山貓子是另有原因

亮劍中趙剛死前透露：李云龍當年不顧降職也要斬山貓子是另有原因

呆子的故事

2026-02-09 14:19:33

新加坡航空公司航班高度驟降致1死百傷，3名傷者起訴索賠

新加坡航空公司航班高度驟降致1死百傷，3名傷者起訴索賠

現代快報

2026-05-05 17:32:07

許家印認罪！2.4萬億窟窿，家族只拿走500億，其余真金白銀去哪了

許家印認罪！2.4萬億窟窿，家族只拿走500億，其余真金白銀去哪了

蜉蝣說

2026-04-23 09:41:11

當伊朗亮出海底光纜底牌時，全世界才發現，中國藏了一手更絕的

當伊朗亮出海底光纜底牌時，全世界才發現，中國藏了一手更絕的

角落的隱藏美景

2026-05-05 00:15:33

長沙瀏陽市華盛煙花公司法定代表人：胡正平

長沙瀏陽市華盛煙花公司法定代表人：胡正平

行舟問茶

2026-05-05 16:22:08

北京大風藍色預警，局地陣風超8級！明早有雷陣雨

北京大風藍色預警，局地陣風超8級！明早有雷陣雨

魯中晨報

2026-05-05 17:42:03

毛主席后代現狀：無心進入政壇，大多從商，從不言是偉人后代

毛主席后代現狀：無心進入政壇，大多從商，從不言是偉人后代

歷史人文2

2026-05-05 11:30:03

員工展示特斯拉工廠下線的最后一輛 Model X 照片，車身簽滿名字

員工展示特斯拉工廠下線的最后一輛 Model X 照片，車身簽滿名字

金融界

2026-05-04 20:10:26

送完物資，美國軍機飛離北京，特朗普一錘定音，臺當局淪為犧牲品

送完物資，美國軍機飛離北京，特朗普一錘定音，臺當局淪為犧牲品

影孖看世界

2026-05-04 23:08:39

青島西海岸1-1天津津門虎，賽后評分：青島西海岸5號排第一

青島西海岸1-1天津津門虎，賽后評分：青島西海岸5號排第一

側身凌空斬

2026-05-05 20:54:05

瀏陽煙花爆竹企業爆炸事故現場救援有序進行，幸存傷者講述事發時情況

瀏陽煙花爆竹企業爆炸事故現場救援有序進行，幸存傷者講述事發時情況

瀟湘晨報

2026-05-05 15:32:12

零緩沖，全國一刀切！從6月1日起，車主自己去車管所“橫著走”！

零緩沖，全國一刀切！從6月1日起，車主自己去車管所“橫著走”！

夜深愛雜談

2026-05-05 10:14:28

尷尬了，時間過了4個月，6大造車新勢力目標完成率，差的很

尷尬了，時間過了4個月，6大造車新勢力目標完成率，差的很

互聯網.亂侃秀

2026-05-04 12:00:17

鄧文迪三母女閃耀紐約紅毯，高定禮服很東方美，倆女兒又瘦又優秀

鄧文迪三母女閃耀紐約紅毯，高定禮服很東方美，倆女兒又瘦又優秀

攬星河的筆記

2026-05-05 16:55:54

我借調回來任廳長，聚會時小舅子讓我倒酒說：來我公司，一月3500

我借調回來任廳長，聚會時小舅子讓我倒酒說：來我公司，一月3500

千秋文化

2026-05-02 19:49:56

中國一旦發生戰爭，要記得第一時間要帶好這5樣東西，才能保命

中國一旦發生戰爭，要記得第一時間要帶好這5樣東西，才能保命

軒逸阿II

2026-05-05 16:34:53

不是文班不是?？怂?！馬刺爆冷輸球揪出水貨 33歲老將今夏恐退役

不是文班不是?？怂?！馬刺爆冷輸球揪出水貨 33歲老將今夏恐退役

籃球圈里的那些事

2026-05-05 17:15:20

50歲查理茲·塞隆自曝不婚原因：睡小鮮肉太爽了！

50歲查理茲·塞隆自曝不婚原因：睡小鮮肉太爽了！

阿廢冷眼觀察所

2026-05-05 14:57:32

首相出訪，委員長訪華！日本也沒想到中國連基本的面子都不給

首相出訪，委員長訪華！日本也沒想到中國連基本的面子都不給

滄海一書客

2026-05-05 18:53:32

AI產業主平臺領航智能+時代

15136文章數 66837關注度

往期回顧全部

科技要聞

傳蘋果考慮讓英特爾、三星代工設備處理器

頭條要聞

伊朗被問"為何不向美國讓步" 一句話讓美國笑不出來

頭條要聞

伊朗被問"為何不向美國讓步" 一句話讓美國笑不出來

體育要聞

全世界都等著看他笑話，他帶國米拿下冠軍

娛樂要聞

內娛真情誼！楊紫為謝娜演唱會送花籃

財經要聞

瀏陽煙花往事

汽車要聞

同比大漲190% 方程豹4月銷量29138臺

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

健康

教育

親子

家居

公開課

干細胞治燒燙傷面臨這些“瓶頸”

教育要聞

網絡直播《開學第一課·以英烈之名》

親子要聞

在薊縣給你們找到一個非常不錯的幼兒園，太大太爽了！

家居要聞

靈動實用生活藝術場

寂然無界簡潔風格
江景風格流動的秩序
自然肌理溫潤美學

公開課

李玫瑾：為什么性格比能力更重要？

白巖松談人口老齡化：社會要降低老年人門檻
為什么人類有不同的膚色？
七個無法存下錢的壞習慣
李彥宏：百度離破產30天

© 1997-2026 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版