无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

AI正在加速自我進化,留給人類的時間不多了

0
分享至

6月5日,Anthropic發表了一篇警示文章,《When AI buildes itself》,當 AI 開始建造自己,不禁要思考,我們人類角色將如何改變?

在 AI 發展的歷史中,人類長期主導著每一個開發環節。但如今,在 Anthropic,我們正將越來越多的AI開發工作委托給AI系統自身,這極大加速了我們的工作進展。


圖源:Anthropic

漢化:MarsKr

如果這一趨勢走得足夠遠,再配合充足的算力,最終可能誕生一個完全自主設計并開發自身繼任者的AI系統,這就是遞歸自我改進(Recursive Self-Improvement)。

我們尚未完全抵達這一步,且它并非必然發生。但Anthropic Institute的最新報告顯示:這一趨勢可能比大多數機構預想的來得更早

AI已在顯著加速AI自身的開發。一個最直觀的例子是:如今Anthropic工程師平均每個季度輸出的代碼量,是2021-2025年期間的8倍

這些趨勢意味著AI能力將在未來幾年大幅躍升。它可能帶來科學、醫療等領域的巨大福祉,但也可能大幅增加人類失去對AI控制的風險。當系統能自主構建后繼者時,安全、監控和行為引導將變得至關重要。

01

—外部世界的證據:AI能力加速提升

AI 模型能可靠獨立完成的任務長度,正在每4個月翻一番(此前是每 7 個月)。

2024年3月:Claude Opus 3 可完成人類約 4 分鐘的任務;

2025年:Claude Sonnet 3.7 可處理約 1.5 小時的任務;

2026年:Claude Opus 4.6 已能應對 12 小時的任務。



圖源:Anthropic

漢化:MarsKr

若趨勢延續,今年內 AI 就可能處理需人類數天完成的任務;2027年,甚至可能達到數周量級。

在基準測試上也呈現飽和趨勢:

SWE-bench(真實軟件工程):兩年內從個位數得分到接近飽和;CORE-Bench(科研復現):15 個月內從 20% 成功率到接近飽和;METR 測試顯示,Claude Mythos Preview 已能連續工作至少 16 小時

02

—Anthropic內部證據:AI已深度參與開發

構建前沿模型主要分為工程(寫代碼、搭建基礎設施、訓練模型)和研究(設計實驗、解讀結果、決定下一步)兩大類。

在工程領域:Claude能接手不完全明確的問題,自主找出解決方案。人類只需提供目標,無需提供具體方法。

在研究領域:Claude已能在執行明確實驗時匹配甚至超越熟練人類,但在大方向判斷和目標選擇上,仍存在明顯差距。這正是當前AI與“自主設計繼任者”之間的關鍵鴻溝。

代碼產出爆炸式增長

截至2026年5月,Anthropic合并到主代碼庫的代碼中, 超過80%由Claude撰寫(2025年2月Claude Code推出前,這一比例僅為個位數)。

2025年開始,工程師每天合并的代碼行數顯著上升;2026年,隨著模型自主工作時間延長,斜率進一步陡峭。

2026年第二季度,典型工程師的日代碼合并量是2024年的 8倍


圖源:Anthropic

漢化:MarsKr

盡管代碼行數不是完美指標(更重視質量而非數量),但這清晰反映了生產力加速。員工主觀調查也顯示:2026年3月,中位員工認為使用Mythos Preview后,產出提升約4倍

Claude不僅寫得多,還寫得越來越好:

工程師干預、糾正Claude的比例持續下降。

在最開放的任務上,2026年5月成功率達 76%(半年提升50個百分點)。

示例:一次例行升級導致數萬訓練任務崩潰,Claude僅用約2小時就定位問題并修復(人類通常需2-3天)。

代碼質量方面:2025年底Claude代碼略遜于人類,如今已接近持平,預計年內將超越。Anthropic現在使用Claude自動審查代碼變更,甚至能捕捉到頂尖工程師之前遺漏的部分bug。

研究能力同樣突飛猛進

在優化明確實驗目標時,Claude從2025年的~3x加速提升到2026年的~52x(人類熟練研究員需4-8小時達4x)。

2026年4月,Claude驅動的代理完成了首個端到端開放研究項目:在AI安全問題上,自主提出假設、測試、迭代,恢復了97%的性能差距(人類兩名研究員一周約23%)。

在開放調查任務中,模型判斷“下一步最佳行動”的能力也在提升。

一位Anthropic員工感慨:“我大約一年前開始深度依賴Claude,現在已經5個月沒親自寫代碼了。”

03

—未來工作形態:人類角色正在收窄

證據顯示,人類在AI開發各環節中的角色正在縮小:

代碼質量持平后,人類可能徹底停止寫代碼,轉向審查。但審查速度若跟不上生成速度,將成為新瓶頸。

實驗執行自動化后,瓶頸轉向“哪些實驗值得做”。

人類當前的比較優勢在于研究品位與判斷力:選擇重要問題、判斷結果可信度、識別死胡同等。

但即使人類僅負責“方向設定”,AI也能讓每個人“駕馭”遠超以往的工作量,從而實現復合加速。

04

—三種可能的未來

趨勢放緩,但當前能力廣泛擴散

指數曲線可能轉為S曲線,規模收益遞減。新架構或供應鏈(能源、芯片)成為限制。即使能力凍結在當前水平,世界也會巨變:100人公司可做1000人公司的事,網絡安全等領域的瓶頸已從“發現漏洞”轉向“快速修復”。

持續復合效率提升

AI開發高度自動化,人類負責方向與判斷。組織生產力大幅躍升,知識工作和政府服務將被重塑。但同時可能被用于監控、操縱等有害用途。瓶頸會轉移(Amdahl定律),如何快速識別并解決新瓶頸將成為關鍵能力。

完全遞歸自我改進

AI自主設計繼任者,進步速度由算力決定。人類轉向監督與驗證,“虛擬實驗室”主導研發。這一能力將快速轉移到其他科學領域。經濟和社會形態可能劇變,但許多現實瓶頸(如臨床試驗、治理節奏)仍由人類世界決定。

05

—我們該怎么辦?

如果能有效放緩前沿AI開發,為社會適應和對齊研究贏得時間,將是好事。但單方面放緩可能讓最不謹慎的行動者領先。

Anthropic認為,建立可驗證的全球協調機制至關重要。我們將開展研究并推動構建相關系統,以便在多國前沿實驗室達成一致時,能可靠驗證各方確實暫停或放緩開發。


圖源:Anthropic

漢化:MarsKr

未來幾個月,我們將組織政策制定者、研究者、公民社會和AI公司的對話,共同探討遞歸自我改進的含義及協調方案。歡迎更多外部聲音參與這場至關重要的審議。

AI的未來,不僅取決于技術,更取決于我們今天的選擇。

參考

https://www.anthropic.com/institute/recursive-self-improvement

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
楊振寧去世8個月,50歲翁帆現身新疆旅行,狀態年輕很像大學生

楊振寧去世8個月,50歲翁帆現身新疆旅行,狀態年輕很像大學生

林輕吟
2026-06-10 07:31:48
阿斯:科莫支付1600萬歐買斷莫拉塔,球員已正式加盟

阿斯:科莫支付1600萬歐買斷莫拉塔,球員已正式加盟

懂球帝
2026-06-10 08:17:24
高考剛結束家長已經開始“搶跑”了!6月13日到16日一步慢步步慢

高考剛結束家長已經開始“搶跑”了!6月13日到16日一步慢步步慢

戶外阿毽
2026-06-10 17:08:55
中國臺東執法第3天!日本回應了:官木原稔表態,小泉表態

中國臺東執法第3天!日本回應了:官木原稔表態,小泉表態

擊你的心靈深處
2026-06-10 13:15:28
為什么大佬寫的推薦信都多短?網友:讓他過去,要么我過來!

為什么大佬寫的推薦信都多短?網友:讓他過去,要么我過來!

夜深愛雜談
2026-06-09 22:11:36
“鵝腿阿姨”騙北大清華學子事件

“鵝腿阿姨”騙北大清華學子事件

吃瓜體
2026-06-10 14:11:31
國內50后還剩多少人?真實數字曝光,活到80歲的比例太意外!

國內50后還剩多少人?真實數字曝光,活到80歲的比例太意外!

童童聊娛樂啊
2026-06-10 13:35:14
央視發布世界杯版權保護聲明:只能在這些平臺看

央視發布世界杯版權保護聲明:只能在這些平臺看

3DM游戲
2026-06-10 17:28:06
51歲安吉麗娜攜22歲養子打匹克球,輸球瞬間表情管理失敗

51歲安吉麗娜攜22歲養子打匹克球,輸球瞬間表情管理失敗

淺遇時光
2026-06-09 02:35:36
他是導致臺灣難以收復的關鍵人物,若不是他,臺灣或許早就解放了

他是導致臺灣難以收復的關鍵人物,若不是他,臺灣或許早就解放了

兵卒史
2026-06-10 04:40:13
日本被斷供稀土超4個月,日本制造沒倒,靠什么躲過了致命一擊

日本被斷供稀土超4個月,日本制造沒倒,靠什么躲過了致命一擊

深度解析熱點
2026-05-25 13:56:20
無照飛行16年,還當上機長!加航一飛行員,飛了900多次國際國內航班,退休當年才被發現

無照飛行16年,還當上機長!加航一飛行員,飛了900多次國際國內航班,退休當年才被發現

每日經濟新聞
2026-06-10 17:10:31
當年迷倒一片,如今62歲零緋聞!國家一級演員的她憑啥這么狂?

當年迷倒一片,如今62歲零緋聞!國家一級演員的她憑啥這么狂?

楓塵余往逝
2026-06-09 08:52:51
巴薩重磅:33場造28球巨星收到報價,8000萬轉會費+四倍年薪!

巴薩重磅:33場造28球巨星收到報價,8000萬轉會費+四倍年薪!

陌識
2026-06-09 15:13:06
寧德時代終極電池殺到!續航 7000km 不是夢,電車價格直接打一折

寧德時代終極電池殺到!續航 7000km 不是夢,電車價格直接打一折

沙雕小琳琳
2026-06-09 01:10:17
留隊無望,拉什福德社媒簡介刪除巴薩

留隊無望,拉什福德社媒簡介刪除巴薩

懂球帝
2026-06-10 17:18:34
688146,暴漲超620%,A股年內第一!AI賽道新黑馬題材來了,正宗受益股數量稀缺

688146,暴漲超620%,A股年內第一!AI賽道新黑馬題材來了,正宗受益股數量稀缺

數據寶
2026-06-10 18:15:01
搬水泥的大叔找到了親人,黑心老板被拘留了,接下來為他討要工資

搬水泥的大叔找到了親人,黑心老板被拘留了,接下來為他討要工資

漢史趣聞
2026-06-10 14:24:51
香港女星睡夢中離世,曾出演《功夫足球》,生前曾被騙走畢生積蓄

香港女星睡夢中離世,曾出演《功夫足球》,生前曾被騙走畢生積蓄

她時尚丫
2026-06-09 20:12:47
歐文:英格蘭隊有十分強大的陣容,能在本屆世界杯中走得很遠

歐文:英格蘭隊有十分強大的陣容,能在本屆世界杯中走得很遠

懂球帝
2026-06-10 05:05:08
2026-06-10 19:15:00
NASA愛好者 incentive-icons
NASA愛好者
天文愛好者團隊
931文章數 52405關注度
往期回顧 全部

科技要聞

凌晨突發!Anthropic神級模型向你開放

頭條要聞

廣州公交客流暴跌59% 10個曾經坐車的乘客中6個不坐了

頭條要聞

廣州公交客流暴跌59% 10個曾經坐車的乘客中6個不坐了

體育要聞

2026世界杯,我們看什么?

娛樂要聞

蒙淇淇發文開撕白鹿!輿論再次反轉

財經要聞

一紙研報引"光"速下跌 CPO落地節奏有變?

汽車要聞

首款搭載激光雷達的A00級車型 2026款海鷗煥新上市

態度原創

旅游
親子
游戲
公開課
軍事航空

旅游要聞

“玩”美新消費|在未來感湯泉館解鎖都市“微度假”

親子要聞

精神科專家稱心理健康的孩子情緒更穩定、人際關系更好、學習更輕松

敖廠長復出被全網噴爆!彈幕刷屏怒稱“也夠”

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

伊朗襲擊美軍第五艦隊

無障礙瀏覽 進入關懷版