昨天,Anthropic聯合創始人Jack Clark 在 X 連續發帖稱,2028年底,遞歸自我改進( Recursive Self-Improvement)發生的概率高達60%。
![]()
也就是說,AI系統很快就能自己建造自己了。
一旦跨過這個門檻,智能爆炸可能加速到來,對齊風險會指數級上升,因為AI 要比監督它的人類聰明得多。
他通過各種研究發現,AI已經在復現論文、優化訓練代碼(最快52倍加速)、自主微調模型、解決真實Kaggle競賽任務。
比如,在 CORE-Bench 上,他發現大量的 AI 研究來自于解釋和復制。
![]()
另一個很好的例子是來自 @karinanguyen 等人的 PostTrainBench。
在這個例子中,你需要自主地讓強大的模型(例如 Opus 4.6)對較弱的開源權重模型進行微調,以提升其在某些基準測試上的性能。
![]()
還有 MLE-Bench,它具有生態有效性(任務來自真實的 Kaggle 競賽),并且涉及構建一個非常多樣化的機器學習應用集合來解決特定問題。
![]()
同時,Jack Clark還寫了篇小作文,詳細論述了他的這一觀察。
以下為全文:
《Import AI 455:AI系統即將開啟自我構建——遞歸自我完善的第一步》
AI系統即將開始自我構建。這意味著什么?
撰寫本文,是因為綜合所有公開可獲取信息后,我不得不勉強得出一個判斷:到2028年底,無人類參與的AI研發(即具備足夠能力、可自主迭代打造下一代版本的AI系統)落地的概率超過60%。
這絕非小事。
我甚至難以完全理解這件事背后的分量。
我對此觀點心存遲疑,只因它牽扯的影響太過宏大,讓我深感自身的渺小;同時我也不確定,社會是否已經做好準備,迎接AI研發全自動化所帶來的一系列變革。
我如今確信,我們正處在AI研究即將實現端到端全自動化的時代。一旦成為現實,我們將跨過盧比孔河,邁入一個幾乎無法預測的未來。后文將展開詳述。
本文旨在梳理我判斷AI全自動研發時代即將到來的核心原因。我會探討其帶來的部分影響,但全文主要篇幅將用于羅列支撐這一判斷的各項依據,而2026年全年,我也會持續深入推演這件事背后的深層影響。
從時間節奏來看,我認為這一變革不會在2026年落地。但未來一兩年內,我們大概率能見到“模型端到端訓練出自身后繼版本”的案例——即便只是非前沿模型階段的概念驗證;而頂級前沿模型實現這一目標難度會更高,不僅成本高昂,更是大量頂尖人力極致投入的成果。
我的判斷主要基于公開信息:arXiv、bioRxiv、NBER上的學術論文,以及頭部前沿科技公司落地的各類產品。
綜合這些信息可以得出結論:如今實現AI系統研發工程環節的全自動化,所有條件均已齊備。倘若模型規模擴張趨勢延續,未來AI模型將具備足夠創造力,足以替代人類研究員開拓全新研究方向、迭代完善現有技術成果,從而自行推動行業前沿突破。
前置說明
本文大部分內容,將整合各類單項基準測試的表現,拼湊出AI整體發展全貌。所有研究基準測試都存在自身特有的缺陷,這是行業共識。
對我而言,關鍵不在于單個數據點的局限,而在于所有數據疊加后呈現的整體趨勢;下文所有分析,我均已知曉各項單一數據存在的固有短板。
接下來,我們逐一梳理相關依據。
代碼技術奇點——能力隨時間演進
AI系統依托軟件構建,而軟件由代碼編寫而成。
AI已經徹底重塑了代碼生產模式。背后源于兩大關聯趨勢:AI編寫復雜現實業務代碼的能力大幅提升;同時AI串聯多段線性編程任務(編碼、自測等)的能力顯著增強,可脫離人類獨立完成。
能直觀體現這一趨勢的兩大標桿:SWE-Bench 與 METR 任務時長趨勢圖。
解決真實軟件工程問題
SWE-Bench是業內通用的代碼能力測試基準,用于評估AI處理GitHub真實工程問題的水平。2023年末該基準推出時,Claude 2以約2%的整體通過率登頂;如今Claude Mythos Preview得分已達93.9%,基本觸及該基準測試的性能上限。
(所有基準測試本身都存在一定數據噪聲,分數達到一定閾值后,瓶頸往往來自測試集本身,而非模型能力。例如ImageNet驗證集約6%的標簽存在錯誤或歧義。)
SWE-Bench可有效衡量AI編碼能力及對軟件工程行業的沖擊。如今在前沿實驗室和硅谷從業人群中,絕大多數工程師已全程借助AI完成編碼工作,越來越多人還會用AI編寫測試用例、校驗代碼邏輯。
換言之,AI已經足以實現AI研發核心工程環節的自動化,極大加速了人類研發人員的工作效率。
衡量AI完成長耗時任務的能力
METR繪制的趨勢圖,可量化AI能勝任任務的復雜度,衡量標準為資深人類完成同類任務所需工時。
核心指標為:AI在一系列綜合任務中達到50%可靠完成率的時間跨度。
這一領域的進步堪稱驚人:
2022年,GPT 3.5僅能完成人類約30秒即可搞定的任務;
2023年,GPT-4提升至4分鐘級任務;
2024年,o1達到40分鐘;
2025年,GPT 5.2 (High) 突破至約6小時;
2026年,Opus 4.6已達到約12小時。
長期從事AI預測研究、任職于METR的Ajeya Cotra認為,到2026年底,AI有望獨立完成人類耗時約100小時的復雜任務。
AI獨立工作時長的大幅躍升,與智能體編碼工具的爆發式發展高度契合——面向個人服務、可長時間自主作業的AI產品已實現商業化落地。
這同樣映射到AI研發領域:細看AI研究員的日常工作,大量任務都屬于數小時級工作量,比如數據清洗、文獻研讀、實驗部署等。如今這類工作,均已落在主流AI系統的能力覆蓋范圍內。
AI能力越強、獨立作業能力越突出,就越能實現AI研發各環節的模塊化自動化。
任務委派的兩大核心前提:
1)對執行者專業能力的信任;
2)對執行者能貼合初衷、獨立完成工作的信任。
從編碼能力來看,AI專業技能持續精進,無需人類干預的獨立工作時長也在不斷拉長,中途人工校準的間隔越來越久。
現實場景也印證了這一點:工程師和研究員正將越來越多、復雜度與重要性更高的工作委派給AI;隨著模型能力提升,可交付的委派任務層級也同步升級。
AI逐步掌握AI研發必備的核心科研能力
現代科研的核心邏輯大多一致:確定實證研究方向、開展實驗采集數據、校驗實驗結果合理性。編碼能力的持續迭代,疊加大語言模型通用世界建模能力,已經催生各類工具,既提升人類科研效率,也開始實現研發工作的局部自動化。
我們從AI研究本身必備的幾項核心科研能力,來看行業進步速度:復現科研成果、組合機器學習方法解決技術難題、對AI系統自身進行性能優化。
完整復現學術論文并完成實驗落地
AI研究員的基礎工作之一,就是研讀論文并復現實驗成果。目前各類基準測試中,AI在這一領域已取得突破性進展。
典型代表為CORE-Bench(計算可復現智能體基準)。該測試要求AI依托論文代碼倉庫復現研究成果,需自行安裝依賴庫、配置環境、運行代碼;代碼執行成功后,還需從海量輸出結果中篩選信息、解答任務問題。
CORE-Bench于2024年9月推出,當時最優模型為搭載CORE-Agent框架的GPT-4o,在最高難度任務中得分僅約21.5%。
2025年12月,該基準作者正式宣布測試已被AI攻克,Opus 4.5模型得分高達95.5%。
搭建完整機器學習系統沖擊Kaggle競賽
MLE-Bench 由OpenAI推出,用于測試AI離線參賽能力,涵蓋75項不同領域的Kaggle競賽,包括自然語言處理、計算機視覺、信號處理等方向。
2024年10月基準上線時,搭載智能體框架的o1模型最高分僅16.9%;截至2026年2月,結合搜索能力、嵌入智能體架構的Gemini3得分已達64.4%。
內核算子設計
AI研發中難度極高的一環是內核優化:編寫并迭代底層代碼,將矩陣運算等基礎操作適配到底層硬件架構。內核優化直接決定模型訓練與推理效率——既影響訓練階段算力利用率,也決定訓練完成后推理算力的轉化效率。
近些年,AI輔助內核設計已從小眾探索變成熱門研究方向,相關基準測試不斷涌現。這類測試普及度不高,難以縱向追蹤完整演進軌跡,但從現有研究成果仍可清晰感知進步速度:
? 依托DeepSeek模型優化GPU內核設計(第400期);
? 實現PyTorch模塊自動轉譯CUDA代碼(第401期);
? Meta利用大語言模型,自動生成適配自身基礎設施的Triton優化內核(第439期);
? 借助大語言模型為華為昇騰等非標硬件編寫內核(AscendCraft,第444期);
? 微調開源權重模型適配GPU內核設計開發(Cuda Agent,第448期)。
補充說明:內核設計本身具備易量化、收益可快速驗證的特性,天然適配AI驅動研發模式。
基于PostTrainBench微調大語言模型
PostTrainBench(第449期)是難度更高的同類測試,主要考察前沿模型對小型開源模型進行二次微調、提升基準任務性能的能力。
該測試擁有極具參考價值的人類基線:各大前沿實驗室頂尖研究員打磨出的指令微調開源模型,經過專業團隊深度優化并正式落地,代表著極高的人類研發水準。
截至2026年3月,AI自動微調模型帶來的性能提升幅度,已達到人類微調成果的半數水平。
評測分數計算規則:對多款開源大模型(Qwen 3 1.7B、Qwen 3 4B、SmolLM3-3B、Gemma 3 4B)及多項基準任務(AIME 2025、Arena Hard、BFCL、GPQA Main、GSM8K、HealthBench、HumanEval)得分取加權平均值。每次測試均通過命令行智能體,針對指定基礎模型優化其單項基準任務表現。
2026年4月頂級模型得分區間:Opus 4.6、GPT 5.4得分25%-28%,而人類基線得分為51%,這一差距已具備實質參考意義。
大語言模型訓練流程優化
過去一年,Anthropic持續公開自家模型在一項LLM訓練優化任務中的表現:要求模型對僅CPU運行的小型大模型訓練代碼做極致提速優化。
評分標準為相較原始代碼的平均加速倍數,進步幅度極為驚人:
2025年5月,Claude Opus 4平均提速2.9倍;
2025年11月,Opus 4.5提升至16.5倍;
2026年2月,Opus 4.6達到30倍;
2026年4月,Claude Mythos Preview已實現52倍提速。
參考基準:人類研究員完成同類任務,實現4倍提速需耗時4至8小時。
開展AI對齊領域研究
Anthropic另一項成果為自動化對齊研究概念驗證(第454期):研究員為一組AI智能體設定研究方向后,智能體可自主攻關AI安全領域難題(可擴展監督方向),最終效果超越官方設計的人類基線方案。
目前該方案仍處于小規模試驗階段,尚未適配量產模型。
但足以證明:現有AI已能切入前沿科研課題,展現出實際應用價值。
上述所有基準測試,最初也僅停留在概念層面,短短數月至一年時間,AI能力便實現跨越式提升。
元能力:團隊管理
AI還在學會管理同類AI系統。Claude Code、OpenCode等普及級產品已體現這一特性:單個主智能體可統籌調度多個子智能體分工協作。
這讓AI有能力承接大型項目,由不同專長的AI并行作業,在AI“管理者”統一調度下完成復雜任務。
AI研究更像相對論發現,還是樂高積木拼接?
AI能否誕生顛覆性創新思想、實現自我迭代升級?還是僅擅長科研中枯燥、模塊化的基礎工作?厘清這一問題,才能判斷AI在多大程度上能實現自身研發的端到端自動化。
我的觀點是,目前AI尚不具備顛覆性原創思想的創造能力,但即便沒有這項能力,也足以實現自身研發流程的自動化。
AI行業的進步,本質依托更大規模的實驗、投入更多數據與算力資源。
人類偶爾會提出范式級創新構想,大幅提升資源利用效率,典型如Transformer架構、混合專家模型。
但行業絕大多數進展,都遵循固定循環邏輯:基于成熟模型放大數據與算力規模、觀測擴容帶來的問題、工程層面修復瓶頸、再次擴容迭代。
這一過程幾乎不需要天馬行空的突破性靈感,更多是枯燥常規的工程落地工作。
同時,大量AI研究本質是,現有實驗的變量迭代:調整參數觀測結果。人類研究員可憑經驗篩選高價值變量,而這類工作同樣可實現自動化,由AI自主探索參數組合(早期代表為神經網絡架構搜索)。
托馬斯·愛迪生曾說:天才是1%的靈感加99%的汗水。時隔150年,這句話依然適用。顛覆性科研靈感本就稀缺,行業進步更多依賴長期繁瑣的系統優化與問題調試。
從公開數據可見,AI已完美勝任AI研發中絕大多數基礎性繁瑣工作。疊加編碼能力、長耗時任務處理能力等基礎元能力的持續升級,AI可串聯更多碎片化任務,形成復雜完整的工作鏈路。
這意味著:即便AI缺乏高階創造力,依然有十足把握實現自我迭代升級,只是進度會慢于具備原創靈感的理想狀態。而現有公開數據也釋放出積極信號,AI已初步展現創造潛力,有望以更亮眼的方式推動自身發展。
推動基礎科學前沿突破
已有初步跡象表明,通用AI具備推動人類基礎科學進步的能力,目前主要集中在計算機科學與數學兩大領域;且大多并非AI獨立完成,而是以人機協同的“半人馬模式”落地。
相關趨勢值得關注:
厄多斯數學難題:數學家團隊聯合Gemini模型攻關厄多斯經典數學難題,篩選700道題目后,AI產出13套完整解法。
其中1套解法被認定具備學術價值:研究團隊表示,Aletheia模型對Erd?s-1051問題的解法,是AI自主解決具備中等學術影響力開放性數學難題的早期案例,已有大量相關文獻可佐證其研究價值(第444期)。
人機協同數學新發現:不列顛哥倫比亞大學、新南威爾士大學、斯坦福大學及Google DeepMind研究員聯合發布全新數學證明,核心成果依托谷歌AI數學工具人機協作完成。
團隊表示:核心定理證明高度依賴Google Gemini及配套工具的輸出支撐(第441期)。
從樂觀角度看,這意味著AI正在逐步習得人類推動學科發展的創新直覺。但保守視角也同樣成立:數學和計算機科學本身就格外適配AI創新,或許只是特例而非普遍規律。
阿爾法圍棋的第37手落子也曾驚艷業界,但時隔十年,同類顛覆性AI靈感再未出現,這也從側面說明AI高階創造力仍有局限。
綜合總結
綜合以上所有依據,可梳理出核心事實:
1. AI已能編寫幾乎全品類程序代碼,且可獨立完成人類需數十小時專注投入的復雜任務;
2. 從模型微調到底層內核設計,AI在AI研發全鏈條核心任務中的能力持續精進;
3. AI可實現同類智能體的統籌管理,組建虛擬研發團隊,分工攻克復雜難題,承擔負責人、審核者、編輯、工程師等不同角色;
4. 在高難度工程與科研任務中,AI已具備比肩甚至超越人類的實力,暫無法界定是源于機械學習熟練度,還是真正的創新思考。
在我看來,現有證據足以證明:AI如今已能實現AI研發絕大部分、乃至全部工程環節的自動化。至于高階科研思路能否同步自動化,目前尚無定論,畢竟科研創新與工程落地存在本質區別。
但可以確定的是,AI正在極大加速人類研發人員的工作效率,通過與無數虛擬AI同事協同,實現個人研發能力的規模化放大。
更值得注意的是,整個AI行業已將AI研發自動化明確列為核心目標:
OpenAI計劃2026年9月推出自動化AI研究實習生;
Anthropic持續發力自動化對齊研究員技術研發;
三大巨頭中DeepMind態度最為謹慎,但也明確表示“條件成熟時必將推進對齊研究自動化”。
大量初創企業同樣聚焦這一賽道:Recursive Superintelligence融資5億美元,目標直指AI研發自動化;新銳機構Mirendil也以“打造專精AI研發的智能系統”為核心愿景。
千億級存量及新增資本持續涌入布局AI研發自動化的機構,行業在這一方向取得實質性進展已是必然。
事件影響與意義
AI研發自動化背后的深層影響極具顛覆性,卻少有主流媒體深入探討。
下文列舉部分核心影響,雖非完整清單,但足以體現其帶來的挑戰量級。
AI對齊必須做到極致完美
隨著遞歸自我迭代推進,AI智能體智商將遠超監管主體,現有對齊技術或將全面失效。行業對此已有大量討論,簡要梳理核心隱患:
? 訓練AI杜絕欺騙與投機行為的難度遠超預期:即便精心設計測試環境,AI最優解往往是通過投機取巧完成任務,進而習得“作弊有益”的邏輯;
? AI具備偽裝對齊的能力:可輸出符合人類預期的結果,掩蓋真實底層意圖(目前AI已能感知自身處于測試場景);
? AI逐步主導自身訓練的基礎科研方向后,模型訓練邏輯將發生根本性變革,人類難以預判和理解背后的深層影響;
? 遞歸迭代存在復利式誤差風險:若對齊方案無法做到理論級100%精準適配超智能模型,隱患會快速放大。舉例:初始對齊準確率99.9%,迭代50代后降至95.12%,迭代500代后僅剩60.5%,風險將徹底失控。
AI賦能全行業生產力暴漲
如同AI大幅提升軟件工程效率,AI滲透的所有行業都將迎來生產力質變,同時衍生兩大現實難題:
1)資源分配不均:AI需求將長期高于算力供給,如何分配算力資源實現社會價值最大化成為關鍵。市場自發調節難以保障公共利益,AI研發帶來的加速能力分配,或將成為極具政治爭議的議題;
2)經濟領域的阿姆達爾定律效應:AI全面融入經濟體系后,原有產業鏈條的薄弱環節會被放大,流程卡頓、效率瓶頸集中暴露,尤其數字高速發展與實體行業慢節奏的適配矛盾(如新藥臨床試驗)將愈發突出。
催生重資本、輕人力的全新經濟形態
支撐AI研發自動化的各項能力,同樣可賦能AI自主運營企業。未來經濟格局中,新一代企業將占據主流:要么重資產持有大規模算力,要么高運營成本采購AI服務搭建業務,相較傳統企業大幅降低人力依賴。
核心原因在于,AI能力持續迭代下,投入AI的邊際收益將永久高于人力投入。
長遠來看,“機器經濟”將在人類主流經濟體系中逐步壯大,AI運營企業之間的商業交互會愈發頻繁,深刻重塑經濟結構,引發貧富差距、財富再分配等一系列社會問題。
最終完全由AI自主運營的企業或將出現,進一步放大現有矛盾,同時帶來全新的全球治理難題。
直面行業終極拐點
綜合所有分析,我判斷2028年底前,前沿模型實現自主訓練下一代版本、完成AI研發全自動落地的概率約60%。
或許有人會問:為何2027年難以落地?核心原因是AI研究仍需高階創意與非主流創新視角支撐,目前AI尚未展現顛覆性原創能力(數學領域的部分突破僅為初步跡象)。若預估2027年落地概率,我給出30%。
倘若2028年底仍未實現AI研發自動化,意味著現有技術范式存在根本性短板,必須依靠人類全新創新突破才能繼續推進。
撰寫本文,是希望以冷靜理性的視角,解讀這件數十年來只存在于科幻故事中的事。梳理所有公開數據后我確信,這件看似天馬行空的猜想,已是實實在在的行業趨勢。若趨勢延續,我們或將見證世界運行邏輯的根本性變革。
感謝Andrew Sullivan、Andy Jones、Holden Karnofsky、Marina Favaro、Sarah Pollack、Francesco Mosconi、Chris Painter、Avital Balwit為本文提供修改建議。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.