![]()
Anthropic昨晚發布了一篇長文,標題為《When AI builds itself》(當AI自我構建時),聽起來像是阿西莫夫的某本科幻小說,主題也確實是一個很科幻的概念:recursive self-improvement(遞歸自我改進)。
![]()
簡單說,過去是人類研究員寫代碼、跑實驗、訓練模型,然后把AI做得更強。可如果AI自己開始參與設計、訓練、測試、優化自己的后繼版本,那么AI進步的速度就不再只是由人類推動,可能開始由AI“自我進化”。
為此,Anthropic發出呼吁:
“我們認為,如果世界能夠選擇放緩或暫時中止前沿AI的開發,讓社會結構和對齊研究跟上技術進步,這對世界大有裨益。”
這句話聽起來像安全警告,但放在Anthropic準備IPO的時間點上,它也很難不被看作另一種敘事預演:Claude實在太好用了,甚至開始自己創造下一代Claude了。
01
新的風暴已經出現
為了說明AI正在越來越多地參與AI研發本身。Anthropic拿出了大量內部數據。
比如,截至2026年5月,Anthropic合并進代碼庫的代碼中,超過80%由Claude編寫。而在Claude Code發布之前,這個數字還僅是個位數。
到2026年第二季度,按Anthropic的統計,工程師每天合并的代碼量已經比2024年高出約8倍。
![]()
比代碼量更值得注意的是,Claude正在處理更開放的工程問題。
Anthropic在文中說,過去一年里,員工糾正Claude、把Claude拉回正軌,或者中途接手任務的頻率一直在下降。這個變化不只發生在簡單任務上,也發生在最復雜的開放任務上。
所謂開放任務,就是沒有明確說明書的問題。比如系統崩了、訓練任務掛了,工程師自己一開始也不知道答案長什么樣,只能一邊排查一邊判斷。
這類任務過去最依賴人的經驗,而在那些最開放的任務里,Claude的成功率到2026年5月已經達到76%,六個月內提高了50個百分點。
![]()
不只是寫代碼,Anthropic還用Claude做代碼審查,檢查bug、安全漏洞和其他缺陷,他們回溯分析發現,如果過去每次代碼變更都經過Claude自動審查,大約三分之一導致claude.ai線上事故的bug,本可以在上線前被攔下來。
更進一步,Claude已經開始參與研究流程。
Anthropic有一個固定測試:給Claude一段訓練小模型的代碼,讓它在不改錯結果的前提下,想辦法把代碼跑得更快。2025年5月,Claude Opus 4大概能跑出3倍加速;到了2026年4月,Claude Mythos Preview已經把這個數字推到了約52倍。
Anthropic還提到一個開放式AI安全研究案例。他們把一個問題交給Claude驅動的智能體:一個較弱模型能不能可靠監督一個更強模型?
這個過程需要提出假設、測試假設、和并行智能體共享發現、反復迭代。
兩位人類研究員花了一周時間,彌合了大約23%的差距;而Claude在累計約800小時、約1.8萬美元算力消耗下,彌合了97%。
這項結果當然有局限,問題是人類選的,評分標準也是人類定的,結果也沒有完全遷移到生產規模模型上。但它仍然說明,Claude已經可以在一個人類設定好方向的研究框架里,自己設計實驗、自己執行、自己迭代。
另外,在人類研究員“走錯路”的時候,Claude還能給出更好的下一步判斷。
Anthropic找了129個內部Claude Code研究會話,這些會話里,人類研究員和Claude一起解決開放式研究問題。Anthropic挑出其中一些“人類后來證明繞了彎路”的節點,然后把這個節點之前的上下文給不同版本的Claude,看它會建議下一步怎么做。再由另一個知道完整會話結局的Claude judge來判斷:模型建議和人類當時的選擇,哪個更好。
結果表明,在那些人類研究員已經被事后證明有改進空間的節點上,Claude越來越能提出更好的下一步。
![]()
過去,AI模型的進步主要靠人類研究員和工程師推動。人類決定做什么實驗、寫代碼,訓練模型、推動AI的功能迭代。
現在,這條鏈條里越來越多的環節,開始被Claude接走。
Anthropic給出了一個很直觀的階段表:
![]()
2021到2023年,Anthropic和普通科技公司沒什么區別,都是人類在筆記本電腦上寫代碼、寫文檔。
2023到2025年,聊天機器人開始進入工作流。工程師讓模型生成代碼片段,再復制到編輯器里。
2025到2026年,編程智能體出現,Claude開始能自主編寫和修改代碼,有時甚至能獨立完成整個文件。
到了今天,智能體已經可以自己運行代碼,還能把長達數小時的工作委派給其他智能體。
再往后,就是Anthropic真正擔心的那個階段:閉合回路。
如果這一天到來,Claude的后續版本,就可能由Claude自身持續改進——這就是recursive self-improvement,遞歸自我改進。
Anthropic在文中說得很謹慎:我們還沒有走到那一步,遞歸自我改進也不是必然發生。但它依然在強調,通往那一步的路徑,已經開始變得可見。
所以Anthropic才會在文章最后談到減速,甚至暫停。它的意思不是現在所有AI公司立刻停工,而是說,如果未來AI自我改進風險繼續上升,前沿實驗室需要一套協調、可驗證的減速機制。
換句話講,“奇點”就要到了,人類必須加以控制。
02
勢不可擋的Claude
如果只看表面,這是一篇非常具有前瞻意識的安全文檔。Anthropic在講遞歸自我改進,講AI可能越來越快地改進自己,講人類社會需要提前準備減速和暫停機制。
但放在Anthropic準備IPO的時間點上,這篇文章就有了另一層意思。
某種意義上,A廠最近的動態很像班上那種欠兒欠兒的優等生——它確實有能耐,但也確實很裝。
它想說的不只是“我們有一個很強的Claude”,比這更前一步,它想說“Claude正在幫助我們制造更強的Claude”。
如果Anthropic只是賣一個模型或者賣一個工具,它就很難徹底擺脫橫向比較:Anthropic有Claude,OpenAI有GPT;Anthropic有Claude Code,OpenAI有Codex;Anthropic搶企業客戶,OpenAI也搶企業客戶。兩家公司的競爭非常膠著,就看誰能向市場講出更大的故事。
需要注意的是,就在3天前,OpenAI前腳在一份關于前沿AI治理的文件里寫道:
“我們也在今天的系統中看到了遞歸自我改進的早期跡象:AI的發展本身正在被AI加速。
這將加劇開發者和國家之間的競爭壓力,并帶來現有機構無法應對的治理挑戰。”
3天后,Anthropic后腳就說:Claude通往遞歸自我改進的路徑,已經開始變得可見。
![]()
要是Claude真如它所期待的那樣發展,就不是普通產品敘事了,它會變成一個研發飛輪。
Claude寫代碼、跑實驗、優化訓練流程,再反過來減少Anthropic自己產品里的事故……一旦這套系統跑起來,Claude就不只是Anthropic的一個產品,也是Anthropic的重要生產工具。
用戶看到的是Claude這個產品,企業客戶買的是Claude的能力,但Anthropic真正想讓資本市場注意的是:Claude已經嵌入了前沿模型研發的底層流程,它被放到了Anthropic的發動機艙里。
資本市場最喜歡聽飛輪的故事,像聚寶盆一樣財源滾滾:更強的Claude讓Anthropic的工程師能合并更多代碼,更多代碼讓產品和基礎設施迭代更快,更快的迭代讓研究員能跑更多實驗,更多實驗又反過來幫助下一代Claude變強。下一代Claude變強后,再繼續加速Anthropic的研發。
Claude的迭代速度也在支撐這個飛輪。從公開發布時間看,2023年到2025年初,Claude的主要模型更新大多是三四個月一輪,但在進入Claude 4之后,Anthropic的模型更新明顯變密。
Claude 4在2025年5月發布,Opus 4.1在8月發布,Sonnet 4.5在9月發布,Haiku 4.5在10月發布,Opus 4.5在11月發布。
到了2026年,Opus 4.6在2月5日發布,Sonnet 4.6在2月17日發布,Opus 4.7在4月15日發布,Opus 4.8在5月28日發布。Opus 4.7到Opus 4.8,只隔了42天。
Anthropic表面上是在說“這件事可能很危險,我們要提前準備剎車”,但它同時也在暗示:“我們已經看見油門踩下去之后會發生什么。”
IPO敘事的微妙之處就在于此。它一邊把風險講得很重,一邊也把自己的技術位置抬得很高。
不是所有AI公司都有資格討論遞歸自我改進,你得先讓外界相信,你的AI已經進入了AI研發流程,才有資格說這件事可能需要全球協調。
03
OpenAI:怎么可以這樣?
前面提到,就在Anthropic發這篇長文之前,OpenAI剛剛把遞歸自我改進擺上了桌。
但兩家公司的講法很不一樣。
OpenAI那篇《Democratic Governance of Frontier AI》,是一份寫給華盛頓的政策藍圖,它關心的不是“模型怎么變強”,而是當前沿AI繼續往前沖,該如何加以約束。
那篇報告里面提到的大多內容不太適合加以贅述,唯獨一句話關鍵:OpenAI說,今天的系統中,已經可以看到遞歸自我改進的早期跡象。
這句話和Anthropic這篇長文,其實指向同一個方向。
只不過OpenAI在講制度,Anthropic在講自己。
OpenAI的意思是:AI發展太快,現有治理結構可能跟不上,所以需要一套新的規則。
而Anthropic直接把那個系統亮了出來,告訴市場:Claude已經進入了我們的研發流程,所以我們看見了AI自我加速的路徑。
這一手玩得很高明,感覺OpenAI內部指不定已經開始蛐蛐了——這簡直是剽竊創意!明明是我們先來的!
開個玩笑,不過OpenAI確實需要加把勁了,快點把GPT 5.6抬上來吧。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.