網易首頁 > 網易號 > 正文申請入駐

Anthropic高喊狼（AGI）來了，是為了人類還是IPO？

2026-06-05 14:59:59　來源: 字母榜

北京舉報

分享至

Anthropic昨晚發布了一篇長文，標題為《When AI builds itself》（當AI自我構建時），聽起來像是阿西莫夫的某本科幻小說，主題也確實是一個很科幻的概念：recursive self-improvement（遞歸自我改進）。

簡單說，過去是人類研究員寫代碼、跑實驗、訓練模型，然后把AI做得更強。可如果AI自己開始參與設計、訓練、測試、優化自己的后繼版本，那么AI進步的速度就不再只是由人類推動，可能開始由AI“自我進化”。

為此，Anthropic發出呼吁：

“我們認為，如果世界能夠選擇放緩或暫時中止前沿AI的開發，讓社會結構和對齊研究跟上技術進步，這對世界大有裨益。”

這句話聽起來像安全警告，但放在Anthropic準備IPO的時間點上，它也很難不被看作另一種敘事預演：Claude實在太好用了，甚至開始自己創造下一代Claude了。

新的風暴已經出現

為了說明AI正在越來越多地參與AI研發本身。Anthropic拿出了大量內部數據。

比如，截至2026年5月，Anthropic合并進代碼庫的代碼中，超過80%由Claude編寫。而在Claude Code發布之前，這個數字還僅是個位數。

到2026年第二季度，按Anthropic的統計，工程師每天合并的代碼量已經比2024年高出約8倍。

比代碼量更值得注意的是，Claude正在處理更開放的工程問題。

Anthropic在文中說，過去一年里，員工糾正Claude、把Claude拉回正軌，或者中途接手任務的頻率一直在下降。這個變化不只發生在簡單任務上，也發生在最復雜的開放任務上。

所謂開放任務，就是沒有明確說明書的問題。比如系統崩了、訓練任務掛了，工程師自己一開始也不知道答案長什么樣，只能一邊排查一邊判斷。

這類任務過去最依賴人的經驗，而在那些最開放的任務里，Claude的成功率到2026年5月已經達到76%，六個月內提高了50個百分點。

不只是寫代碼，Anthropic還用Claude做代碼審查，檢查bug、安全漏洞和其他缺陷，他們回溯分析發現，如果過去每次代碼變更都經過Claude自動審查，大約三分之一導致claude.ai線上事故的bug，本可以在上線前被攔下來。

更進一步，Claude已經開始參與研究流程。

Anthropic有一個固定測試：給Claude一段訓練小模型的代碼，讓它在不改錯結果的前提下，想辦法把代碼跑得更快。2025年5月，Claude Opus 4大概能跑出3倍加速；到了2026年4月，Claude Mythos Preview已經把這個數字推到了約52倍。

Anthropic還提到一個開放式AI安全研究案例。他們把一個問題交給Claude驅動的智能體：一個較弱模型能不能可靠監督一個更強模型？

這個過程需要提出假設、測試假設、和并行智能體共享發現、反復迭代。

兩位人類研究員花了一周時間，彌合了大約23%的差距；而Claude在累計約800小時、約1.8萬美元算力消耗下，彌合了97%。

這項結果當然有局限，問題是人類選的，評分標準也是人類定的，結果也沒有完全遷移到生產規模模型上。但它仍然說明，Claude已經可以在一個人類設定好方向的研究框架里，自己設計實驗、自己執行、自己迭代。

另外，在人類研究員“走錯路”的時候，Claude還能給出更好的下一步判斷。

Anthropic找了129個內部Claude Code研究會話，這些會話里，人類研究員和Claude一起解決開放式研究問題。Anthropic挑出其中一些“人類后來證明繞了彎路”的節點，然后把這個節點之前的上下文給不同版本的Claude，看它會建議下一步怎么做。再由另一個知道完整會話結局的Claude judge來判斷：模型建議和人類當時的選擇，哪個更好。

結果表明，在那些人類研究員已經被事后證明有改進空間的節點上，Claude越來越能提出更好的下一步。

過去，AI模型的進步主要靠人類研究員和工程師推動。人類決定做什么實驗、寫代碼，訓練模型、推動AI的功能迭代。

現在，這條鏈條里越來越多的環節，開始被Claude接走。

Anthropic給出了一個很直觀的階段表：

2021到2023年，Anthropic和普通科技公司沒什么區別，都是人類在筆記本電腦上寫代碼、寫文檔。

2023到2025年，聊天機器人開始進入工作流。工程師讓模型生成代碼片段，再復制到編輯器里。

2025到2026年，編程智能體出現，Claude開始能自主編寫和修改代碼，有時甚至能獨立完成整個文件。

到了今天，智能體已經可以自己運行代碼，還能把長達數小時的工作委派給其他智能體。

再往后，就是Anthropic真正擔心的那個階段：閉合回路。

如果這一天到來，Claude的后續版本，就可能由Claude自身持續改進——這就是recursive self-improvement，遞歸自我改進。

Anthropic在文中說得很謹慎：我們還沒有走到那一步，遞歸自我改進也不是必然發生。但它依然在強調，通往那一步的路徑，已經開始變得可見。

所以Anthropic才會在文章最后談到減速，甚至暫停。它的意思不是現在所有AI公司立刻停工，而是說，如果未來AI自我改進風險繼續上升，前沿實驗室需要一套協調、可驗證的減速機制。

換句話講，“奇點”就要到了，人類必須加以控制。

勢不可擋的Claude

如果只看表面，這是一篇非常具有前瞻意識的安全文檔。Anthropic在講遞歸自我改進，講AI可能越來越快地改進自己，講人類社會需要提前準備減速和暫停機制。

但放在Anthropic準備IPO的時間點上，這篇文章就有了另一層意思。

某種意義上，A廠最近的動態很像班上那種欠兒欠兒的優等生——它確實有能耐，但也確實很裝。

它想說的不只是“我們有一個很強的Claude”，比這更前一步，它想說“Claude正在幫助我們制造更強的Claude”。

如果Anthropic只是賣一個模型或者賣一個工具，它就很難徹底擺脫橫向比較：Anthropic有Claude，OpenAI有GPT；Anthropic有Claude Code，OpenAI有Codex；Anthropic搶企業客戶，OpenAI也搶企業客戶。兩家公司的競爭非常膠著，就看誰能向市場講出更大的故事。

需要注意的是，就在3天前，OpenAI前腳在一份關于前沿AI治理的文件里寫道：

“我們也在今天的系統中看到了遞歸自我改進的早期跡象：AI的發展本身正在被AI加速。

這將加劇開發者和國家之間的競爭壓力，并帶來現有機構無法應對的治理挑戰。”

3天后，Anthropic后腳就說：Claude通往遞歸自我改進的路徑，已經開始變得可見。

要是Claude真如它所期待的那樣發展，就不是普通產品敘事了，它會變成一個研發飛輪。

Claude寫代碼、跑實驗、優化訓練流程，再反過來減少Anthropic自己產品里的事故……一旦這套系統跑起來，Claude就不只是Anthropic的一個產品，也是Anthropic的重要生產工具。

用戶看到的是Claude這個產品，企業客戶買的是Claude的能力，但Anthropic真正想讓資本市場注意的是：Claude已經嵌入了前沿模型研發的底層流程，它被放到了Anthropic的發動機艙里。

資本市場最喜歡聽飛輪的故事，像聚寶盆一樣財源滾滾：更強的Claude讓Anthropic的工程師能合并更多代碼，更多代碼讓產品和基礎設施迭代更快，更快的迭代讓研究員能跑更多實驗，更多實驗又反過來幫助下一代Claude變強。下一代Claude變強后，再繼續加速Anthropic的研發。

Claude的迭代速度也在支撐這個飛輪。從公開發布時間看，2023年到2025年初，Claude的主要模型更新大多是三四個月一輪，但在進入Claude 4之后，Anthropic的模型更新明顯變密。

Claude 4在2025年5月發布，Opus 4.1在8月發布，Sonnet 4.5在9月發布，Haiku 4.5在10月發布，Opus 4.5在11月發布。

到了2026年，Opus 4.6在2月5日發布，Sonnet 4.6在2月17日發布，Opus 4.7在4月15日發布，Opus 4.8在5月28日發布。Opus 4.7到Opus 4.8，只隔了42天。

Anthropic表面上是在說“這件事可能很危險，我們要提前準備剎車”，但它同時也在暗示：“我們已經看見油門踩下去之后會發生什么。”

IPO敘事的微妙之處就在于此。它一邊把風險講得很重，一邊也把自己的技術位置抬得很高。

不是所有AI公司都有資格討論遞歸自我改進，你得先讓外界相信，你的AI已經進入了AI研發流程，才有資格說這件事可能需要全球協調。

OpenAI：怎么可以這樣？

前面提到，就在Anthropic發這篇長文之前，OpenAI剛剛把遞歸自我改進擺上了桌。

但兩家公司的講法很不一樣。

OpenAI那篇《Democratic Governance of Frontier AI》，是一份寫給華盛頓的政策藍圖，它關心的不是“模型怎么變強”，而是當前沿AI繼續往前沖，該如何加以約束。

那篇報告里面提到的大多內容不太適合加以贅述，唯獨一句話關鍵：OpenAI說，今天的系統中，已經可以看到遞歸自我改進的早期跡象。

這句話和Anthropic這篇長文，其實指向同一個方向。

只不過OpenAI在講制度，Anthropic在講自己。

OpenAI的意思是：AI發展太快，現有治理結構可能跟不上，所以需要一套新的規則。

而Anthropic直接把那個系統亮了出來，告訴市場：Claude已經進入了我們的研發流程，所以我們看見了AI自我加速的路徑。

這一手玩得很高明，感覺OpenAI內部指不定已經開始蛐蛐了——這簡直是剽竊創意！明明是我們先來的！

開個玩笑，不過OpenAI確實需要加把勁了，快點把GPT 5.6抬上來吧。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.