這個世界,終于魔幻到我看不懂的程度了。
故事是這樣的。北京時間6月5日凌晨,Anthropic發了一篇長文,呼吁全球前沿AI實驗室一起放慢研發速度,給社會治理和安全研究留出時間。
![]()
聽起來很負責任對吧?
但說這話的不是旁觀者,也不是監管機構,而是一家年化收入沖向500億美元、估值逼近1萬億美元、剛完成650億美元融資、IPO文件已經遞交的AI巨頭。
更諷刺的是,Anthropic喊剎車的時候,自己腳下還在加速。Claude已經在寫公司生產代碼庫中超過80%的代碼,融資、上市、模型發布、企業擴張全都在加速。
![]()
當一個領先者開始呼吁"大家一起剎車",最該追問的不是它有沒有擔心未來,而是:它到底是在擔心AI太快,還是擔心別人追得太快?
想剎車,但不想一個人剎
Anthropic說得很漂亮:"世界如果能擁有選擇減緩或暫時暫停前沿AI開發的選項,那將是件好事。"
但緊接著,他們論證了單方面放緩為什么行不通。訓練運行比導彈發射井更容易隱藏,計算硬件可以轉移用途,而叛離的動機巨大。
"誰在別人暫停時繼續,誰就可能繼承領先地位。"
這是Anthropic給出的框架:問題真實,方案有前提,而前提幾乎不可能滿足。
要理解這個立場到底有沒有道理,先得看看他們展示了什么樣的技術現實。
Claude編寫80%代碼,工程師5個月沒寫一行代碼
Anthropic聯合創始人達里奧·阿莫代伊預言這一天已經很久了。但當內部數據擺到桌面上,沖擊力仍然超出了多數人的預期。
![]()
截至2026年5月,合并到Anthropic生產代碼庫中的代碼,超過80%是由Claude編寫的。在2025年2月之前,這個數字還停留在個位數。
這不是漸進式的增長,而是一次陡峭的攀升。
在2026年第二季度,典型工程師每天合并的代碼量達到2024年水平的8倍。
Anthropic坦承,代碼行數不是一個完美的衡量標準,8倍的數字"幾乎肯定高估了真實的生產力提升"。但方向騙不了人。在內部調查中,受訪者中位數估計,使用新模型后,在同類項目上產生的產出大約是完全沒有AI輔助時的4倍。
![]()
寫那些代碼的人,是世界上最擅長構建這類系統的工程師。而現在,Claude正在捕捉他們遺漏的bug。
賓夕法尼亞大學沃頓商學院教授伊桑·莫利克評論說,這些指標與獨立衡量的結果相符,而且"實在沒有跡象表明這種勢頭正在放緩"。他補充了一個容易被忽視的觀察:當前模型在單個任務上的表現實在太好了,好到人們很難感知到新舊模型之間的能力鴻溝正在拉大。
氛圍上看起來差不多,數據上卻完全不是一回事。
四年工作量,AI用幾天就搞定了
快是一回事。快且能用,則是另一回事。
2026年4月,一位工程師把Claude部署去處理一類反復出現的API錯誤。Claude自主運行,交付了800多項修復,將錯誤率直接壓低了1000倍。
監督這項工作的工程師估算,換作人類來做,需要整整四年時間才能完成同樣的工作量。不是因為人的能力不夠,而是這類任務涉及大量不熟悉的代碼上下文,認知負荷太高,人腦處理不過來。
在更復雜的開放式任務上,進步同樣顯著。一次常規升級導致數萬個訓練任務同時崩潰。一位工程師向Claude指出了這個實時問題,只給了少量文本信息和集群訪問權限。Claude自己處理運行中的任務,逐一測試環境設置,最終隔離出一個觸發崩潰的晦澀調試標志,復現問題,確認修復。
全程大約兩個小時。這通常需要人類工程師花兩到三天。
數據也驗證了這個趨勢。在最初缺乏明確規范的高度復雜開放式工程問題上,Claude的成功率在2026年5月達到了76%,六個月內拉升了50個百分點。
相比外部評價,來自Anthropic員工的自述更能說明問題。
一位員工說:"我大約一年前開始全力擁抱'Claude化'。那是一段瘋狂的冒險,到現在我已經大約5個月沒有親自寫過一行代碼了。"
另一位則描述了這種狀態帶來的心理代價:"在一切順利的日子里,我忍不住覺得我做的任何事情都不重要,一切都是自動化的,比我做得更好更快。但到了那些一切都崩潰、我不明白為什么會崩潰的日子里,我意識到我已經完全不清楚自己到底在干什么了。"
這兩段話被寫進官方博客本身,就說明了很多問題。焦慮不再藏在茶水間的閑談里,而是被擺上了臺面。
當AI開始跑實驗,人類研究員被甩在后面
寫代碼只是手段,加速AI研發才是更深的底層變化。
Anthropic每次發布新模型,都會進行同一個測試:給Claude一些訓練小型AI模型的代碼,要求它讓代碼盡可能快,同時保證通過相同的正確性檢查。
2025年5月,Claude Opus 4平均比初始代碼快3倍。2026年4月,Claude Mythos Preview實現了約52倍的加速。
作為參照系,一個熟練的人類研究員花四到八個小時手動重構,在相同代碼庫上通常能達到4倍左右的加速。
從3倍到52倍,從遜于人類到碾壓人類,不到一年。
真正跨越性的時刻出現在2026年4月。Anthropic首次讓Claude端到端運行一個開放式研究項目。任務來自AI安全領域:一個較弱的模型能否可靠地監督一個更強的模型?
兩位人類研究員花了一周時間彌合了約23%的差距。Claude智能體在累計800小時的計算時間內彌合了97%的差距,花費約18000美元。
人類在這個任務中扮演的唯一有意義的角色,是選擇了問題并創建了評分標準。實驗設計本身,全部由AI自行完成。
一位Anthropic研究人員評價道:"Claude在1-2天的時間里,以極少來自我的幫助完成了所有這些工作。我覺得如果一位初級同事在同樣短的時間內給我帶來這樣的結果,我會感到有點印象。未來已來。"
"遞歸自我提升":從理論推演到內部現實
這些變化指向了同一個方向:遞歸自我提升。用Anthropic的話說,就是AI系統無需人類干預即可自行改進。
博客文章明確指出,完全的遞歸自我提升"尚未發生,也并非必然",但它"可能來得比大多數機構準備就緒的時間更早"。
文章勾勒了AI在Anthropic研發中扮演角色的四個階段。2021至2023年,手動編寫。2023至2025年,聊天機器人輔助。2025至2026年,編碼智能體階段。今天,自主智能體階段,智能體獨立執行代碼,調試實時環境。
而那個尚在視野邊緣的下一階段,被標注為"閉環未來":智能體能力強大到足以自行構建和訓練模型,未來的Claude版本可能由Claude自身不斷改進。
能力翻倍的速度也在加快。AI系統能夠自主可靠完成任務的時間長度,大約每四個月翻一番,而此前趨勢是每七個月翻一番。2024年3月,Claude Opus 3能處理約四分鐘的人類任務。一年后,Claude Sonnet 3.7能處理約一個半小時。又過了一年,Claude Opus 4.6能處理12小時。
如果這個趨勢持續,今年就可能進入熟練人員需要數天才能完成的任務區間。到2027年,可能達到數周。
外界怎么看:精明算計,還是真誠焦慮?
看完這些技術數據,再回到Anthropic那句"我們是不是應該一起慢一點",就能理解為什么外界的反應如此撕裂。
風險投資家大衛·薩克斯指責Anthropic領導層推行"監管俘獲議程",認為這種做法可能導致開源模型被禁,而開源模型恰恰是小型組織負擔得起AI開發和使用的關鍵路徑。
X上的評論更加直白。前沿AI評論員馬修·伯曼一句話點破:"遞歸自我改進就在眼前。Anthropic愿意放慢腳步,但前提是其他所有人都放慢腳步。當你處于領先地位時,這是個不錯的處境。"
另一位網友更直接:"他們要完蛋的聲音。競爭讓每個人都處于一種境地,必須花費如此多的金錢和資源才能勉強保持相關性。除非他們覺得自己身處泡沫之中,并且IPO之后可能會崩盤,否則沒人會真正建議這樣做。"
還有一種聲音認為,大多數公眾仍然低估了正在發生的轉折。一位X用戶寫道:"我相信大多數人仍然沒有理解人類正面臨的那道重大門檻。Anthropic本身明確表示,即使開發完全停止,他們仍然會見證巨大的社會變革。但根本不存在停滯的問題。開發速度已經超過了他們自己的內部假設。"
看完這些數據,我突然想起一個比喻。
Anthropic就像一個已經爬到山頂的人,站在那里對還在山腰的人喊:"大家別爬了,太危險了,我們等等吧。"
這話聽起來很有道理。但問題是,他們已經站在山頂了。
而且,他們腳下的山,還在繼續長高。
Anthropic聯合創始人克拉克說:"這類技術以前從未存在過,但我相信這可能在兩年內發生,甚至更早。"在缺乏全球協調性放緩的情況下,"商業和地緣政治的敵對正在淹沒所構建技術對物種生存的更宏大影響。"
這話讓我想起另一句話:當技術跑得比人性快的時候,最可怕的不是技術失控,而是人性在技術面前失去了選擇權。
Anthropic的呼吁,或許真誠,或許精明,或許兩者兼有。但有一點是確定的:當領先者開始呼吁剎車,真正該問的不是"我們要不要停下來",而是"我們還有沒有停下來的能力"。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.