網易首頁 > 網易號 > 正文申請入駐

如果AI開始自我演化：遞歸自我改進正在以一種遠比「奇點」更現實的方式出現

2026-05-30 17:59:13　來源: 人工智能學家

北京舉報

分享至

來源：ScienceAl

編輯：&

AI 領域的發展建設，建立在未來的機器能否實現自我改進之上。1966 年，英國數學家 I. J. Good 寫道：

“一種超智能機器可以設計出更好的機器；隨后毫無疑問會出現‘智能爆炸’，而人類智能將被遠遠甩在后面。”

幾十年來，研究者既期待這種“遞歸自我改進”（recursive self-improvement，RSI），也對它保持警惕。而現在，隨著 AI 能力快速推進，一個問題開始變得現實：這個過程，會不會已經在發生了？

但 RSI 這個詞本身就充滿模糊性。

有人把它當作推動監管的警報詞；有人則把它當成營銷口號。對某些人來說，RSI 意味著一個完全自主的閉環系統；而對另一些人來說，只要“技術幫助制造技術”，就已經算是某種形式的自我改進。

最安全的理解方式，也許是把它看成一個連續譜。

在最嚴格的定義下，RSI 指的是一種不僅能改進輸出結果，還能改進“自身改進過程”的系統：它能夠自行提出想法、評估結果、修改方法，而且完全不需要人類介入。按照這個標準，今天的大多數 AI 系統仍然達不到要求。它們確實已經能幫助構建更好的 AI，但依然依賴人類來設定目標、定義成功標準，并決定哪些修改值得保留。

真正的問題，不是“自我改進是否已經存在”，而是這個閉環，到底已經閉合了多少。

通往自我改進的臺階

事實上，研究者已經為 RSI 鋪路很多年了。

機器學習算法早就能夠自動調整程序參數；進化算法（evolutionary algorithms）可以不斷生成、篩選并迭代設計方案；過去十年里，AutoML 又開始自動化神經網絡結構設計、訓練和評估中的部分流程。

而今天，大語言模型——例如 OpenAI 的 GPT、Google DeepMind 的 Gemini、Anthropic 的 Claude，以及 xAI 的 Grok——把這一趨勢推得更遠。這些模型最重要的用途之一，就是寫代碼。包括用于生成下一代模型的代碼。

今年 2 月，OpenAI 表示，GPT-5.3-Codex 已經在自身開發過程中發揮重要作用：幫助調試訓練、管理部署以及分析評測結果。與此同時，Anthropic 也聲稱，其大部分代碼如今已經由 Claude Code 編寫。盡管如此，這些系統仍然需要人類來指揮和驗證整個過程。

2025 年，Google DeepMind 還公布了一個名為 AlphaEvolve 的系統——一種“用于科學與算法發現的編碼智能體”。它利用大語言模型引導解空間的進化，例如優化神經網絡結構、數據中心調度和芯片設計。雖然它依舊需要人類來定義問題和評價標準，但每一次算法突破，都在反過來提升 AI 研發自身的能力。

圖示：AlphaEvolve 高層次概述。

參與 AlphaEvolve 的計算機科學家 Matej Balog 對此評價道：“這是一個高度協作的過程。”很多時候，人類研究者會從 AI 發現的新方案中反過來獲得啟發。

與此同時，DeepMind 早期芯片設計系統 AlphaChip 的聯合負責人，也創辦了一家名為 Ricursive Intelligence 的新公司，希望利用 AI 來設計 AI 芯片。

聯合創始人 Azalia Mirhoseini 表示，他們希望把傳統需要一到兩年的芯片設計周期壓縮到“幾天”：

第一階段，AI 輔助人類設計；

第二階段，AI 自動完成沒有專業團隊公司的芯片開發；

第三階段，則是用 AI 設計更好的 AI 芯片，再用這些芯片訓練更強的 AI。

不過，研究團隊強調，這一過程仍會保留人類監督。

還有一些研究，則直接瞄準了“系統修改自身行為”這一目標。比如說去年，University of British Columbia 與 Sakana AI 發布了 Darwin G?del Machines（DGMs）：一種利用進化算法不斷改進基于 LLM 的代碼智能體的系統。

相關鏈接：https://spectrum.ieee.org/evolutionary-ai-coding-agents

圖示：DGMs 與超級代理。

雖然它們暫時還無法修改底層語言模型本身，但已經能越來越擅長“改進自己”；更進一步的版本，甚至已經開始修改“自身改進機制”本身。

同一研究團隊后來又開發了 AI Scientist，這個系統旨在嘗試自動化整個科研閉環。它意味著，被自動化的不再只是“編碼”，而是實驗、評估乃至知識生產本身。

智能爆炸仍然面臨巨大阻力

不過，并不是所有人都認為“奇點”已經近在眼前。

許多研究者指出，如今的 AI 仍然只是“還不錯”地完成生成想法、實現代碼與評估結果這些步驟，而遠遠稱不上完全自主。

Nathan Lambert 最近提出，與其說未來會出現“遞歸自我改進”，不如說會出現一種“有損自我改進”（lossy self-improvement）。隨著系統越來越復雜，摩擦和協調成本會逐漸拖慢整個飛輪。

相關鏈接：https://www.interconnects.ai/p/lossy-self-improvement

另一個現實問題則是成本。今天最前沿的 AI 系統開發成本已經達到數十億美元，沒有任何公司愿意真的把如此昂貴的系統完全交給 AI 自主運行。

此外，即使 AI 能設計更好的軟件，也不意味著它能夠立刻接管現實世界中的復雜生產體系。真正實現完全 RSI，也許不僅需要 AI 設計芯片和算法，還需要它建造數據中心、運行發電系統、開采礦產、管理機器人生產鏈。

而這些能力目前仍然深度依賴人類社會與工業基礎設施。

圖示：自我改進的 AI 與協作式 AI。

“AI 寒武紀”

有些研究者認為，人們對 RSI 的想象方式本身可能就是錯的。

對此，很多人的設想都是一個越來越強大的單一超級 AI，但現實可能更像生物進化。那可能會更像某種人工生命形式的寒武紀大爆發。屆時，大量不同類型的 AI 智能體會同時出現，它們擁有自己的生態、文化與經濟系統。

但在那時，人類會被剔除出科研回路嗎？

也許，但可能更慢。

人類研究者會首先從低層級工作中退出，不再親自調試細節，而更像教授或團隊負責人，負責選擇研究方向。之后，人類可能更像項目主管或 CEO，負責制定更宏觀的目標。再往后，人類的角色會逐漸變成監督者。

不過也許，當 AI 進化到能治愈癌癥，一些學者大概會很樂意放棄這個令自己喜愛的事業。

原文鏈接：https://spectrum.ieee.org/recursive-self-improvement

閱讀最新前沿科技趨勢報告，請訪問21世紀關鍵技術研究院的“未來知識庫”

未來知識庫是 “21世紀關鍵技術研究院”建立的在線知識庫平臺，收藏的資料范圍包括人工智能、腦科學、互聯網、超級智能，數智大腦、能源、軍事、經濟、人類風險等等領域的前沿進展與未來趨勢。目前擁有超過8000篇重要資料。每周更新不少于100篇世界范圍最新研究資料。歡迎掃描二維碼或訪問https://wx.zsxq.com/group/454854145828進入。

截止到2月28日 ”未來知識庫”精選的百部前沿科技趨勢報告

（加入未來知識庫，全部資料免費閱讀和下載）

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.