![]()
來源:ScienceAl
編輯:&
AI 領域的發展建設,建立在未來的機器能否實現自我改進之上。1966 年,英國數學家 I. J. Good 寫道:
“一種超智能機器可以設計出更好的機器;隨后毫無疑問會出現‘智能爆炸’,而人類智能將被遠遠甩在后面。”
幾十年來,研究者既期待這種“遞歸自我改進”(recursive self-improvement,RSI),也對它保持警惕。而現在,隨著 AI 能力快速推進,一個問題開始變得現實:這個過程,會不會已經在發生了?
但 RSI 這個詞本身就充滿模糊性。
有人把它當作推動監管的警報詞;有人則把它當成營銷口號。對某些人來說,RSI 意味著一個完全自主的閉環系統;而對另一些人來說,只要“技術幫助制造技術”,就已經算是某種形式的自我改進。
最安全的理解方式,也許是把它看成一個連續譜。
在最嚴格的定義下,RSI 指的是一種不僅能改進輸出結果,還能改進“自身改進過程”的系統:它能夠自行提出想法、評估結果、修改方法,而且完全不需要人類介入。按照這個標準,今天的大多數 AI 系統仍然達不到要求。它們確實已經能幫助構建更好的 AI,但依然依賴人類來設定目標、定義成功標準,并決定哪些修改值得保留。
真正的問題,不是“自我改進是否已經存在”,而是這個閉環,到底已經閉合了多少。
通往自我改進的臺階
事實上,研究者已經為 RSI 鋪路很多年了。
機器學習算法早就能夠自動調整程序參數;進化算法(evolutionary algorithms)可以不斷生成、篩選并迭代設計方案;過去十年里,AutoML 又開始自動化神經網絡結構設計、訓練和評估中的部分流程。
而今天,大語言模型——例如 OpenAI 的 GPT、Google DeepMind 的 Gemini、Anthropic 的 Claude,以及 xAI 的 Grok——把這一趨勢推得更遠。這些模型最重要的用途之一,就是寫代碼。包括用于生成下一代模型的代碼。
今年 2 月,OpenAI 表示,GPT-5.3-Codex 已經在自身開發過程中發揮重要作用:幫助調試訓練、管理部署以及分析評測結果。與此同時,Anthropic 也聲稱,其大部分代碼如今已經由 Claude Code 編寫。盡管如此,這些系統仍然需要人類來指揮和驗證整個過程。
2025 年,Google DeepMind 還公布了一個名為 AlphaEvolve 的系統——一種“用于科學與算法發現的編碼智能體”。它利用大語言模型引導解空間的進化,例如優化神經網絡結構、數據中心調度和芯片設計。雖然它依舊需要人類來定義問題和評價標準,但每一次算法突破,都在反過來提升 AI 研發自身的能力。
![]()
圖示:AlphaEvolve 高層次概述。
參與 AlphaEvolve 的計算機科學家 Matej Balog 對此評價道:“這是一個高度協作的過程。”很多時候,人類研究者會從 AI 發現的新方案中反過來獲得啟發。
與此同時,DeepMind 早期芯片設計系統 AlphaChip 的聯合負責人,也創辦了一家名為 Ricursive Intelligence 的新公司,希望利用 AI 來設計 AI 芯片。
聯合創始人 Azalia Mirhoseini 表示,他們希望把傳統需要一到兩年的芯片設計周期壓縮到“幾天”:
第一階段,AI 輔助人類設計;
第二階段,AI 自動完成沒有專業團隊公司的芯片開發;
第三階段,則是用 AI 設計更好的 AI 芯片,再用這些芯片訓練更強的 AI。
不過,研究團隊強調,這一過程仍會保留人類監督。
還有一些研究,則直接瞄準了“系統修改自身行為”這一目標。比如說去年,University of British Columbia 與 Sakana AI 發布了 Darwin G?del Machines(DGMs):一種利用進化算法不斷改進基于 LLM 的代碼智能體的系統。
相關鏈接:https://spectrum.ieee.org/evolutionary-ai-coding-agents
![]()
圖示:DGMs 與超級代理。
雖然它們暫時還無法修改底層語言模型本身,但已經能越來越擅長“改進自己”;更進一步的版本,甚至已經開始修改“自身改進機制”本身。
同一研究團隊后來又開發了 AI Scientist,這個系統旨在嘗試自動化整個科研閉環。它意味著,被自動化的不再只是“編碼”,而是實驗、評估乃至知識生產本身。
智能爆炸仍然面臨巨大阻力
不過,并不是所有人都認為“奇點”已經近在眼前。
許多研究者指出,如今的 AI 仍然只是“還不錯”地完成生成想法、實現代碼與評估結果這些步驟,而遠遠稱不上完全自主。
Nathan Lambert 最近提出,與其說未來會出現“遞歸自我改進”,不如說會出現一種“有損自我改進”(lossy self-improvement)。隨著系統越來越復雜,摩擦和協調成本會逐漸拖慢整個飛輪。
相關鏈接:https://www.interconnects.ai/p/lossy-self-improvement
另一個現實問題則是成本。今天最前沿的 AI 系統開發成本已經達到數十億美元,沒有任何公司愿意真的把如此昂貴的系統完全交給 AI 自主運行。
此外,即使 AI 能設計更好的軟件,也不意味著它能夠立刻接管現實世界中的復雜生產體系。真正實現完全 RSI,也許不僅需要 AI 設計芯片和算法,還需要它建造數據中心、運行發電系統 、開采礦產、管理機器人生產鏈。
而這些能力目前仍然深度依賴人類社會與工業基礎設施。
![]()
圖示:自我改進的 AI 與協作式 AI。
“AI 寒武紀”
有些研究者認為,人們對 RSI 的想象方式本身可能就是錯的。
對此,很多人的設想都是一個越來越強大的單一超級 AI,但現實可能更像生物進化。那可能會更像某種人工生命形式的寒武紀大爆發。屆時,大量不同類型的 AI 智能體會同時出現,它們擁有自己的生態、文化與經濟系統。
但在那時,人類會被剔除出科研回路嗎?
也許,但可能更慢。
人類研究者會首先從低層級工作中退出,不再親自調試細節,而更像教授或團隊負責人,負責選擇研究方向。之后,人類可能更像項目主管或 CEO,負責制定更宏觀的目標。再往后,人類的角色會逐漸變成監督者。
不過也許,當 AI 進化到能治愈癌癥,一些學者大概會很樂意放棄這個令自己喜愛的事業。
原文鏈接:https://spectrum.ieee.org/recursive-self-improvement
閱讀最新前沿科技趨勢報告,請訪問21世紀關鍵技術研究院的“未來知識庫”
![]()
未來知識庫是 “21世紀關鍵技術研究院”建 立的在線知識庫平臺,收藏的資料范圍包括人工智能、腦科學、互聯網、超級智能,數智大腦、能源、軍事、經濟、人類風險等等領域的前沿進展與未來趨勢。目前擁有超過8000篇重要資料。每周更新不少于100篇世界范圍最新研究資料。 歡迎掃描二維碼或訪問https://wx.zsxq.com/group/454854145828進入。
![]()
截止到2月28日 ”未來知識庫”精選的百部前沿科技趨勢報告
(加入未來知識庫,全部資料免費閱讀和下載)
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.