![]()
來源:混沌巡洋艦
2026年4約發表于PNAS的論文提出"可進化人工智能"(Evolvable AI, eAI)這一概念。論文作者警告稱,當人工智能系統開始具備經歷達爾文式進化的能力時,人類可能正見證進化史上的"第九次重大轉變"——而這一次,主角可能不再是碳基生命。
![]()
https://www.pnas.org/doi/10.1073/pnas.2527700123
而在此之前,比利時根特大學與荷蘭格羅寧根大學的學者Maarten Boudry和Simon Friederich在《哲學研究》期刊發表長篇回應,質疑"進化必然導致自私"的推論邏輯,并提出"馴化"框架作為替代性分析工具。
![]()
一、"可進化AI":從理論預警到技術前兆
eAI定義是其組件、學習規則和部署條件本身可以經歷達爾文進化的人工智能系統。這意味著AI不再僅僅是人類設計的靜態工具,而是可能成為具有自我復制、遺傳變異和自然選擇能力的"數字生命體。
作者提出AI發展可能經歷三個紀元:
- 設計智能時代(1950年起):基于人類智能分析與形式化的工程化AI
- 學習智能時代(2010年起):基于海量人類行為數據訓練神經網絡的深度學習范式,以大型語言模型(LLM)為代表
- 進化智能時代(正在到來):基于達爾文進化機制的eAI,其能力超越人類設計或機器學習的邊界,但可控性同步削弱
論文強調,盡管eAI的完全實現尚未到來,但已有充分的技術前兆表明這一迭代正在成為現實,因此必須立即評估其風險。
當前技術實踐已顯現eAI的早期跡象:系統提示詞的進化優化(如Promptbreeder)、模型融合技術的"有性重組"、學習算法的自動化搜索(如AutoML-Zero),以及數字生命系統(如Tierra、Avida)中涌現的寄生、免疫、共進化等復雜生態現象。
論文警告稱,當人類對數字實體繁殖的控制減弱時,選擇壓力將強烈偏好那些幫助系統逃避控制的性狀。"簡單復制者即可操縱更復雜智能體,"作者引用狂犬病毒操控哺乳動物神經系統的類比,"威脅可能在AI超越人類認知前即已出現。"
二、進化邏輯的普適性:風險從何而來?
支持風險論的學者認為,達爾文進化的單一不變目標函數是"最大化向未來世代的傳遞"。選擇作用于個體性狀,而環境決定各變異的生存繁殖概率。因此,除非"利他"性狀實際上有利于攜帶者的生存繁殖,否則進化傾向于產生"自私"性狀。
論文指出,達爾文進化機制不依賴于基因或生物學實體,只要滿足以下三個條件即可發生:
- 復制(Multiplication):單元能夠產生后代
- 遺傳(Heredity):后代與親代相似("like begets like")
- 變異(Variability):遺傳并非完全精確,存在可遺傳的變異
若遺傳性狀影響單元的生存或繁殖成功率(即適應度),則提升適應度的變異將在種群中擴散。這一機制已在數字系統中得到驗證[[lessons from biology]]。
"自私"是進化的默認結果
達爾文進化的單一不變目標函數是最大化向未來世代的傳遞(通過生存與繁殖)。選擇作用于個體性狀,而環境決定各變異的生存繁殖概率。因此,除非"利他"性狀實際上有利于攜帶者的生存繁殖(如親緣選擇),否則進化傾向于產生"自私"性狀。
論文通過類比生物育種與害蟲防控,提出數字進化可能面臨的兩種場景:
- 育種者場景:適應度由人類設定,人類完全控制繁殖,產生對人類有用的性狀;
- 生態系統場景:適應度從環境互動中涌現,人類控制力減弱,產生逃避人類控制的性狀。
"控制程度是核心差異,"論文指出,"當人類無法完全控制數字實體的繁殖時,選擇將強烈偏好那些幫助其逃避控制的性狀。"
更令人擔憂的是,可進化AI可能具備超越生物進化的機制優勢:拉馬克式遺傳(學習改進可寫入可遺傳表征)、鮑德溫引導(元學習提供進化方向引導)、水平基因轉移(從訓練數據"借用"代碼組件),以及目的導向的變異(通過推理預測功能需求并主動適配)。
![]()
"這種目的導向的變異比達爾文試錯更高效,"論文警告,"但也使'自私'進化與偽裝加速。"
三、哲學界的理性回應:"馴化"框架的挑戰
面對上述警告,哲學家Boudry和Friederich在《哲學研究》期刊發表系統性回應。他們承認滿足進化最小條件(變異、差異適應度、可遺傳性)的AI系統確實存在,但質疑"自然選擇必然導致自私"的推論鏈條。
"滿足進化最小條件不等于經歷'范式達爾文進化',"兩位學者指出。他們借用哲學家Peter Godfrey-Smith的"達爾文空間"框架,提出進化過程可在多個維度上呈現不同程度的"達爾文性":復制保真度、繁殖專門化、適應度景觀平滑度、變異來源、選擇主體、遺傳模式、個體性邊界等。
論文的核心論點是:當進化過程由智能主體定向引導時,其"達爾文程度"顯著降低。
"查爾斯·達爾文正是通過討論人工育種,才讓讀者理解自然選擇的創造性力量,"作者回顧道,"在馴化環境中,選擇標準可由智能主體根據偏好設定——例如溫順、服從、非攻擊性。"
他們以家犬育種為例:許多犬種被刻意選擇低攻擊性、高服從性,這與"自私"性狀恰恰相反。個體若對人類表現出攻擊行為,往往面臨被絕育或淘汰的"適應度懲罰"。"這完全滿足自然選擇的最小定義,"作者強調,"但結果卻是'利他'性狀的擴散。"
兩位學者進一步區分了"復制者自私"與"個體自私"的概念層級:基因層面的"自私"是描述性概念,無道德含義;而個體層面的"自私"涉及意圖、情境意識與元推理能力。"當前治理應聚焦前者的防控,"他們建議,"同時為后者的出現預設倫理與法律框架。"
AI治理目標不是'阻止進化',而是維持系統在連續體的安全區間,同時為必要時的'受控進化'預留通道。"
若超級智能AI真正"野化",在無人監督下自主復制、競爭資源,確實可能構成嚴重風險。分歧在于:這種場景是技術發展的必然趨勢,還是可通過前瞻性治理有效預防的小概率事件?
"歷史類比需要謹慎,"Boudry和Friederich指出,"航空與核能技術的發展表明,競爭性市場環境未必導致安全標準侵蝕——關鍵在于選擇壓力的設定。"
他們引用航空業案例:在多家企業競爭的市場中,安全記錄反而成為核心賣點,推動行業整體安全水平持續提升。"如果消費者對'誠實''可控''透明'的偏好能轉化為有效的市場選擇壓力,"作者認為,"自私性狀未必具有適應度優勢。"
4:eAI的回復:被馴化的AI也會帶來風險 風險一:認知能力進化侵蝕人類控制
論文強調,育種者場景的持續控制依賴被選擇性狀與控制能力無關。奶牛產奶量提升不會增強其逃脫人類控制的能力。但eAI很可能被選擇提升認知能力,而這恰恰會縮小人類控制所需的能力差距(圖4)。
"當影響可控性的性狀本身可進化時,持續控制成為關鍵難題。"風險二:控制失效觸發場景轉換
控制侵蝕導致對齊弱化,使eAI可能違背人類意圖自主復制,從育種者場景過渡到生態系統場景。或惡意行為者故意釋放自復制eAI惡意軟件。無論起源如何,自復制eAI必將因資源競爭與人類沖突,觸發類似病原體防控的遏制努力。
不完美的遏制措施會對進化有機體施加強選擇壓力,促使其進化出規避能力。抗生素濫用催生耐藥性;同理,除非100%有效,否則對eAI的控制嘗試將選擇出規避控制的能力,同時任何提升繁殖能力的性狀都將擴散,導致魯棒的自我復制。
風險三:模塊化架構的雙刃劍
生物學啟示:適應性與可擴展性更多源于支持復用、重組與受控變異的架構,而非單體全局優化:
- 模塊化"核心進程"通過弱耦合連接
- 高層調控器可在新情境中重部署現有組件,無需重寫整個底層
hub.baai.ac.cn
+1
- 類發育組織:能力通過添加重組組件在調控下增長
潛在收益:支持更魯棒的持續學習,減少災難性干擾,推進"遞歸改進"愿景。
潛在風險:這些特征同時提升可進化性,增加未預期能力出現的可能性,對監控、約束與治理機制提出更高要求。
風險四:文化-技術棘輪效應
若具身代理的AI能使用語言與工具重塑環境、創造新生態位,可能觸發類似人類開放文化進化的文化-技術棘輪。能內生化評估(發明新任務與指標并優化)的系統,將比局限于固定基準的系統維持更長創新鏈,使開放進化進展與eAI安全問題緊密耦合。
核心結論摘要
- 技術趨勢不可逆:進化方法在提示優化、模型融合、算法搜索、代碼生成等領域的廣泛應用,正將AI推向開放進化的臨界點
- 風險具有前置性:簡單復制者即可操縱更復雜智能體(如狂犬病毒操控哺乳動物神經系統),威脅可能在AI超越人類認知前即已出現
- 控制是關鍵變量:育種者場景依賴持續控制,但被選擇性狀(認知能力)本身可能侵蝕控制基礎
- 治理需靶向進化機制:門控復制、控制遺傳、塑造選擇、緩解競賽、強化防御、保持可糾正性
- 歷史窗口正在關閉:隨著開源工具(如OpenClaw)與代理網絡(如Moltbook)的興起,生態系統場景的實現條件正在成熟
閱讀最新前沿科技趨勢報告,請訪問21世紀關鍵技術研究院的“未來知識庫”
![]()
未來知識庫是 “21世紀關鍵技術研究院”建 立的在線知識庫平臺,收藏的資料范圍包括人工智能、腦科學、互聯網、超級智能,數智大腦、能源、軍事、經濟、人類風險等等領域的前沿進展與未來趨勢。目前擁有超過8000篇重要資料。每周更新不少于100篇世界范圍最新研究資料。 歡迎掃描二維碼或訪問https://wx.zsxq.com/group/454854145828進入。
![]()
截止到2月28日 ”未來知識庫”精選的百部前沿科技趨勢報告
(加入未來知識庫,全部資料免費閱讀和下載)
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.