“人工智能公司運營在一套激勵機制與約束條件之中,它們有時會與做正確的事情發生沖突。”這番話出自克里斯托弗·奧拉,Anthropic的聯合創始人,本周一他站在梵蒂岡,身旁是教皇利奧十四世。同一天,教皇發布了他在位的第一份通諭《偉大的人性》,呼吁AI應被解除武裝、接受監管,為人類服務。當硅谷和圣座罕見地發出完全相同的聲音,值得追問的是,他們所知曉的,究竟有什么是各國政府還沒弄明白的。
這并不是孤立的表態。Anthropic的首席執行官達里奧·阿莫代另一次直言,將風險的天平指向了行業內部:“下一層風險其實是AI公司本身”——包括他自己在內的AI領導者,不應該成為決定這項技術命運的人。這等于目前最頂尖AI系統的建造者們,集體向世界承認了一件事:他們無法單獨管理自己。問題早已不是全球AI治理是否必要,而是這場治理體系的設計,能不能趕在一場讓所有人都被迫看清答案的危機之前完成。
![]()
先看行業內部的共識。在AI一線從業者當中,幾乎沒有人會認真否認一系列核心風險:勞動力市場的劇烈破壞、自主武器系統、兒童安全危機、大規模監控、人類監督被系統性地弱化,以及可能出現具備遞歸自我改進能力的系統。這些并非散落的理論推演,而是被領先的AI實驗室嚴肅對待的風險清單。Anthropic為此構建了“憲法人工智能”以及一套負責任的擴展策略,OpenAI也維持著一套準備框架并引入結構化的紅隊測試。這些工作的確不是花架子,它們代表了一種行業內部的自省機制。
但它們的共同局限也十分顯眼:這一切都停留在內部環節。每個公司自行設定風險閾值,自行決定對外透明到什么程度。內部治理解決不了外部性難題,這好比讓一個玩家在對抗性極強的賽局里單方面減速,卻要求對手也不許踩油門。如果一家公司在沒有競爭對手同等承諾的情況下放慢腳步,世界并不會因此變得更安全,它只是單純地丟了市場份額。這種邏輯同樣適用于國家:只要中國或任何一個主要AI強國不受可比較的承諾約束,沒有任何政府能夠令人信服地限制住自家的獨角獸。結果便落入了一個教科書式的集體行動失敗陷阱——每一個人都看得到風險,但沒有任何個體有動力去獨自吞下解決問題的全部成本。這并非一個市場問題,而是一個治理架構設計的問題。
常見的參照系是核軍備控制,但它恰恰是個糟糕的類比。核武器屬于國家項目,有可識別的設施和可驗證的試驗活動,而前沿AI由私營行為者開發,跑在早已嵌入全球的商業基礎設施之上,它的研發與部署越來越像一種日常的經濟活動。更合適的參考物是金融體系。銀行跨界激烈競爭,實時互聯,卻始終面對著單一機構根本無法管理的系統性威脅——恐怖主義融資和金融犯罪。為此,國際社會圍繞二十國集團的金融行動特別工作組構建了一套規則制定框架,將共同規范、操作標準、政府義務、私營部門責任、專家審查以及對不遵守行為的實際后果捏合在了一起。盡管這一模式尚未完美覆蓋所有陰影地帶,它提示了另一條通道的可能性:不依賴任何單一國家的自覺,也不指望市場競爭自動產生安全的最佳劑量,而是通過一套多方共擔的治理架構,讓系統性風險能被接入相應的制衡節點。
此刻的AI行業很像金融體系早期面對跨國有組織犯罪時的狀態:都知道危險已經越過公司防火墻,但用來圍堵危險的工具箱里,依舊只有各家自己設計的內控手冊。教皇的通諭或許不會直接改變任何一行代碼,但它和Anthropic高管的坦白放在一起,本身就構成了一種壓力測試的結果:連建造者都開始公開請求外界來設定規則,這就等于宣告了自主治理路線的邊界。剩下的問題是,政策制定者們是否愿意在不需要撞破一面墻之前,就動手搭建一架足夠精巧又足夠有力的治理梯子。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.