網易首頁 > 網易號 > 正文申請入駐

AI的權力邊界——本世紀最大難題？

2026-06-08 06:07:03　來源: 財經早餐

北京舉報

分享至

美國頂流AI大模型企業Anthropic頻繁發布那些看似有點違背其企業核心價值的警惕性觀點，不免讓外界對AI發展的安全問題聚集了更多的注意力。

照理說“義無反顧地大力發展AI”才是對 Anthropic最有力的論述，因為其主要商業模式就是發布各種大模型和智能體應用。

那么這家企業為何老是和大力發展AI作對呢？

2021年，Anthropic由多名OpenAI原核心技術人員出走創立，創辦初衷正是不滿OpenAI在資本驅動下的商業化凌駕AI安全的路線分歧。

公司定名取自希臘語“與人類有關的”，將“保障人類長期安全”作為使命，有效利他主義與AI安全對齊也是公司的價值觀。說白了這家企業從本源上來說就是要構建能夠匹敵或超越市面上所有AI的AI，以創造一個安全邊界——致力于用AI的力量防范任何來自AI的威脅。

強調安全的特質，也讓這家企業構筑起了自己的商業護城河，在全球 AI監管趨嚴的環境下，持續強調安全，幫助公司旗下的大模型Claude以及編程智能助手Claude Code拿下眾多金融、政企等高合規要求機構的訂單。也為公司贏得了包括亞馬遜在內的強大資金支持。今年五月底，公司完成H輪650億美元的融資，投后估值達到9650億美元，約合人民幣6.5萬億元，背景是5月份其年化收入已經飆升到470億美元。

雖然當前已經是世界最頂尖的AI企業，然而Anthropic的核心理念看上去還是有點“烏托邦”的味道，先不管其對錯與否，這家企業的存在也讓人看到了AI大模型發展道路上的另一種路徑。

當人工智能開始自我構建

最近， Anthropic再次發布一篇文章，題為《當人工智能開始自我構建》（“When AI builds itself”），再次敲響了警鐘。

文章提到，當前公司正在將越來越多的AI開發工作交給AI系統自身來完成。如果把這個趨勢推到極致，并給予充足的算力，它所指向的終點，是一個能夠完全自主地設計和開發自己下一代的AI系統。

文章公布了這種觀點主要依據。

截至2026年5月，合并到Anthropic代碼庫中的代碼，有超過80%是由AI編寫的。而在Claude Code于去年2月發布之前，這個數字還是低個位數的。這一轉變也反映在每位工程師的產出上。在公司建立的頭幾年（2021–2024），每位工程師每天的代碼行數基本持平，但在2025年開始顯著攀升，正源于Claude變得可以自己運行代碼。2026年這條曲線再次變陡，因為模型開始在更長的時間跨度上自主工作。

在2026年第二季度，公司內部一名典型工程師每天的代碼行數是2024年的8倍。其原因在于，大部分代碼是由AI編寫的，工程師的角色轉向了指導和審查，而非親手敲代碼。

雖然，代碼行數是一個不完美的衡量指標，因為它度量的是數量而非質量。所以幾乎肯定這8倍的代碼行數是高估的生產力提升，但公司內部程序員確實在大范圍使用AI來處理諸如修復Bug這樣的繁瑣工作，而且AI還在不斷提高自己的編寫能力。

證據表明，在AI開發流程的每一步中，人類的角色都在收窄。一旦人類和AI編寫的代碼質量達到同等水平，人類將完全停止寫代碼，轉而只做審查。后續，隨著AI能力的快速提高，其就可能跳出上述執行層面，而代替人類來決策AI模型的發展方向，以及判斷AI模型的各類成績。

由此公司認為，能自己構建自己的AI，將是技術史上的重大里程碑，它可能在科學、醫療等領域為世界帶來巨大的福祉。但照此速度發展下去，智能體可能強大到足以自行構建和訓練模型，而完全的AI閉環自我改進也可能加劇人類失去對AI系統控制的風險。

對此，公司提出了一種情景假設：如果推動能力進步的技術趨勢持續下去，并且 AI系統能夠發展出蘊含人類變革性創造力的那些能力，那么AI系統有可能設計和改進自身。一個有能力自動化AI研發的系統，其技能也能遷移到其他科學領域，從而開始革新更多學科。一個由快速遞歸自我改進驅動的世界，可能會被那個自我改進的模型所主導，并在更廣泛的經濟體系中擴散。如果人類勞動不再具有競爭力，很難預測經濟將呈現什么面貌。

最后文章提出，如果能有效地減緩這項技術的發展速度，從而為我們爭取更多時間來應對其巨大影響，我們認為這很可能是一件好事。但如果減速只是讓最不謹慎的參與者在技術上追趕上來，那最終可能讓所有人都更不安全。

如果用最直白的語言來描述這篇文章的內涵，其實就是探討AI本身的權力邊界到底在哪里。當前主流思潮更多關注模型是否安全、數據是否合法、算法是否透明、輸出是否可控這些技術維度的具體問題。但隨著AI的技術效應已從技術系統外溢至“代替人的工作和思考”，在技術變化山呼海嘯的現實面前，人類的主體性又如何在這巨大變革中被很好維護起來呢？

發展不能停下

以Anthropic研究的資料來定義上述危機，似乎并不是完全靠譜的。畢竟這只是一家公司之言，而來自中國的AI企業正以雨后春筍般的速度在崛起之中，我期待看到更加符合國內產業發展規律的思考出現，也有信心中國AI企業能比Anthropic做得更好。

不過Anthropic的這種“以AI防范AI”的似乎，也提醒人們，即便是最頂尖的企業屢屢發出AI權力邊界、AI安全隱患等事關未來的警告，它自身從沒有半點停下AI研究的步伐。而且公司的公開目標就是構建全球最領先的AI模型和AI智能體，并一直在照此行事。AI的發展不能停下。

圖靈在20世紀50年代對智能機器的預言為人工智能后來的發展奠定了哲學基礎。20世紀80年代和21世紀初，眾多神經網絡學界先驅為生成式AI大模型鋪平了道路。后來，2010年代深度學習的蓬勃發展推動了自然語言處理、圖像和文本生成以及通過圖像分割進行醫學診斷等領域的重大進步，從而擴展了人工智能的應用范圍。這些進步最終促成了當前似乎無所不能的多模態人工智能的出現。

想象一下未來的某一天，一個智能機器人能伴隨人生活的方方面面，會為人制定一周飲食計劃，并完成下單采購。人的通勤也將全面自動化，智能駕駛機器人將根據實時路況和天氣情況，規劃出最高效的上班路線。在工作中，智能體會幫人完成最繁瑣的文件和回復郵件等日常任務，還能提供切實可行的工作建議，并充當一個動態的、主動式的知識庫。嵌入式人工智能技術還能為人打造專屬娛樂體驗，生成符合個人喜好的AI故事、音樂或視覺藝術作品……

未來如此美好，怎么能不好好發展人工智能呢？而在當下，有關人工智能權力邊界這樣的倫理和法規層面標準也理應受到重視。比如，建立嚴格風險管理體系，強化對高風險AI技術的監管，并要求各大前沿AI大模型滿足透明度、穩健性和網絡安全等標準。

免責聲明（上下滑動查看全部）

任何在本文出現的信息（包括但不限于個股、評論、預測、圖表、指標、理論、任何形式的表述等）均只作為參考，投資人須對任何自主決定的投資行為負責。另，本文中的任何觀點、分析及預測不構成對閱讀者任何形式的投資建議，亦不對因使用本文內容所引發的直接或間接損失負任何責任。投資有風險，過往業績不預示未來表現。財經早餐力求文章所載內容及觀點客觀公正，但不保證其準確性、完整性、及時性等。本文僅代表作

?星標財經早餐，好內容不錯過?

覺得好看，請點“在看”，歡迎點贊評論和轉發

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.