網易首頁 > 網易號 > 正文申請入駐

為什么堆算力救不了大模型

2026-05-20 18:53:53　來源: AI科技評論

廣東舉報

分享至

AI 填細節，人類定方向 —— 收斂性，才是劃分人與 AI 能力邊界的唯一關鍵。

一個擁有百萬token上下文窗口的大模型，可以在幾秒鐘內消化一整本書的信息。但如果你讓它執行一個需要三個月迭代、中間環境不斷變化的真實任務，它的表現會讓你懷疑人生。

它不是不聰明。它是不收斂。

這篇文章試圖從底層解釋：為什么會這樣，以及這件事對人和AI的分工意味著什么。

兩條路徑

大模型和人類大腦，都在從經驗中歸納規律。區別不在于誰更聰明，而在于對模型復雜度的偏好不同。

▎硅基路徑：追求盡可能復雜的模型。

Transformer架構的核心策略是統計擬合——參數越多，擬合訓練分布的精度就越高。Scaling Law告訴我們：算力越猛、數據越大，模型就能捕捉到越細微的模式。這條路的哲學是：盡可能精確地編碼當前環境的每一個細節。

▎碳基路徑：追求盡可能簡單的模型。

人腦只有20瓦功率，工作記憶一次只能處理七八個信息塊。這個硬件限制逼出了一套完全不同的策略：不去編碼所有細節，而是主動丟棄絕大部分信息，只留下那幾條變量最少的規律。這些規律精度很低——粗糙、模糊、丟失了大量細節。但簡單模型有一個復雜模型做不到的特性：它不依賴任何特定的時間、地點或環境條件。跨時間、跨空間、跨環境，依然成立。

打個比方。精確擬合像量體裁衣的西裝——合身，但只適合一個場合，換個場景就尷尬。粗糙壓縮像一件寬松的沖鋒衣——不好看，但刮風下雨爬山都能穿。

一句話概括：

▎AI追求精確但脆弱的擬合。人追求粗糙但不變的壓縮。

這不是優劣之分。這是兩種策略對不同類型問題的適配差異。而正是這個差異，決定了它們各自能解什么問題、不能解什么問題。

各自的底牌

從上面的路徑差異出發，雙方表現出的具體能力就不難理解了。

硅基的三張牌

這三個優勢，都是”精確擬合+算力暴力”這條路徑的自然衍生：

長上下文。你忘了的東西它還記得。它能在幾十萬字的廢棄信息中，翻出那些人類早已過濾掉的微弱關聯。

高帶寬。你一天看不完的報告，它一秒全吞了。它的信息觸達面幾乎沒有上限。

強執行力。你連續工作八小時會累、會犯低級錯誤；它跑一個月的長鏈條任務，第一天和最后一天的錯誤率一樣低。它不消耗意志力，不知疲倦。

碳基的三張牌

這三個優勢，都是”20瓦硬件限制”逼出來的演化必然：

過濾。知道什么不重要，比知道什么重要更重要。人腦天生帶一個極其強悍的噪音過濾器——它讓我們在信息洪流中，不需要處理所有東西就能直奔主干。

節能。一碗飯的熱量就能驅動一整天的復雜決策。這意味著我們可以在幾乎不消耗外部資源的情況下，完成方向性判斷。

不變性建模。這是三張牌里最關鍵的一張。人類傾向于建立簡單到近乎粗糙的模型——”供需決定價格”“人在恐懼時會非理性”——這種模型丟失了海量細節，但恰恰因為足夠簡單，它不依賴任何特定的時間、地點或環境條件。十年前成立，現在成立，換一個國家大概率也成立。

一個常見誤解

“AI沒有情緒所以更理性。”——人的風險厭惡不是非理性的bug。它是基因在幾十億年生死淘汰中計算出來的最優生存策略——一種極其冷酷的、經過真實代價驗證的優化結果。

收斂性：唯一重要的邊界

前面鋪了兩條路徑和各自的底牌，現在回到開頭的問題：為什么大模型在某些任務上表現驚艷，在另一些任務上徹底崩盤？

答案藏在一個概念里：收斂性。

一個策略能否收斂，取決于它依賴的假設會不會變。如果你的模型建立在不變的東西上——比如物理定律、人性的基本結構——那無論環境怎么遷移，誤差都在縮小。如果你的模型建立在當前環境的細節上——比如這個季度的市場偏好、這批用戶的行為模式——那環境一變，誤差就開始放大。前者收斂，后者不收斂。

收斂的本質是誤差衰減：你犯了一個小錯，系統會把它吸收掉，最終回到正軌。不收斂的本質是誤差放大：你犯了一個小錯，系統把它指數級放大，直到完全失控——這正是蝴蝶效應的準確含義。

可收斂的世界：AI的絕對領地

一個系統如果滿足以下條件，它就是可收斂的：

? 規則閉環——游戲規則不會中途改變

? 反饋即時——做對做錯馬上知道

? 環境穩定——今天有效的策略明天還有效

在這樣的世界里，AI的精確擬合是絕對王牌。環境不變，擬合得越精確就越接近最優解。堆更多算力、更多數據，誤差穩定縮小，答案越來越近。

舉一個已經發生的例子：代碼編譯。十年前，”這段邏輯對不對”是一個開放問題——你寫完代碼，可能要等用戶反饋才知道是否正確。但今天，編譯器、類型系統和自動化測試構成了一個完美的即時反饋沙盒。在這個沙盒里，AI可以瘋狂試錯，每次試錯成本近乎為零，每次反饋即時且精確。所以AI寫代碼的能力在飛速收斂。

所謂”沙盒化”，就是人類用工程基建，強行把一個開放問題變成可收斂的封閉系統。

不可收斂的世界：AI的結構性死穴

但真實世界的大部分場景不長這樣。它們的特征是：

? 反饋周期極長——做了一個決定，可能兩三年后才知道對不對

? 環境持續遷移——今天有效的策略，下個月可能因為政策變化、市場突變而完全失效

? 微小偏差不斷放大——每一步的誤判都在累積，且越到后面偏離越大

在這樣的世界里，AI的精確擬合反而變成了致命缺陷。它擬合得越精確，就越綁死在訓練時的數據分布上。環境一遷移，那些精確到小數點后四位的”最優策略”瞬間變成廢紙。

而人類那些”粗糙但不變”的模型，恰恰因為從未依賴任何特定環境的細節，所以環境怎么變它都不崩。”這個人底層靠不靠譜”——這個判斷在十年前、現在、換一個行業，大概率都成立。

再看一個具體例子：投資一個人或一家早期公司。三年才有一個真實反饋。中間市場環境突變無數次。AI的精確擬合——基于歷史數據的統計模式——在第一次環境遷移時就碎了。能穿越這三年的，是投資人腦子里那幾條極簡的、粗糙的、不依賴特定市場環境的判斷規則。

大模型的硬頂

現在可以精確地回答開頭的問題了：

大模型每一步推理都有微小的統計誤差。在可收斂的系統里，這些誤差被環境的即時反饋修正掉了，所以表現驚艷。在不可收斂的系統里，這些誤差沒有任何東西來修正，它們一步步復利放大，直到輸出完全偏離現實。

這不是”還不夠強”的工程問題。這是統計擬合這條路徑在面對誤差放大系統時的數學宿命。堆更多參數、更長上下文、更多訓練數據，都不能改變這個事實——因為問題不在精度不夠，而在精度本身就是脆弱性的來源。

分工的臨界點

如果你接受了第三部分的推導，那么人和AI的分工邏輯就變得清晰了。

博弈結構

人類干預 = 用不變性模型預判方向。好處：避免AI在不收斂的環境中魯莽執行、指數級燒錢。代價：人類的模型太粗糙，可能剪掉那些反直覺的、本來能通向意外成功的路徑。

AI自主執行 = 在可收斂的沙盒內暴力窮舉。好處：找到人類憑直覺想不到的精確解。代價：一旦出了沙盒，魯莽執行的資源損耗會被誤差放大效應指數級吞噬。

什么時候該讓人拍板，什么時候該放手讓AI試——取決于試錯的代價有多大，以及系統是否在收斂。

這兩者之間存在一個動態的均衡點。

什么在移動這個均衡點

答案是：沙盒基建。

每當工程基建把一個原本不收斂的領域成功改造成可收斂的封閉系統——就像編譯器和自動化測試改造了代碼世界——AI的安全領地就多一塊，均衡點就向AI方向移一步。

這引出一個對產業至關重要的判斷：

未來AI產品的核心競爭力，不是模型更大、上下文更長。而是誰能把更多的真實任務變成可收斂的封閉環境。做更好的沙盒，比做更大的模型更重要。

為什么人類不會出局

最后一個問題：如果沙盒基建不斷推進，AI的領地越來越大，人類最終會不會被徹底擠出去？

不會。原因有三：

第一，世界整體不收斂。局部可以被工程基建封裝成沙盒，但整體不行。真實世界的規則在不斷突變，新的不確定性在不斷涌現。

第二，未做的事永遠比已做的事多。舊世界被沙盒接管了，人類就去開拓新世界。人類社會并不是一個存量博弈。

第三，只要環境還在變，”粗糙但不變”就永遠比”精確但脆弱”值錢。這是數學性質決定的——在誤差放大的系統里，不變性是唯一能穿越時間的東西。

碳基用20瓦畫一根不變的線。硅基用兆瓦把線兩邊精確地填滿。

未經「AI科技評論」授權，嚴禁以任何方式在網頁、論壇、社區進行轉載！

公眾號轉載請先在「AI科技評論」后臺留言取得授權，轉載時需標注來源并插入本公眾號名片。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.