一家公司在推理服務上每月要燒掉12.5億美元,不是為了訓練更聰明的模型,僅僅是用來回答用戶即時的請求。2026年5月,SpaceX提交的S-1文件悄悄披露了這一數字——它是Anthropic為使用Colossus I和Colossus II計算集群簽下的合同,每月固定支付12.5億美元,合約期一直延伸到2029年5月,且絕大部分算力用于推理,而非模型訓練。
這個數字放在半年前或許還顯得突兀,但另一組數據早就給出了注解。2026年一季度,Uber全部代碼提交中有25%來自Claude Code。不是試點項目,也不是黑客松實驗,而是產線級的常規提交,發生在這家地球上業務最復雜、多服務、多語言混合的工程組織內部。Uber的工程團隊在短短幾個月內就燒穿了全年的AI預算,Anthropic隨之被曝有望在二季度實現109億美元的收入,邁向公司首個盈利季度,而驅動這一切的核心力量,正是企業級編碼代理的密集使用。
![]()
當一家公司愿意每月投入十位數美元來響應用戶的每一次敲擊時,背后的技術已經不再是“有前景的試驗品”,而是一段不可回撤的基礎設施。對開發者來說,這同樣是一個響亮的信號:AI編碼代理不是未來式,它就是現在。而那些能真正理解這套架構運作方式的工程團隊,會率先從中榨取出遠超過同行的價值。
在深入架構之前,需要先劃清一條概念上的分界線——什么才算AI編碼代理,而不是一個“編碼助手”。早一代的編碼助手,比如早期的Copilot或者聊天窗口里的ChatGPT,工作模式是一個嚴格的請求-響應循環:你給它一段提示,它返回一段文本。在一個全新的會話里,它沒有任何關于之前交互的記憶;它只能看到你粘貼進窗口的內容;它既不能執行代碼,也無法讀取你的文件系統,更不可能檢查自己的建議是否真的通過編譯。本質上,它是一個極其聰明的自動補全工具。
而一個編碼代理的起點,恰恰是打破這些邊界。它不止步于給出建議,而是直接進入代碼庫,像一個真實的開發者那樣感知、行動、修正并持續迭代。要理解這一點,需要把目光移到整個代理循環的底層設計上——那才是真正改變軟件工程的結構,也是接下來我們要逐層拆解的東西。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.