網易首頁 > 網易號 > 正文申請入駐

GitHub砍掉62%智能體token開銷，多模型協同新策略

2026-05-30 05:58:22　來源: 算力游俠

北京舉報

分享至

每執行一次智能體工作流，背后都是真金白銀的token消耗。GitHub近期公布了一組數據：通過對智能體持續集成流水線實施每日審計與"MCP修剪"技術，token開銷最高減少了62%。這組數字來自InfoQ的案例研究，直接揭示了生產環境中AI智能體編排的成本優化空間。

具體來說，GitHub的工程團隊系統性地分析了CI/CD流水線中每一次語言模型調用的token用量，定位到那些被傳入模型卻并不產生實際價值的冗余上下文。這類信息可能是歷史對話中已經失效的片段，也可能是任務無關的元數據。識別出這些噪音后，團隊通過一種名為"MCP修剪"的機制進行干預——MCP即模型上下文協議，修剪意味著只保留當前步驟最必要的上下文信息，其余一概剔除。

這一思路的啟示在于：在智能體編排中，上下文管理本身就是一項獨立的工程決策。不少人傾向于將盡可能多的信息喂給模型，認為"信息越多判斷越準"。但GitHub的實踐提供了反例——精準裁剪上下文不僅沒有損害智能體的表現，反而帶來了顯著的性能提升和成本下降。62%這個數字對于任何運行在生產環境中的AI系統而言，都足以重新審視自身的上下文策略。

成本控制是一端，指令一致是另一端。當開發團隊同時使用Claude、Gemini、Copilot等多個編碼智能體時，如何讓它們遵循統一的規范和最新提示？Dev.to上的一篇熱文提出了一個方案：以單一文件AGENTS.md作為指令的源頭，然后自動推導出各平臺所需的特定格式，例如CLAUDE.md或GEMINI.md。

這意味著開發者只需要維護一份版本化、可追溯的指令文檔，其余的分發和適配工作交給自動化流程處理。過去那種"改了Claude的提示忘了同步給Copilot"的人為疏忽得以規避，代碼生成和評審行為的可預測性也因此增強。在多智能體協作的場景下，指令管理本身就是隱性復雜度的集中地——AGENTS.md的做法相當于用Git友好的方式來治理這種復雜度。

值得注意的是，這種方案并沒有引入新的基礎設施或抽象層。它所做的只是約定了一個文件名，并將其置于版本控制之下。正因如此，文章強調這是開發者可以立即采用的實踐，對于需要將多種智能體納入統一開發流水線的團隊來說，降低的是協調成本。

把上下文修剪和指令統一這兩件事結合起來看，一個更清晰的圖景浮現出來：智能體工作流的優化正在從"模型調參"轉向"工程治理"。無論是削減token浪費，還是確保指令同步，核心動作都是對信息流動施加更精細的控制。這并不是模型能力的比拼，而是對流水線本身的設計取舍。

同樣沿襲這一方向的還有Opus 4.8的動態工作流功能。Dev.to上的實踐文章展示了如何用它構建一個可自我驗證的PR評審智能體。所謂"自我驗證"，意味著智能體在完成評審后，會對自己提出的修改建議進行二次校驗，確認建議是否與代碼規范一致、是否存在遺漏。這套機制將質量把關的部分責任從人工審閱者轉移到了智能體自身的流程中。

這一做法的潛在價值在于，代碼評審不再是一次性的生成動作，而是多階段、帶反饋回路的執行。動態工作流使得智能體能夠根據首次評審的結果觸發后續步驟，例如補充測試用例或標記需要人工介入的復雜變更。這比單純輸出評審意見的智能體更進一步，也更接近實際團隊中"評審-修改-確認"的協作模式。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.