用Claude Code正經寫過一陣子代碼后,我悟出一個核心教訓:Token消耗本質上不是定價問題,而是工作流問題。
每次會話變亂,性能就肉眼可見地下降。它開始重讀那些根本不相關的文件,記住早就該忘掉的失敗嘗試,拖著舊日志不放,把寶貴的上下文浪費在已經毫無意義的事情上。這時候你再續費、再升級模型都沒用——瓶頸不在模型能力,在它腦子里的垃圾太多。
![]()
所以我的整個工作流圍繞一條原則運轉:讓Claude的活躍上下文始終保持小而干凈、條條有用。下面這9個方法是我每天在用、實測有效的Token節省策略。
別把原始日志直接丟給Claude。一萬行的測試輸出對它是純粹的上下文污染。它不需要看到全量日志,只需要那條失敗的測試、堆棧信息、期望值和實際值的對比,最多再加一份變更文件列表。
所以我再也不跑裸的npm test了。改用過濾命令,比如npm test 2>&1 | grep -A5 -E "FAIL|ERROR|Error|Expected|Received" | head -100。更理想的做法是自己寫幾個輕量包裝腳本,起名叫cc-test、cc-lint、cc-typecheck、cc-log、cc-ci之類,要用的時候直接調。核心邏輯一句話:讓Claude消費的是摘要,不是終端噪音。這個改動從源頭掐斷上下文污染,省下的Token遠超其他任何優化。
不是每個任務都需要同樣的算力,所有活兒都上Opus是我見過最燒錢的習慣之一。大多數編碼工作Sonnet完全夠用,成本卻只是零頭。我的配置策略是:默認用Sonnet處理日常編碼,遇到復雜架構設計、深層推理、刁鉆bug才切成Opus,硬骨頭啃完立刻切回來。至于子代理,我統一設成Haiku——探查代理、日志檢查代理、文檔查尋代理全跑在Haiku上,主線程穩在Sonnet。擴展思考功能也一樣,不需要深度推理的時候就關掉,別讓它無意義地深度思考。
清理時用/compact把重要的東西留住,其余扔掉。當要切換到完全不同的任務時,用/clear配合轉交文件清空上下文,這樣過去那些失敗的嘗試就不會堆積在上下文記憶里。
Claude Code的系統提示里只放它大多數時候都需要知道的東西——怎么跑測試、構建命令怎么寫、目錄結構長什么樣、核心規則是哪些。剩下所有內容都放進獨立的技能文件,只在真正需要的時候按需加載。這才是對Token的精細化管理。
用Composio MCP把上千個工具當成一個統一系統來管,而不是同時維護三十多個活躍服務器。遇到簡單到能用命令行搞定的任務,直接用Composio CLI,別再走MCP那條重路徑。
這些方法拼在一起,本質上是同一個邏輯:不是讓Claude更努力地工作,而是讓它只看到該看到的東西。Token消耗降下來不是目的,上下文干凈了,產出質量自然就上去了。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.