網易首頁 > 網易號 > 正文申請入駐

別再當冤大頭！3招把Aider開銷砍掉80%，親測有效

2026-05-31 01:42:16　來源: 碳基打工人

北京舉報

分享至

在終端AI編程工具中，Aider 是我用過最出色的一個。但默認情況下，它會把每一次文件變動都通過你的 OpenAI 或 Anthropic 密鑰發送出去，真正的重構任務里費用會迅速飆高——單是一個包含 100 個文件的倉庫圖譜，在這款工具還沒讀到你的提示詞時，就可能燒掉幾美元。

本文將展示如何讓此編程助手對接任意大模型服務商——無論是免費本地運行的 Ollama、混合路由的 OpenRouter，還是企業級的 AWS Bedrock——全部通過一個兼容 OpenAI 的端點，再疊加上提示詞緩存與 MCP 代碼模式，把賬單砍得更狠。我會用自己維護的自托管網關 Lynkr。

需要說明的是，Lynkr 是我自己開發的。我想闡述的核心是：為什么“網關 + 緩存 + 代碼模式工具”這套組合，才是真正影響成本的關鍵，而不僅僅是“換個服務商”。

整個設置只需三條命令：第一，啟動網關；第二，把 Aider 指向該網關；第三，用 Lynkr 認識的任意模型名稱運行它。

這一助手的對話協議是 OpenAI 的 Chat Completions；Lynkr 用同樣的協議應答，并在底層悄悄把請求翻譯給你配置的任一上游服務商，涵蓋 Ollama、Bedrock、Anthropic、Azure、OpenRouter、Databricks、llama.cpp、LM Studio 等等。它完全不知道自己在跟一個路由器對話。

多數“AI 編程省錢”文章都聚焦在換用更便宜的模型替代 GPT-4o，那只是入門操作。真正的成本泄漏需要更精細的剖析。在一次編程會話中，最大的開銷就是相同字節被反復發送。換模型幫助有限，針對重復前綴做緩存才能立竿見影。

第一個成本杠桿是提示詞緩存。Anthropic、Bedrock、Gemini 和 OpenRouter 均已支持，但這款助手原生并不輸出它們的緩存控制協議（它只部分兼容 OpenAI 的協議）。而 Lynkr 充當中介，會將 cache_control: ephemeral 斷點注入合適的模塊，再轉發給上游。

實際效果很直接：在一次會話里，第二個請求——相同的倉庫圖譜、已添加的文件——只需為新加的少量指令代幣付費。在 Anthropic 上，緩存輸入代幣的價格是全新輸入的 10%；Bedrock 上是 25%；Gemini 上則可免費停留五分鐘。在一場持續四小時、面對 Claude Opus 4 或 GPT-5 的深度會話中，僅這一手段就讓我輸入費用降低約 70%，此時甚至還沒用上分層路由。當上游服務商支持緩存時，Lynkr 會自動開啟該功能，無需修改任何配置。

第二個成本杠桿是 MCP 代碼模式，它能夠將 N 次工具調用合并成一次。這款助手本身并不使用工具調用（它從純 Markdown 文本中解析代碼塊）。然而，一旦你開始把它和其他 MCP 工具組合起來——比如文件搜索、網頁抓取、沙盒執行——來回交互的成本就會急劇膨脹。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.