在終端AI編程工具中,Aider 是我用過最出色的一個。但默認情況下,它會把每一次文件變動都通過你的 OpenAI 或 Anthropic 密鑰發送出去,真正的重構任務里費用會迅速飆高——單是一個包含 100 個文件的倉庫圖譜,在這款工具還沒讀到你的提示詞時,就可能燒掉幾美元。
本文將展示如何讓此編程助手對接任意大模型服務商——無論是免費本地運行的 Ollama、混合路由的 OpenRouter,還是企業級的 AWS Bedrock——全部通過一個兼容 OpenAI 的端點,再疊加上提示詞緩存與 MCP 代碼模式,把賬單砍得更狠。我會用自己維護的自托管網關 Lynkr。
需要說明的是,Lynkr 是我自己開發的。我想闡述的核心是:為什么“網關 + 緩存 + 代碼模式工具”這套組合,才是真正影響成本的關鍵,而不僅僅是“換個服務商”。
整個設置只需三條命令:第一,啟動網關;第二,把 Aider 指向該網關;第三,用 Lynkr 認識的任意模型名稱運行它。
這一助手的對話協議是 OpenAI 的 Chat Completions;Lynkr 用同樣的協議應答,并在底層悄悄把請求翻譯給你配置的任一上游服務商,涵蓋 Ollama、Bedrock、Anthropic、Azure、OpenRouter、Databricks、llama.cpp、LM Studio 等等。它完全不知道自己在跟一個路由器對話。
多數“AI 編程省錢”文章都聚焦在換用更便宜的模型替代 GPT-4o,那只是入門操作。真正的成本泄漏需要更精細的剖析。在一次編程會話中,最大的開銷就是相同字節被反復發送。換模型幫助有限,針對重復前綴做緩存才能立竿見影。
第一個成本杠桿是提示詞緩存。Anthropic、Bedrock、Gemini 和 OpenRouter 均已支持,但這款助手原生并不輸出它們的緩存控制協議(它只部分兼容 OpenAI 的協議)。而 Lynkr 充當中介,會將 cache_control: ephemeral 斷點注入合適的模塊,再轉發給上游。
實際效果很直接:在一次會話里,第二個請求——相同的倉庫圖譜、已添加的文件——只需為新加的少量指令代幣付費。在 Anthropic 上,緩存輸入代幣的價格是全新輸入的 10%;Bedrock 上是 25%;Gemini 上則可免費停留五分鐘。在一場持續四小時、面對 Claude Opus 4 或 GPT-5 的深度會話中,僅這一手段就讓我輸入費用降低約 70%,此時甚至還沒用上分層路由。當上游服務商支持緩存時,Lynkr 會自動開啟該功能,無需修改任何配置。
第二個成本杠桿是 MCP 代碼模式,它能夠將 N 次工具調用合并成一次。這款助手本身并不使用工具調用(它從純 Markdown 文本中解析代碼塊)。然而,一旦你開始把它和其他 MCP 工具組合起來——比如文件搜索、網頁抓取、沙盒執行——來回交互的成本就會急劇膨脹。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.