網易首頁 > 網易號 > 正文申請入駐

這家Agent 公司從 Claude 切到 DeepSeek v4：一年省下數百萬美元，遷移工作量卻是預期的 100 倍

2026-06-22 13:27:32　來源: InfoQ

北京舉報

分享至

作者 | Paul Sawers

譯者 | 平川

策劃 | Tina

本文最初發布于博客 TheNewStack。

初創公司 Lindy 將其全部 AI 代理流量從 Anthropic 轉移到了 DeepSeek v4，每年可以節省數百萬美元的推理成本。首席執行官 Flo Crivello 解釋了為什么遷移工作比預期多出許多。

圖片來自 Unsplash+，由用戶 Space Stock 提供

推理成本已經成為可持續 AI 部署的最大障礙。最近，GitHub放棄了其 Copilot 訂閱的統一費率，轉而采用基于使用的計費方式，因為代理編碼會話的成本超出了固定月費能夠覆蓋的范圍——一些訂閱者醒來時發現，他們的賬單比之前高出數倍。與此同時，在短短四個月內，Uber 就燒光了 2026 年整年的 AI 預算，主要是在 Claude Code 上。這讓首席運營官產生了質疑，他們所獲得的回報是否值得這筆支出。

為應對這一更廣泛的行業反思，Linux 基金會成立了 Tokenomics 基金會，得到了谷歌、微軟、IBM、Salesforce 等企業的支持。該基金會旨在圍繞 AI Token 成本建立一個開放的標準。這一舉措表明，業界已經意識到，企業目前尚無統一的方法來衡量或控制這方面的支出。

轉型

對于大量運行 AI 代理的公司來說，前沿模型的經濟性已經成為一個幾乎關乎生存的問題。

Flo Crivello（前 Uber 工程師兼產品負責人）是 Lindy 的創始人兼首席執行官。Lindy 是一個無代碼 AI 代理平臺，可以自動化日常工作任務——從電子郵件分類和會議安排到 CRM 管理。作為 Teamflow 的轉型舉措，Crivello 在 2023 年創立了 Lindy。前者是一個他之前籌集了 5200 萬美元的資金創辦的一家虛擬辦公室初創公司。這些資本現在被用于支持 Lindy 的發展。

Lindy

上周，Crivello 在社交媒體上宣布，Lindy 已經將其整個模型基礎設施從 Anthropic 切換到了 DeepSeek。

Crivello 在 X 上寫道，“今天我們扣動了扳機，將 100% 的 Lindy 流量從 Anthropic 模型切換到了 DeepSeek v4。這每年能為我們節省數百萬美元，而且，我們在許多核心用例上看到了性能提升。對業務來說，這是變革性的。”

實際上，Crivello 早在幾個月前就暗示過他的意圖。4 月份的時候，他曾經在 X 上寫道，推理是 Lindy 占比最高的單項支出（超過了工資單），并且只用了一年時間，開源大模型就從“遠不及閉源模型”發展到了“在大多數使用場景中都躋身前沿水平”。他說，當時 Lindy 差點將 Kimi K2.5（來自中國 AI 公司 Moonshot AI 的一個模型）作為其默認設置，不過后來他們轉向了總部位于北京的 Zhipu AI 開發的 GLM-5.1。

最終，這家公司選擇了 DeepSeek v4，這是中國 AI 研究公司 DeepSeek 的一個旗艦開源模型。

當然，在全面投入生產的情況下從一家模型供應商切換到另一家絕非易事。Crivello 告訴 The New Stack，完成這一過程所需的時間取決于從何時開始計算。但無論如何，這都是一項艱巨的任務。

Crivello 解釋道，“我們一直在考慮進行這次轉型，并評估新的開源軟件（OSS）方案已有 6 到 9 個月的時間，而 DeepSeek 自發布以來，我們也一直在關注它，大約有 2 個月了”。

值得注意的是，遷移工作比 Crivello 最初的預期要繁重許多。他說，“比我們想象的工作要多 100 倍”。評估（在現實世界的任務中系統性地測試新模型，驗證它能否媲美甚或超過 Anthropic 模型的性能）是其中的一個重要部分。

Flo Crivello，Lindy 創始人兼首席執行官

Crivello 說，“模型評估的工作量很大，包括在線評估、離線評估，還有大量‘氛圍評估’。[隨后我們] 分階段上線了在線評估，同時觀察其對用戶留存率的影響；[接著] 針對新模型調整了提示詞。”

僅看成本節省這一項，還不足以證明這項工作的合理性。但性能結果給了 Crivello 更多的信心，特別是在其核心用例上，包括電子郵件收件箱分類和根據用戶的反饋預先起草回復。

Crivello 解釋說，“正是在那些任務中，我們看到了 DeepSeek 所帶來的驚人的性能提升。”不過他也指出，在一些復雜的自動化任務上，DeepSeek 仍然落后于 Anthropic。

他說，“在工作流自動化方面，它仍然不如 Sonnet，不過，這對我們來說并不重要。”

DeepSeek 時刻

要理解 Lindy 的轉型為何如此重要，了解 DeepSeek 在 AI 行業中所代表的意義會有所幫助。

2025 年 1 月，DeepSeek 公司在硅谷引起了軒然大波：其 R1 模型以極低的成本達到了與美國頂尖前沿模型相當的性能水平。這使得英偉達的股價出現了一輪短暫但劇烈的拋售，投資者開始質疑關于 AI 計算需求的基本假設。此后，該公司接連發布新產品，不斷縮小與前沿領域的差距。

2026 年 4 月發布的 DeepSeek V4 預覽版標志著又一次重大飛躍，而且不僅僅體現在價格上。在 LinkedIn 上，瑞士洛桑聯邦理工學院（EPFL）教授、EPFL 人工智能中心聯合主任 Marcel Salathe 指出，從地緣政治的角度來看，V4 有著更深遠的意義：這是首次出現從芯片、框架到模型完全由中國自主研發的尖端 AI 技術棧。據悉，DeepSeek 耗時數月重寫了 v4 版本，使其能在 CANN（華為版 Nvidia CUDA）上運行，從而降低了對美國芯片基礎設施的依賴。

這種地緣政治格局的轉變帶來了直接的商業影響。正如 The New Stack 此前報道的那樣，以中國人工智能實驗室為主的廉價開放權重模型的出現，將 AI 模型市場一分為二：一端是 OpenAI 和 Anthropic 等公司推出的超高端前沿模型，另一端則是價格大幅降低的開放權重替代方案，而原本舒適的中間地帶正在逐漸萎縮。數據印證了這一趨勢：作為連接應用程序與 AI 服務提供商的中介平臺，Vercel 的 AI Gateway 數據顯示，DeepSeek 在 5 月單月內的 Token 交易量份額從不足 1% 躍升至 17%，而其實際支出份額仍維持在 1% 左右，這恰恰反映出這些 Token 的實際成本有多么低廉。

對于像 Lindy 這樣大規模運行代理的公司而言，這種兩極分化迫使他們不得不認真思考該選擇哪種商業模式。對于 Lindy 的創始人來說，由于推理成本已經超過薪資支出，這個問題其實只是時間早晚的問題。

Lindy 最終選擇了 Atlas Cloud——這家總部位于美國的推理服務提供商在美國本土托管 DeepSeek v4 模型。鑒于圍繞中國開發模型的數據主權問題往往備受關注，這一點尤為重要。在回應 X 平臺上一位評論者的提問時，Crivello 直接談及了此事。他指出，該模型由一家美國服務商在美國境內托管，并且在評估了“所有主要供應商”后，Atlas脫穎而出。值得一提的是，自主托管從未被列入他們的考慮范圍。

他說，“我們沒有認真考慮過[自托管]，不，那看起來會分散我們很大的注意力。”

發展前景和未來計劃

雖然 Crivello 表示，此次轉型最終為 Lindy 節省了數百萬美元，但對于一家風險投資支持的公司來說，這對其發展前景的影響非常深遠。

但具體有多少呢？Crivello 說，”很多“。

至于這一舉措是否是永久性的，Crivello 并沒有明確表態。他說，“世上沒有什么是永恒的。如果 Anthropic 的下一次發布能讓他們重新贏得我們的業務，我也不會感到驚訝，但他們需要大幅降價。”

同樣值得注意的是，Lindy 仍然是 Anthropic 的客戶，只是不是其核心產品。該公司仍然在內部使用 Claude，因為訂閱方案的經濟性使其變得可行。

Crivello 說，“我們內部使用的是 Max plan。如果沒有它，那么我們就必須支付完整的 Token 價格，要是這樣的話，我們會轉向其他東西”。

關于 Lindy 最終是否可能被迫在其外部產品中重新采用 Anthropic 模型，在回應 Amp CEO 兼創始人 Quinn Slack 的問題時，Crivello 暗示這并非完全不可能。他寫道，“當我們檢測到 Lindy 在任務中失敗時，我們可能仍然會升級到 Opus，但那將是少數情況。”

Crivello 的觀點是，像 Lindy 這樣的公司（大型 Token 消費者）別無選擇，只能采取行動。他說，“像我們這樣在 Token 上花很多錢的公司，100% 要行動。不這么做將是不負責任的。其他公司要看具體情況，但我認為很多人只是認品牌。”

https://thenewstack.io/lindy-deepseek-anthropic-switch/

聲明：本文為 InfoQ 翻譯，未經許可禁止轉載。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.