无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

這家Agent 公司從 Claude 切到 DeepSeek v4:一年省下數(shù)百萬美元,遷移工作量卻是預(yù)期的 100 倍

0
分享至


作者 | Paul Sawers

譯者 | 平川

策劃 | Tina

本文最初發(fā)布于博客 TheNewStack。

初創(chuàng)公司 Lindy 將其全部 AI 代理流量從 Anthropic 轉(zhuǎn)移到了 DeepSeek v4,每年可以節(jié)省數(shù)百萬美元的推理成本。首席執(zhí)行官 Flo Crivello 解釋了為什么遷移工作比預(yù)期多出許多。


圖片來自 Unsplash+,由用戶 Space Stock 提供

推理成本 已經(jīng)成為可持續(xù) AI 部署的最大障礙。最近,GitHub放棄 了其 Copilot 訂閱的統(tǒng)一費(fèi)率,轉(zhuǎn)而采用基于使用的計(jì)費(fèi)方式,因?yàn)榇砭幋a會話的成本超出了固定月費(fèi)能夠覆蓋的范圍——一些訂閱者醒來時發(fā)現(xiàn),他們的賬單比之前高出數(shù)倍。與此同時,在短短四個月內(nèi),Uber 就燒光了 2026 年整年的 AI 預(yù)算,主要是在 Claude Code 上。這讓首席運(yùn)營官產(chǎn)生了質(zhì)疑,他們所獲得的回報(bào)是否值得這筆支出。

為應(yīng)對這一更廣泛的行業(yè)反思,Linux 基金會成立了 Tokenomics 基金會, 得到了谷歌、微軟、IBM、Salesforce 等企業(yè)的支持。該基金會旨在圍繞 AI Token 成本建立一個開放的標(biāo)準(zhǔn)。這一舉措表明,業(yè)界已經(jīng)意識到,企業(yè)目前尚無統(tǒng)一的方法來衡量或控制這方面的支出。

轉(zhuǎn) 型

對于大量運(yùn)行 AI 代理的公司來說,前沿模型的經(jīng)濟(jì)性已經(jīng)成為一個幾乎關(guān)乎生存的問題。

Flo Crivello(前 Uber 工程師兼產(chǎn)品負(fù)責(zé)人)是 Lindy 的創(chuàng)始人兼首席執(zhí)行官。Lindy 是一個無代碼 AI 代理平臺,可以自動化日常工作任務(wù)——從電子郵件分類和會議安排到 CRM 管理。作為 Teamflow 的轉(zhuǎn)型舉措,Crivello 在 2023 年創(chuàng)立了 Lindy。前者是一個他之前籌集了 5200 萬美元 的資金創(chuàng)辦的一家虛擬辦公室初創(chuàng)公司。這些資本現(xiàn)在被用于支持 Lindy 的發(fā)展。


Lindy

上周,Crivello 在社交媒體上 宣布,Lindy 已經(jīng)將其整個模型基礎(chǔ)設(shè)施從 Anthropic 切換到了 DeepSeek。

Crivello 在 X 上寫道,“今天我們扣動了扳機(jī),將 100% 的 Lindy 流量從 Anthropic 模型切換到了 DeepSeek v4。這每年能為我們節(jié)省數(shù)百萬美元,而且,我們在許多核心用例上看到了性能提升。對業(yè)務(wù)來說,這是變革性的。”

實(shí)際上,Crivello 早在幾個月前就 暗示過他的意圖。4 月份的時候,他曾經(jīng) 在 X 上寫道,推理是 Lindy 占比最高的單項(xiàng)支出(超過了工資單),并且只用了一年時間,開源大模型就從“遠(yuǎn)不及閉源模型”發(fā)展到了“在大多數(shù)使用場景中都躋身前沿水平”。他說,當(dāng)時 Lindy 差點(diǎn)將 Kimi K2.5(來自中國 AI 公司 Moonshot AI 的一個模型)作為其默認(rèn)設(shè)置,不過后來他們轉(zhuǎn)向了總部位于北京的 Zhipu AI 開發(fā)的 GLM-5.1。

最終,這家公司選擇了 DeepSeek v4,這是中國 AI 研究公司 DeepSeek 的一個旗艦開源模型。

當(dāng)然,在全面投入生產(chǎn)的情況下從一家模型供應(yīng)商切換到另一家絕非易事。Crivello 告訴 The New Stack,完成這一過程所需的時間取決于從何時開始計(jì)算。但無論如何,這都是一項(xiàng)艱巨的任務(wù)。

Crivello 解釋道,“我們一直在考慮進(jìn)行這次轉(zhuǎn)型,并評估新的開源軟件(OSS)方案已有 6 到 9 個月的時間,而 DeepSeek 自發(fā)布以來,我們也一直在關(guān)注它,大約有 2 個月了”。

值得注意的是,遷移工作比 Crivello 最初的預(yù)期要繁重許多。他說,“比我們想象的工作要多 100 倍”。評估(在現(xiàn)實(shí)世界的任務(wù)中系統(tǒng)性地測試新模型,驗(yàn)證它能否媲美甚或超過 Anthropic 模型的性能)是其中的一個重要部分。


Flo Crivello,Lindy 創(chuàng)始人兼首席執(zhí)行官

Crivello 說,“模型評估的工作量很大,包括在線評估、離線評估,還有大量‘氛圍評估’。[隨后我們] 分階段上線了在線評估,同時觀察其對用戶留存率的影響;[接著] 針對新模型調(diào)整了提示詞。”

僅看成本節(jié)省這一項(xiàng),還不足以證明這項(xiàng)工作的合理性。但性能結(jié)果給了 Crivello 更多的信心,特別是在其核心用例上,包括電子郵件收件箱分類和根據(jù)用戶的反饋預(yù)先起草回復(fù)。

Crivello 解釋說,“正是在那些任務(wù)中,我們看到了 DeepSeek 所帶來的驚人的性能提升。”不過他也指出,在一些復(fù)雜的自動化任務(wù)上,DeepSeek 仍然落后于 Anthropic。

他說,“在工作流自動化方面,它仍然不如 Sonnet,不過,這對我們來說并不重要。”

DeepSeek 時刻

要理解 Lindy 的轉(zhuǎn)型為何如此重要,了解 DeepSeek 在 AI 行業(yè)中所代表的意義會有所幫助。

2025 年 1 月,DeepSeek 公司在硅谷引起了軒然大波:其 R1 模型以極低的成本達(dá)到了與美國頂尖前沿模型相當(dāng)?shù)男阅芩健_@使得英偉達(dá)的股價出現(xiàn)了 一輪短暫但劇烈的拋售,投資者開始質(zhì)疑關(guān)于 AI 計(jì)算需求的基本假設(shè)。此后,該公司接連發(fā)布新產(chǎn)品,不斷縮小與前沿領(lǐng)域的差距。

2026 年 4 月發(fā)布的 DeepSeek V4 預(yù)覽版 標(biāo)志著又一次重大飛躍,而且不僅僅體現(xiàn)在價格上。在 LinkedIn 上,瑞士洛桑聯(lián)邦理工學(xué)院(EPFL)教授、EPFL 人工智能中心聯(lián)合主任 Marcel Salathe 指出,從地緣政治的角度來看,V4 有著更深遠(yuǎn)的意義:這是首次出現(xiàn)從芯片、框架到模型完全由中國自主研發(fā)的尖端 AI 技術(shù)棧。據(jù)悉,DeepSeek 耗時數(shù)月重寫了 v4 版本,使其能在 CANN(華為版 Nvidia CUDA)上運(yùn)行,從而 降低了對美國芯片基礎(chǔ)設(shè)施的依賴。

這種地緣政治格局的轉(zhuǎn)變帶來了直接的商業(yè)影響。正如 The New Stack 此前報(bào)道 的那樣,以中國人工智能實(shí)驗(yàn)室為主的廉價開放權(quán)重模型的出現(xiàn),將 AI 模型市場一分為二:一端是 OpenAI 和 Anthropic 等公司推出的超高端前沿模型,另一端則是價格大幅降低的開放權(quán)重替代方案,而原本舒適的中間地帶正在逐漸萎縮。數(shù)據(jù)印證了這一趨勢:作為連接應(yīng)用程序與 AI 服務(wù)提供商的中介平臺,Vercel 的 AI Gateway 數(shù)據(jù)顯示,DeepSeek 在 5 月單月內(nèi)的 Token 交易量份額從不足 1% 躍升至 17%,而其實(shí)際支出份額仍維持在 1% 左右,這恰恰反映出這些 Token 的實(shí)際成本有多么低廉。

對于像 Lindy 這樣大規(guī)模運(yùn)行代理的公司而言,這種兩極分化迫使他們不得不認(rèn)真思考該選擇哪種商業(yè)模式。對于 Lindy 的創(chuàng)始人來說,由于推理成本已經(jīng)超過薪資支出,這個問題其實(shí)只是時間早晚的問題。

Lindy 最終選擇了 Atlas Cloud——這家總部位于美國的推理服務(wù)提供商在美國本土托管 DeepSeek v4 模型。鑒于圍繞中國開發(fā)模型的數(shù)據(jù)主權(quán)問題往往備受關(guān)注,這一點(diǎn)尤為重要。在回應(yīng) X 平臺上一位評論者 的提問時,Crivello 直接談及了此事。他指出,該模型由一家美國服務(wù)商在美國境內(nèi)托管,并且在評估了“所有主要供應(yīng)商”后,Atlas脫穎而出。值得一提的是,自主托管從未被列入他們的考慮范圍。

他說,“我們沒有認(rèn)真考慮過[自托管],不,那看起來會分散我們很大的注意力。”

發(fā)展前景和未來計(jì)劃

雖然 Crivello 表示,此次轉(zhuǎn)型最終為 Lindy 節(jié)省了數(shù)百萬美元,但對于一家風(fēng)險投資支持的公司來說,這對其發(fā)展前景的影響非常深遠(yuǎn)。

但具體有多少呢?Crivello 說,”很多“。

至于這一舉措是否是永久性的,Crivello 并沒有明確表態(tài)。他說,“世上沒有什么是永恒的。如果 Anthropic 的下一次發(fā)布能讓他們重新贏得我們的業(yè)務(wù),我也不會感到驚訝,但他們需要大幅降價。”

同樣值得注意的是,Lindy 仍然是 Anthropic 的客戶,只是不是其核心產(chǎn)品。該公司仍然在內(nèi)部使用 Claude,因?yàn)橛嗛喎桨傅慕?jīng)濟(jì)性使其變得可行。

Crivello 說,“我們內(nèi)部使用的是 Max plan。如果沒有它,那么我們就必須支付完整的 Token 價格,要是這樣的話,我們會轉(zhuǎn)向其他東西”。

關(guān)于 Lindy 最終是否可能被迫在其外部產(chǎn)品中重新采用 Anthropic 模型,在回應(yīng) Amp CEO 兼創(chuàng)始人 Quinn Slack 的 問題 時,Crivello 暗示這并非完全不可能。他 寫道,“當(dāng)我們檢測到 Lindy 在任務(wù)中失敗時,我們可能仍然會升級到 Opus,但那將是少數(shù)情況。”

Crivello 的觀點(diǎn)是,像 Lindy 這樣的公司(大型 Token 消費(fèi)者)別無選擇,只能采取行動。他說,“像我們這樣在 Token 上花很多錢的公司,100% 要行動。不這么做將是不負(fù)責(zé)任的。其他公司要看具體情況,但我認(rèn)為很多人只是認(rèn)品牌。”

https://thenewstack.io/lindy-deepseek-anthropic-switch/

聲明:本文為 InfoQ 翻譯,未經(jīng)許可禁止轉(zhuǎn)載。

會議推薦

AICon 上海站 4 大核心看點(diǎn):Keynote 前瞻洞見、Agent 工程化專題拆解、前沿技術(shù) + 產(chǎn)業(yè)落地全覆蓋,Google Cloud 專家實(shí)操帶練。更多詳情可掃碼或聯(lián)系票務(wù)經(jīng)理 13269078023 進(jìn)行咨詢。

今日薦文


你也「在看」嗎?

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
突發(fā)!長鑫存儲簽200億大單!

突發(fā)!長鑫存儲簽200億大單!

中國半導(dǎo)體論壇
2026-06-30 13:26:50
博主稱車載螺紋接口是華為口,已申請專利,小米被迫使用,未來政策收緊,還要交專利費(fèi)!網(wǎng)友:節(jié)奏帶得飛起

博主稱車載螺紋接口是華為口,已申請專利,小米被迫使用,未來政策收緊,還要交專利費(fèi)!網(wǎng)友:節(jié)奏帶得飛起

大白聊IT
2026-06-29 17:52:55
韓紅基金會高管年薪近60萬,韓紅號稱捐資8000萬去向成謎

韓紅基金會高管年薪近60萬,韓紅號稱捐資8000萬去向成謎

八桂知事
2026-06-27 16:28:49
莫蘭特1換2交易評級:開拓者低價撿漏有隱患評B- 灰熊徹底重建評B

莫蘭特1換2交易評級:開拓者低價撿漏有隱患評B- 灰熊徹底重建評B

羅說NBA
2026-06-30 06:31:30
1962年中國打贏就走,結(jié)果給印度留了一道千年難題

1962年中國打贏就走,結(jié)果給印度留了一道千年難題

遠(yuǎn)方風(fēng)林
2026-06-14 00:29:33
一擲千金的“大哥”越來越少!女主播群體從深圳遷到惠州路邊帳篷

一擲千金的“大哥”越來越少!女主播群體從深圳遷到惠州路邊帳篷

火山詩話
2026-06-29 04:37:21
絕經(jīng)后性生活怎么辦?頻率多少合適?

絕經(jīng)后性生活怎么辦?頻率多少合適?

喵咪文化
2026-06-30 06:44:07
中國“撿錢”時代或?qū)砼R:如果手中只有10萬,試試死啃這兩條線

中國“撿錢”時代或?qū)砼R:如果手中只有10萬,試試死啃這兩條線

笑熬漿糊111
2026-06-30 04:00:10
法國隊(duì)主帥德尚在母親去世后回國,諷刺雜志一幅漫畫引發(fā)激烈批評

法國隊(duì)主帥德尚在母親去世后回國,諷刺雜志一幅漫畫引發(fā)激烈批評

夢仙境aa
2026-06-30 09:31:38
上海球迷穿日本隊(duì)球衣慶祝!上海市足協(xié):足球無國界 球迷有祖國

上海球迷穿日本隊(duì)球衣慶祝!上海市足協(xié):足球無國界 球迷有祖國

念洲
2026-06-29 06:50:42
霸權(quán)翻車!伊朗再次重創(chuàng)美軍,特朗普火速認(rèn)慫!

霸權(quán)翻車!伊朗再次重創(chuàng)美軍,特朗普火速認(rèn)慫!

大嘴說天下
2026-06-29 22:30:03
小卡快船生涯即將結(jié)束!!多支球隊(duì)送上頂薪!!

小卡快船生涯即將結(jié)束!!多支球隊(duì)送上頂薪!!

柚子說球
2026-06-30 12:52:46
丘吉爾曾言:如果不是被原子彈炸過,日本這個國家可能就不存在了

丘吉爾曾言:如果不是被原子彈炸過,日本這個國家可能就不存在了

掠影后有感
2026-06-30 09:40:38
日本球迷又開始撿垃圾了,這戲碼上演了快30年了,真的不覺得煩嗎

日本球迷又開始撿垃圾了,這戲碼上演了快30年了,真的不覺得煩嗎

西樓知趣雜談
2026-06-18 17:32:47
今晚開始!央一央八愛奇藝等4部王炸劇來襲!眾星云集,先追哪部

今晚開始!央一央八愛奇藝等4部王炸劇來襲!眾星云集,先追哪部

小椰的奶奶
2026-06-30 01:19:29
陜西砍“孤獨(dú)樹”,讓皖陜兩地管理水平高低立判,網(wǎng)友發(fā)帖引熱議

陜西砍“孤獨(dú)樹”,讓皖陜兩地管理水平高低立判,網(wǎng)友發(fā)帖引熱議

火山詩話
2026-06-30 05:30:50
當(dāng)全世界都忙著吵架時,中國把整整5萬億元,悄悄埋進(jìn)了地底深處

當(dāng)全世界都忙著吵架時,中國把整整5萬億元,悄悄埋進(jìn)了地底深處

科技故事聚焦
2026-06-30 09:54:30
越扒瓜越大!交大女學(xué)生吞獎金再添猛料,不止想進(jìn)體制內(nèi)這么簡單

越扒瓜越大!交大女學(xué)生吞獎金再添猛料,不止想進(jìn)體制內(nèi)這么簡單

觀史搜尋著
2026-05-21 05:41:15
迭戈-弗蘭:C羅原地不動就等著門前搶點(diǎn),他拖累了葡萄牙全隊(duì)

迭戈-弗蘭:C羅原地不動就等著門前搶點(diǎn),他拖累了葡萄牙全隊(duì)

懂球帝
2026-06-29 22:12:06
徐達(dá)晚年喜得貴子,劉伯溫剛抱起嬰兒臉色就變了:此子不除,徐家百年基業(yè)將毀于一旦

徐達(dá)晚年喜得貴子,劉伯溫剛抱起嬰兒臉色就變了:此子不除,徐家百年基業(yè)將毀于一旦

小影的娛樂
2026-06-30 04:20:48
2026-06-30 14:16:49
AI前線 incentive-icons
AI前線
面向AI愛好者、開發(fā)者和科學(xué)家,提供AI領(lǐng)域技術(shù)資訊。
1586文章數(shù) 160關(guān)注度
往期回顧 全部

科技要聞

DeepSeek V4正式版要來 高峰期API價格翻倍

頭條要聞

荷蘭隊(duì)連續(xù)3屆倒在點(diǎn)球大戰(zhàn) 此前9次點(diǎn)球大戰(zhàn)只贏兩場

頭條要聞

荷蘭隊(duì)連續(xù)3屆倒在點(diǎn)球大戰(zhàn) 此前9次點(diǎn)球大戰(zhàn)只贏兩場

體育要聞

德國足球,臉都不要了

娛樂要聞

韓紅稱要退出公益,多位名人挽留

財(cái)經(jīng)要聞

韓國萬億"芯"基建:存儲能否成AI時代油田

汽車要聞

誰懂啊家人們!爹味和班味一點(diǎn)都沒,這臺底盤最硬國產(chǎn)大獵裝太上頭!

態(tài)度原創(chuàng)

親子
本地
藝術(shù)
時尚
公開課

親子要聞

玩具故事-哪位同學(xué)拼對了呀

本地新聞

貴州小城的新目標(biāo):舉辦“村超”世界杯!

藝術(shù)要聞

喬治·莫蘭迪簡潔的靜物畫,色彩看著太舒服了!

“復(fù)古波點(diǎn)”又流行回來了!夏天簡單穿就很時髦

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版