无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

DeepSeek 要用蜜雪冰城的打法,做中國版 Claude Code

0
分享至


DeepSeek 之于大模型,就像蜜雪冰城之于奶茶。你不必糾結(jié)性價(jià)比,因?yàn)樗谋臼履闾舨怀雒。愕腻X包它也從不為難。

最近,DeepSeek 官方宣布,DeepSeek-V4-Pro 模型 API 將永久降價(jià)。同時(shí),DeepSeek 表示,API 已完成輸出提速與服務(wù)擴(kuò)容,速度更快,服務(wù)更穩(wěn)定,默認(rèn)支持 500 并發(fā),企業(yè)用戶可以在線申請(qǐng)更高并發(fā)。

發(fā)布模型,再給出折扣,接著降低緩存命中價(jià)格,最后把臨時(shí)優(yōu)惠變成長期價(jià)格。大模型 API 的價(jià)格基準(zhǔn)正在被重新改寫,而低價(jià)模型背后的下一站,很可能是 Agent。


DeepSeek 永久降價(jià),梁文鋒把 Token 價(jià)格打骨折了

讓我們先來簡單梳理一下 DeepSeek 的降價(jià)時(shí)間線:

  • 4 月 24 日,DeepSeek V4 預(yù)覽版正式發(fā)布。
  • 4 月 25 日,DeepSeek 宣布 V4-Pro 開啟 2.5 折優(yōu)惠。
  • 4 月 26 日,DeepSeek 宣布緩存命中價(jià)格調(diào)整為首發(fā)價(jià)的十分之一。
  • 4 月 28 日,DeepSeek 宣布 V4-Pro 的 2.5 折優(yōu)惠延期至 5 月 31 日。
  • 5 月 22 日,DeepSeek 宣布 V4-Pro 永久降價(jià)為原價(jià)的四分之一。

時(shí)間線的關(guān)鍵之處,在于臨時(shí)折扣變成了永久降價(jià)。調(diào)整之后,DeepSeek-V4-Pro 輸入緩存命中價(jià)格從 0.1 元每百萬 Tokens 降至 0.025 元,輸入緩存未命中價(jià)格從 12 元每百萬 Tokens 降至 3 元;

輸出價(jià)格從 24 元每百萬 Tokens 降至 6 元。疊加默認(rèn) 500 并發(fā)和服務(wù)提速后,官方 API 對(duì)開發(fā)者和企業(yè)的吸引力進(jìn)一步提高。


▲ https://api-docs.deepseek.com/zh-cn/quick\_start/pricing

而價(jià)格下調(diào)最直接的影響,是把任務(wù)成本推到開發(fā)者決策的更前端。

在代碼場景里,一次任務(wù)可能要讀取項(xiàng)目文件、分析日志、多輪修改、反復(fù)運(yùn)行測試,Tokens 消耗很容易放大。

長上下文、代碼庫分析、批量重構(gòu)、自動(dòng)測試、Agent 多輪執(zhí)行這些高消耗場景,開始更接近個(gè)人開發(fā)者和小團(tuán)隊(duì)的預(yù)算范圍。

過去,開發(fā)者選擇 Claude、OpenAI 或 Gemini,主要看模型能力、穩(wěn)定性、生態(tài)和使用習(xí)慣。DeepSeek 打骨折的永久降價(jià),也意味著在絕對(duì)的性價(jià)比面前,開發(fā)者使用習(xí)慣也是可以輕易改變的。


順著這條線,DeepSeek 一貫的市場角色也更清楚了:用低價(jià)、開源和強(qiáng)推理能力,持續(xù)建立大模型市場的價(jià)格優(yōu)勢(shì)。對(duì)國內(nèi)模型廠商來說,V4-Pro 永久降價(jià)相當(dāng)于重新劃了一條 API 定價(jià)線。

智譜、MiniMax、月之暗面這類同樣依賴 API 收費(fèi)、又面向開發(fā)者和企業(yè)客戶的模型,壓力可想而知。反觀 Claude、OpenAI、Gemini 等海外頭部模型,由于市場、客戶結(jié)構(gòu)和生態(tài)位置不同,短期沖擊則相對(duì)有限。

但如果 DeepSeek 后續(xù)推出類似 Claude Code 的編碼工具,再用低 token 成本支撐高頻調(diào)用,價(jià)格敏感的開發(fā)者群體會(huì)更容易被吸引過來。

梁文鋒此前對(duì) DeepSeek 定價(jià)哲學(xué)的解釋,也能放到今天理解。

早在 2024 年 DeepSeek V2 降價(jià)時(shí),梁文鋒就提到,DeepSeek 只是按照自己的節(jié)奏做事,核算成本后定價(jià),原則是不貼錢,也不賺取暴利。他還說,降價(jià)一部分來自下一代模型結(jié)構(gòu)探索帶來的成本下降,另一部分原因是 API 和 AI 都應(yīng)該是普惠的、人人用得起的東西。

比起把 API 當(dāng)成高毛利收費(fèi)入口,DeepSeek 則更像是在用過硬的 Infra 實(shí)力壓低推理成本,再用低價(jià)吸引開發(fā)者、應(yīng)用和下游生態(tài)進(jìn)入自己的軌道。


X 平臺(tái)博主 @bookwormengr 最近在一篇題為《DeepSeek's 10 trillion USD grand strategy(DeepSeek 的十萬億美元棋局)》的長文中,給出了一個(gè)更激進(jìn)的解釋。

他認(rèn)為,DeepSeek 的真正目標(biāo)未必是和智譜、月之暗面、MiniMax 競爭,也不是急著補(bǔ)齊多模態(tài)、語音、視頻這些產(chǎn)品線,而是通過持續(xù)降低訓(xùn)練和推理的資源需求,推動(dòng)一套更便宜、更分散的 AI 硬件生態(tài)成形。

在他看來,DeepSeek 的長期價(jià)值不只在模型本身,而在于讓更多國產(chǎn)存儲(chǔ)、GPU、ASIC、網(wǎng)絡(luò)芯片和異構(gòu)硬件進(jìn)入大模型訓(xùn)練與推理體系。


這個(gè)判斷未必能完全兌現(xiàn),但它解釋了 DeepSeek 一系列選擇背后的方向:

MoE、MLA、DSA、GRPO、RLVR、KV Cache 壓縮、Dual Path、TileLang,表面上看是模型架構(gòu)和推理工程優(yōu)化,往深處看,都是在降低對(duì)高端 HBM、頂級(jí) GPU 和 CUDA 生態(tài)的依賴。

一系列降價(jià)公告里,最值得關(guān)注的不只是輸出價(jià)格下降,還有緩存命中價(jià)格下降。

在大模型推理過程中,KV Cache 是一個(gè)關(guān)鍵成本項(xiàng)。模型處理長上下文時(shí),需要把歷史 tokens 對(duì)應(yīng)的 Key 和 Value 存起來,后續(xù)生成時(shí)反復(fù)使用。上下文越長,需要保存和讀取的緩存越多,對(duì)顯存、帶寬和存儲(chǔ)系統(tǒng)的壓力也越大。


普通聊天里,緩存壓力不一定明顯,但在進(jìn)入代碼、長文檔和 Agent 任務(wù)后,成本結(jié)構(gòu)會(huì)迅速變化。@bookwormengr 在長文里專門算了一筆 KV Cache 賬。

他以 100 萬 tokens 上下文、8 bit KV 精度和 16 bit 索引精度為前提,估算 DeepSeek V4 只需要約 5.48GB HBM,而 GLM5 約為 60GB,Qwen3-235B-A22B 約為 89GB。


長上下文和 Agent 任務(wù)真正貴的地方,不只是模型生成本身,還有緩存、顯存、帶寬和重復(fù)上下文搬運(yùn)。

一個(gè) Code Agent 處理項(xiàng)目時(shí),可能要反復(fù)讀取同一個(gè)代碼庫結(jié)構(gòu)、同一批文件、同一段任務(wù)歷史、同一套系統(tǒng)提示詞和同一批測試日志。若每一輪都按完整上下文重新計(jì)費(fèi),長任務(wù)很快會(huì)變貴。緩存命中價(jià)格下降后,重復(fù)上下文的成本會(huì)明顯變低。

DeepSeek 近年來在 MoE 架構(gòu)、長上下文、KV Cache 壓縮和推理效率上持續(xù)投入的表現(xiàn)有目共睹。降價(jià)是技術(shù)迭代后的必然結(jié)果,也將徹底攪動(dòng) AI 編程市場格局。

為什么必須做中國版「Claude Code」?

最先被牽動(dòng)的,是 AI 編程工具的訂閱模式。

市面主流 AI 編程工具均推出 Coding Plan 月付訂閱,為用戶提供代碼補(bǔ)全、模型調(diào)用、Agent 執(zhí)行等權(quán)益。在輕量化補(bǔ)全時(shí)代,單次調(diào)用消耗極低。

但 AI 編程已從單次補(bǔ)全迭代為全流程 Agent 自動(dòng)化編碼,模型可獨(dú)立完成代碼修改、測試運(yùn)行、報(bào)錯(cuò)修復(fù),單次任務(wù) Token 消耗大幅提升。

當(dāng)?shù)讓?API 又同時(shí)大幅降價(jià),Coding Plan 也必須找到新的支撐點(diǎn)。這個(gè)支撐點(diǎn),更可能落在工程能力上——比如能不能更好地讀懂項(xiàng)目結(jié)構(gòu),能不能精準(zhǔn)選擇上下文,能不能控制 tokens 消耗,能不能穩(wěn)定修改代碼,能不能處理 Git、終端、CI/CD,能不能在企業(yè)環(huán)境里管理權(quán)限和審計(jì)記錄?

同樣要重新定位的,還有 API 中轉(zhuǎn)站。對(duì)個(gè)人開發(fā)者來說,便宜和好用仍然重要。但對(duì)企業(yè)來說,穩(wěn)定、可審計(jì)、可控、可遷移更重要。

沿著這個(gè)邏輯繼續(xù)看,Coding Plan 和中轉(zhuǎn)站的改變只是表層。低價(jià)之后更值得追問的,是開發(fā)者入口究竟掌握在誰手里。


Google CEO Sundar Pichai 最近接受了《Hard Fork》采訪,他首次公開承認(rèn),Google 在文本、多模態(tài)、語音、推理和整體智能上都很有競爭力,但在 agentic coding 這一類能力上,尤其是工具調(diào)用、指令跟隨和長周期任務(wù),目前還有差距。

他還提到,更關(guān)鍵的是把模型放到真實(shí)世界里使用,讓數(shù)據(jù)回流,繼續(xù)迭代。Pichai 特別說到,coding 是一個(gè)需要接觸 data flows(數(shù)據(jù)流)的領(lǐng)域。

終端工具能看到開發(fā)者如何提出任務(wù),如何追問,什么時(shí)候接受建議,什么時(shí)候放棄,什么時(shí)候要求模型繼續(xù)修復(fù)。它還可以通過測試結(jié)果、終端日志、文件變更和 Git 提交,判斷一次 Agent 執(zhí)行是否完成任務(wù)。這類數(shù)據(jù),對(duì) coding model 和 Agent 產(chǎn)品都非常有價(jià)值。

從公開招聘動(dòng)作看,DeepSeek 近期圍繞 Agent 的動(dòng)作也變得密集。

我們也可以看到崗位里出現(xiàn)了 Agent 深度學(xué)習(xí)算法研究員、Agent 數(shù)據(jù)策略工程師、產(chǎn)品經(jīng)理、研發(fā)工程師等角色。更關(guān)鍵的是,DeepSeek 資深研究員陳德里直接發(fā)出招聘信息,提到要從零開始構(gòu)建 Code Harness。


如其所說,Model + Harness = Agent,在 Agent 產(chǎn)品中,模型負(fù)責(zé)理解和生成,Harness 負(fù)責(zé)把模型能力帶入真實(shí)工程環(huán)境,相當(dāng)于模型外面那套「執(zhí)行系統(tǒng)」。

DeepSeek 版 Claude Code 不能只給開發(fā)者一個(gè)對(duì)話框,而要給開發(fā)者一個(gè)能持續(xù)執(zhí)行任務(wù)的工程系統(tǒng)。

崔添翼加入 DeepSeek 后受到關(guān)注,也和 Code Agent 的工程屬性有關(guān)。

公開信息顯示,崔添翼本科畢業(yè)于浙江大學(xué)計(jì)算機(jī)系,曾因信息學(xué)競賽保送浙大,6 次獲得 ACM 亞洲區(qū)域賽金牌,之后在 Jane Street 工作 9 年,并聯(lián)合創(chuàng)立 TSY Capital。


Code Agent 的難點(diǎn)不只是生成代碼,還要在真實(shí)項(xiàng)目里持續(xù)執(zhí)行任務(wù)。量化交易系統(tǒng)長期強(qiáng)調(diào)低延遲、穩(wěn)定性、自動(dòng)化執(zhí)行和風(fēng)險(xiǎn)控制,這些經(jīng)驗(yàn)放到 Agent Harness 上,至少在工程范式上是相通的。

而 Agent 工具的產(chǎn)品能力,不只包括寫代碼,也包括權(quán)限、審計(jì)、數(shù)據(jù)隔離和安全策略。

這反過來給 DeepSeek 這樣的國產(chǎn)模型提供了機(jī)會(huì)。如果 DeepSeek 能把低成本模型、Code Harness、本地部署、企業(yè)級(jí)權(quán)限控制結(jié)合起來,它在政企、金融、制造、能源等對(duì)數(shù)據(jù)敏感的行業(yè)里,會(huì)有更強(qiáng)的替代價(jià)值。

DeepSeek 做中國版 Claude Code 的邏輯也正在于此:低價(jià) tokens 把更多開發(fā)者吸引進(jìn)來。低緩存價(jià)格讓 Agent 任務(wù)運(yùn)行成本下降。Code Harness 讓模型進(jìn)入開發(fā)環(huán)境。真實(shí)工作流又會(huì)反過來幫助 DeepSeek 改進(jìn)模型和產(chǎn)品。

就像滾下坡的雪球,越滾越大,滾得越快。降價(jià)只是推下山的第一把力,往后它會(huì)自己越滾越沉,誰也攔不住。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
女子和情夫幽會(huì),完事后丈夫發(fā)現(xiàn)有液體,女子找情夫提要求被殺

女子和情夫幽會(huì),完事后丈夫發(fā)現(xiàn)有液體,女子找情夫提要求被殺

丫頭舫
2026-05-28 11:50:39
出事了,特朗普終于發(fā)現(xiàn)最大敵人不是伊朗,不是俄羅斯,而是他們

出事了,特朗普終于發(fā)現(xiàn)最大敵人不是伊朗,不是俄羅斯,而是他們

近史談
2026-05-29 23:33:16
瑞舒伐他汀立大功!研究發(fā)現(xiàn):老人吃瑞舒伐,可改善4大血管問題

瑞舒伐他汀立大功!研究發(fā)現(xiàn):老人吃瑞舒伐,可改善4大血管問題

垚垚分享健康
2026-05-28 08:52:25
86年奶奶去世,上山時(shí)棺材越來越重,一乞丐攔路:她還有話要說

86年奶奶去世,上山時(shí)棺材越來越重,一乞丐攔路:她還有話要說

小月故事
2026-05-27 18:26:14
潘宥誠直播曝料虞書欣大學(xué)就開始整容,舊照被扒出對(duì)比變化

潘宥誠直播曝料虞書欣大學(xué)就開始整容,舊照被扒出對(duì)比變化

觀魚聽雨
2026-05-29 23:34:31
30位情婦、60輛豪車,有錢人的生活能有多奢淫?比賭王過得還瀟灑

30位情婦、60輛豪車,有錢人的生活能有多奢淫?比賭王過得還瀟灑

歷史偉人錄
2026-05-24 20:05:31
與張嘉益吻戲最多的女演員37歲未婚,靠《主角》走紅

與張嘉益吻戲最多的女演員37歲未婚,靠《主角》走紅

暖心萌阿菇?jīng)?/span>
2026-05-30 00:28:58
追覓拿下C羅和劉亦菲兩大頂流代言!俞浩:雖然他們最貴 但想成為第一就和第一名同行

追覓拿下C羅和劉亦菲兩大頂流代言!俞浩:雖然他們最貴 但想成為第一就和第一名同行

快科技
2026-05-30 17:40:22
“收到”和“好的”,兩字之差,天壤之別:社交里的情商潛規(guī)則

“收到”和“好的”,兩字之差,天壤之別:社交里的情商潛規(guī)則

心理觀察局
2026-05-12 09:17:11
遺憾 張雪與數(shù)萬名球迷一同觀戰(zhàn)德比斯:未能見證第6冠 尾速上不去

遺憾 張雪與數(shù)萬名球迷一同觀戰(zhàn)德比斯:未能見證第6冠 尾速上不去

風(fēng)過鄉(xiāng)
2026-05-30 19:32:22
穆里尼奧第一把火!清洗皇馬頭號(hào)巨星 姆巴佩或轉(zhuǎn)投英超豪門

穆里尼奧第一把火!清洗皇馬頭號(hào)巨星 姆巴佩或轉(zhuǎn)投英超豪門

瀾歸序
2026-05-30 04:54:14
諾基亞剛上架的199元新機(jī),可能是來搗亂的

諾基亞剛上架的199元新機(jī),可能是來搗亂的

劉奔跑
2026-05-29 23:57:55
比伊勞拉更強(qiáng)!利物浦鎖定世界級(jí)少帥 他能復(fù)刻克洛普王朝

比伊勞拉更強(qiáng)!利物浦鎖定世界級(jí)少帥 他能復(fù)刻克洛普王朝

奶蓋熊本熊
2026-05-31 00:59:15
A股:重磅傳來,中央四部門聯(lián)合發(fā)布!下周將要迎來更大的轉(zhuǎn)變

A股:重磅傳來,中央四部門聯(lián)合發(fā)布!下周將要迎來更大的轉(zhuǎn)變

虎哥閑聊
2026-05-30 10:48:41
2026年結(jié)束前,除了房子貶值外,我國還將迎來這5大“貶值潮”!

2026年結(jié)束前,除了房子貶值外,我國還將迎來這5大“貶值潮”!

職場資深秘書
2026-05-11 19:05:34
休漁期“第一鮮”,在青島大批上岸:有人4小時(shí),收獲四五十斤!肥美鮮甜,今年價(jià)格低了

休漁期“第一鮮”,在青島大批上岸:有人4小時(shí),收獲四五十斤!肥美鮮甜,今年價(jià)格低了

環(huán)球網(wǎng)資訊
2026-05-30 08:25:12
香港老戲骨“千面如來”劉洵去世

香港老戲骨“千面如來”劉洵去世

年代回憶
2026-05-30 10:20:07
2026法網(wǎng)第八日:王曦雨17點(diǎn)亮相蘇珊·朗格倫球場,沖刺女單八強(qiáng)

2026法網(wǎng)第八日:王曦雨17點(diǎn)亮相蘇珊·朗格倫球場,沖刺女單八強(qiáng)

全網(wǎng)球APP
2026-05-30 21:28:12
廣州或?qū)⒊霈F(xiàn)新主城?未必天河、越秀,這個(gè)片區(qū)真正潛力爆發(fā)的黑馬

廣州或?qū)⒊霈F(xiàn)新主城?未必天河、越秀,這個(gè)片區(qū)真正潛力爆發(fā)的黑馬

阿萊美食匯
2026-05-30 12:19:06
日媒:日本赴華旅游暴跌九成,日網(wǎng)友卻稱“我要去中國,別攔我”

日媒:日本赴華旅游暴跌九成,日網(wǎng)友卻稱“我要去中國,別攔我”

小皷拍客在北漂
2026-05-30 17:26:52
2026-05-31 01:43:04
愛范兒 incentive-icons
愛范兒
消費(fèi)科技第一媒體
38918文章數(shù) 2601792關(guān)注度
往期回顧 全部

科技要聞

車圈大佬發(fā)聲:價(jià)格戰(zhàn)遠(yuǎn)去,但競爭仍殘酷

頭條要聞

兩名9歲女孩被困電梯近2小時(shí) 求救幾十次物業(yè)無動(dòng)于衷

頭條要聞

兩名9歲女孩被困電梯近2小時(shí) 求救幾十次物業(yè)無動(dòng)于衷

體育要聞

歲月不饒人!39歲德約鏖戰(zhàn)近5小時(shí)拼到嘔吐

娛樂要聞

張碧晨《歌手》 “活人微死” 自嘲

財(cái)經(jīng)要聞

雙匯管不住一頭豬

汽車要聞

900V+3.2秒破百 領(lǐng)克10+&領(lǐng)克10上市16.99萬元起

態(tài)度原創(chuàng)

健康
本地
藝術(shù)
親子
公開課

嘗試干細(xì)胞療法如何避免踩坑?

本地新聞

用剪紙的方式,打開江蘇揚(yáng)州

藝術(shù)要聞

非洲超級(jí)地標(biāo)!全球最大足球場,持續(xù)推進(jìn)!

親子要聞

我在軍博唱歌歌

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版