網易首頁 > 網易號 > 正文 申請入駐

DeepSeek用V4重畫了坐標系

0
分享至

文 | 云涌AI ,作者 | 黃云皓

2026年4月23日,OpenAI在API價格頁上線GPT-5.5:輸入價(input)$5.00,輸出價(output)$30.00,緩存命中價(cached input)$0.50。比上一代GPT-5.4的$2.50/$15/$0.25整整翻一倍,三檔同時抬高。再往前推八個月,2025年8月,GPT-5的輸入價還是$1.25;到這一天漲到$5.00,已經是當時的4倍。

4月26日,DeepSeek在V4系列價格頁底部加了一行腳注:所有模型的緩存命中價,永久降至原價的1/10。V4-Pro這一檔,緩存命中價從$0.145掉到$0.0145。

把兩份價格表放到一起,緩存命中這一項:GPT-5.5是$0.50,V4-Pro是$0.0145,差34.5倍;如果再算上V4-Pro的“75% off”臨時促銷,兩者相差138倍。

同一周里、兩份價格表朝相反方向各走出兩個數量級,一句“價格戰”已經很難描述這種差距了。

這一周,模型廠商已經不在同一坐標系

01.價格調整:腳注里寫“永久”

DeepSeek這次調價同時有兩個動作。

第一個是臨時促銷:V4-Pro掛著“75% off”,輸入$1.74、輸出$3.48、緩存命中$0.0145三檔同步打折,折后落到$0.435、$0.87、$0.003625,5月31日后將恢復原價。

第二個寫在腳注里:所有模型的緩存命中價永久降至原價的1/10。

真實的生產場景里,輸入的提示詞(prompt)往往包括每次重復的系統指令、角色設定、文檔、工具定義,也包括這次新來的用戶問題。在長期任務或重復工作中,前者通常占八九成,服務端只算一次、下次直接復用。這就是“緩存命中”,按低一檔的“緩存命中價”計費。

DeepSeek把這一檔永久砍到原價的1/10——賬單里最大的一塊,從此變成零頭。七五折5月31日就到期,而緩存命中這一刀,不撤銷。

DeepSeek敢這么砍,是因為V4在架構上把單token成本進一步壓下來了。1M長上下文同口徑下,V4-Pro處理同樣任務消耗的算力(FLOPs)只有V3.2的27%,KV Cache(推理時保存上下文的顯存)占用只有10%;V4-Flash再低一檔,算力10%、KV Cache 7%。

所以$0.0145不是促銷價,是架構壓出來的。

DeepSeek最后給出的價格是:

  • V4-Flash:$0.14/$0.28/$0.0028(輸入/輸出/緩存命中)。同檔OpenAI GPT-5.4 mini是$0.75/$4.50/$0.075,Anthropic Haiku 4.5是$1/$5/$0.10。
  • V4-Pro:$1.74/$3.48/$0.0145。同檔OpenAI GPT-5.5是$5/$30/$0.50,Anthropic Opus 4.7是$5/$25/$0.50。


DeepSeek V4系列價格和腳注,來源:DeepSeek官方文檔

要解釋的不再是DeepSeek。這一周之后,其他模型廠要么跟著把小數點向左挪,要么留在原位,解釋這30倍差價從哪里來。

02.遷移成本:改兩個字符串

價格表已經把差距擺出來了。下一步的問題不是“便不便宜”,而是“能不能換過去”。如果接入方式不兼容,開發者要改客戶端、重寫工具調用、重跑一批老任務,再低的單價也會先卡在工程成本里。

DeepSeek這次把這道門壓低了。它同時掛出兩個API入口地址(base URL):https://api.deepseek.com 兼容OpenAI Chat Completions,https://api.deepseek.com/anthropic 兼容Anthropic Messages。V4-Pro和V4-Flash兩個模型,在兩個入口下都能跑。

對原本接OpenAI Chat Completions或Anthropic Messages的人來說,遷移到DeepSeek現在變成了三步:改base_url,換API key,把模型名替成deepseek-v4-flash或deepseek-v4-pro。這還不能直接替換生產,但應用的API調用已經可以指向DeepSeek:先小范圍放量,再對同一批任務比較回答質量和成本。

調通API,只是第一步。工具調用(tool calling)的參數、返回格式和失敗路徑要重測,長上下文里會不會漏信息、答偏、變慢,也要重新測試;企業采購還要過合規、內部SLA、私有部署和安全評估。最先能動起來的,還是那些把模型封裝在API后面、隨時可以切供應商的開發者和初創團隊。

03.市場反饋:4個月對7年

V4上線當天,2026年4月24日凌晨,AI編碼助手Cline的創始人Saoud Rizwan在X上發了一條:

deepseek v4 is now the cheapest sota model available at 1/20th the cost of opus 4.7. for perspective, if uber used deepseek instead of claude their 2026 ai budget would have lasted 7 years instead of only 4 months.(DeepSeek v4現已成為市場上價格最低的SOTA模型,其成本僅為Opus 4.7的二十分之一。從另一個角度來看,如果Uber使用DeepSeek而非Claude,那么他們2026年的AI預算本可以維持7年,而非僅僅4個月。)


Saoud Rizwan(Cline創始人)2026年4月24日凌晨在X上的原帖,來源:x.comsdrzn

“4個月”這個數不是修辭。Uber CTO Praveen Neppalli Naga在2026年4月接受The Information采訪時確認:Uber 2026年整年的AI預算,4月就已經燒完,主要燒在Claude Code在內部工程團隊鋪開上。

這條推文的殺傷力不在“7年”是否精確。真正重要的是,它把“企業AI預算被模型調用迅速吃完”這件事,和V4的公開定價擺在同一張賬單上;在開發者社區里,這種對照就是遷移決策的導火索。

同一天,獨立評測者Simon Willison發了V4上手測評,把V4-Flash、V4-Pro與GPT-5.5、Opus 4.7、Gemini 3.1 Pro等十多款前沿模型的定價擺進同一張對照表,結論是:V4-Flash是市面上最便宜的小模型,V4-Pro是最便宜的前沿大模型。

一周之內,第三方模型路由平臺OpenRouter的V4-Pro模型頁畫出了一條上線即起飛的曲線:4月24日上線當天約5B prompt tokens,到4月29日已漲至46.1B prompt、705M reasoning、449M completion(分別對應用戶輸入提示詞、模型推理過程、最終輸出三類token),一周不到翻了近10倍——開發者側的真實路由流量。


OpenRouter的V4-Pro模型流量數據,來源:OpenRouter

四件事在同一周里湊齊:實名站臺(Saoud Rizwan、Simon Willison)、具體的成本對比(4個月對7年)、公開評測、第三方路由流量。

這不是“會遷移”的遠期推論,是遷移開始的早期勢頭。

04.反平臺

價格表只能說明這一刀砍得多狠,不能說明DeepSeek站在哪兒。要看清V4的位置,得把三件事拆開看:架構成本、商業模式、戰略意圖。

架構成本:壓低單token的物理上限

DeepSeek這一刀能下到$0.0145,并不源自定價部門的勇氣,而是基于V4的架構換代。模型每讀一段長文,都要把讀過的內容暫存在顯存里——這塊“草稿紙”叫KV Cache,上下文越長、草稿紙越大、推理越燒錢。V4在注意力層用了一組新的混合壓縮法:CSA(Compressed Sparse Attention)把KV物理壓到1/4,再疊加“只看重點”的邏輯稀疏;HCA(Heavily Compressed Attention)壓得更狠,物理壓到1/128,再用全局注意力補漏。兩類壓縮法在網絡中交替工作。

從V2的MLA、V3.2的DSA一路下來,DeepSeek每一代都在壓同一件事——長上下文里的KV Cache和算力消耗。

到V4這一代,1M長上下文同口徑下,V4-Pro比V3.2少消耗73%的算力(FLOPs只剩27%),KV Cache只占10%;V4-Flash再低一檔,FLOPs 10%、KV Cache 7%。HuggingFace在V4解讀里給了一個直觀比對:V4的KV Cache只有同等條件下“業界標準省內存寫法”(8-head GQA + BF16 KV)的2%——同樣一段長對話,別家要占的顯存,V4只用1/50。


V4 vs V3.2 架構同口徑對照(1M 上下文),來源:DeepSeek V4 技術報告

物理空間往下壓的同時,國產算力的適配在并行推進。V4在華為昇騰950上已跑通實測,智源FlagOS也把V4-Flash適配到了華為昇騰、海光、沐曦、昆侖芯等多款國產芯片。

在V4-Pro官方API頁面以小字備注:V4-Pro受限于高端算力,預計下半年昇騰950超節點(把數十張芯片用高速互聯拼成一臺大機器、專門跑大模型推理)批量上市后,Pro的價格還將大幅下調。這一句把下半年的降價空間,直接掛在國產超節點的產能上。

商業模式:不靠API的毛利養現金流

主流玩家最近的動作是漲價。OpenAI在4月23日把GPT-5.5的價格在GPT-5.4基礎上翻倍,同時在GPT-5.5之上新增一檔GPT-5.5 Pro,定價$30/$180——一邊是同檔漲價,一邊是把價格梯子的頂端再往上抬,只對愿為額外能力付高價的企業客戶開放。Anthropic走的是同一條路徑:換裝的新tokenizer讓同輸入最多多產生35%的token,實際賬單提高;同時在Opus 4.6上新開Fast mode頂端檔$30/$150(6倍于標準價)。

中國頭部廠商沿著同一方向走:阿里旗艦Qwen3.6-Max-Preview于4月20日首次以閉源形式發布;阿里云、百度云3月18日同日上調AI算力價5–34%、存儲漲30%,阿里云4月15日又上調百煉平臺部分MU模型單元服務價;智譜年內三次調價;月之暗面4月20日發布Kimi K2.6,API輸入價從每百萬token 4元提至6.5元,漲價58%。

一連串動作方向一致:單價上漲、通過細分市場把能力賣更高價、重心轉向高毛利企業客戶,提高API毛利撐住利潤。

DeepSeek走的是反方向。母公司幻方2025年收益率56.55%,主營現金流不依靠賣API賺錢。融資這一頭同樣不缺:4月17日路透社首次報道DeepSeek新一輪估值至少100億美元,4月22日彭博、The Information報道騰訊、阿里加入談判,把估值推至200億美元以上——6天里估值翻倍;彭博同時透露,騰訊在談判桌上提出收購DeepSeek 20%股權,被DeepSeek回絕。云大廠主動加碼搶入,DeepSeek卻在挑錢的“形狀”。

現金流不靠API、估值不靠API、控制權也不輕易讓出,永久把緩存命中價格砍到1/10并不是打價格戰,是“不用拼這場仗”

戰略意圖:技術生態拓展

梁文鋒在2024年7月接受專訪時講過幾句話:

我們不會閉源。我們認為先有一個強大的技術生態更重要。
開源更像一個文化行為,而非商業行為。
我們經常說中國AI和美國有一兩年差距,但真實的gap是原創和模仿之差。
這一波浪潮里,我們的出發點就不是趁機賺一筆,而是走到技術的前沿去推動整個生態發展。

這不是一時表態。DeepSeek創業時的第一篇技術報告標題就是《DeepSeek LLM: Scaling Open-Source Language Models with Longtermism》——長期主義和開源,是寫在第一篇文章封面上的。


長期主義和開源寫在論文標題里,來源:DeepSeek LLM: Scaling Open-Source Language Models with Longtermism

這個意圖落到V4上,是同時在做三件事。

  • 全檔MIT開源。 V4-Pro(1.6T總參數/49B激活)、V4-Flash(284B/13B激活)兩檔全部以MIT放出,不保留。在阿里、字節、百度旗艦相繼轉閉源的當口,這本身是一種方向選擇。
  • 落地形態開放。 DeepSeek自己運營雙base URL的API入口,同時把V4送上阿里云百煉、火山方舟、華為云、騰訊云、英偉達云的主流第三方云;以MIT開源支持全檔私有化部署(含1.6T旗艦);并作為基座供二次開發。API、第三方云、私有化、二次開發——四種落地入口平級展開,沒有哪一種被定位為“主戰場”,統統開放。
  • 主動適配多元芯片架構。 V4早期訪問階段先給到華為昇騰、寒武紀;4月24日上線當天,華為云首發適配V4-Flash并同步上線10+昇騰融合算子(針對昇騰芯片定制的核心計算模塊),智源FlagOS再把V4-Flash適配到海光、沐曦、摩爾線程、昆侖芯等8+款國產芯片。不偏廢NVIDIA——同日NVIDIA官方Developer Blog發文宣布Blackwell上day-0可用。

模型、入口、硬件,全部從DeepSeek手里放出去。MIT開源讓模型觸手可及;開放的落地形態讓DeepSeek無孔不入;多元芯片適配讓V4通行無阻。三層疊起來,V4進入一個自己也關不掉的技術生態!耙粋強大的技術生態”,在V4上就是這個形狀。

OpenAI、Anthropic、阿里、字節、百度等主流玩家方向一致:閉源旗艦、自營API,把客戶圈進圍欄,讓生態圍著自家平臺轉。這是平臺路徑,用模型當門票、用API當通道、用遷移成本當護城河,把“平臺”建起來。

DeepSeek反過來,把這三樣全往外放,它不是在搭一個屬于自己的平臺,而是在拆掉所有讓自己變成平臺的東西。

這種定位,可稱之為——反平臺。

反平臺是名詞,不是動詞。從這一周起模型廠商走向分化,開篇那句“不在同一坐標系”,到這里才有了具體所指!皟r格”只是表面那一瞥,把兩邊真正分開的,是平臺與反平臺的分化。

尾聲

這不是一場“價格戰”,是一次分化。同一周里,價格、協議、模型廠的位置都朝兩邊走:一邊是平臺,一邊是反平臺。

地圖在重畫,不只是價格在動。

作者 | 黃云皓

出品 | 云涌AI

云涌創新 | 在復雜中,看見涌現

寫完了,但涌現還在繼續。歡迎補一個你的視角▼

參考資料:

  1. DeepSeek 官網|DeepSeek
  2. DeepSeek-V4 Technical Report|DeepSeek
  3. DeepSeek-V4: Better, Faster, Cheaper at Long Context|HuggingFace
  4. OpenAI 官網|OpenAI
  5. Anthropic 官網|Anthropic
  6. “deepseek v4 is now the cheapest sota model …”|Saoud Rizwan,X
  7. Uber CTO Shows How Claude Code Can Blow Up AI Budgets|The Information
  8. DeepSeek V4—almost on the frontier, a fraction of the price|Simon Willison
  9. OpenRouter 官網|OpenRouter
  10. 阿里 Qwen 官網|阿里 Qwen
  11. 阿里云官網|阿里云
  12. 百度智能云官網|百度智能云
  13. 月之暗面官網|月之暗面
  14. 智譜 AI 官網|智譜AI
  15. China’s DeepSeek is raising funds at $10 billion valuation, The Information reports|路透社
  16. Tencent, Alibaba in Talks to Join DeepSeek’s First Funding Round|彭博/The Information
  17. 智源 FlagOS 官網|智源研究院
  18. 華為云官網|華為云
  19. Build with DeepSeek V4 Using NVIDIA Blackwell and GPU-Accelerated Endpoints|NVIDIA Technical Blog
  20. DeepSeek LLM: Scaling Open-Source Language Models with Longtermism|arXiv
  21. 揭秘DeepSeek:一個更極致的中國技術理想主義故事|暗涌 Waves

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
梅根終于發聲:講述自己喜愛澳洲人民,穿搭系來自澳洲設計師

梅根終于發聲:講述自己喜愛澳洲人民,穿搭系來自澳洲設計師

談點世
2026-05-01 10:15:41
比緬北更恐怖!曾經的旅游勝地,如今黃賭毒俱全,性交易隨處可見

比緬北更恐怖!曾經的旅游勝地,如今黃賭毒俱全,性交易隨處可見

來科點譜
2026-02-18 07:17:42
市長觀戰并清唱馬競隊歌,記者:這畫面太絕了,會載入史冊

市長觀戰并清唱馬競隊歌,記者:這畫面太絕了,會載入史冊

懂球帝
2026-05-01 11:27:36
黑尾醬,徹底消失了?

黑尾醬,徹底消失了?

生如稗草
2026-03-15 08:48:11
物業費收不齊,虧損止不。阂荒瓿200個物業撤場,困局何解?

物業費收不齊,虧損止不。阂荒瓿200個物業撤場,困局何解?

新京報
2026-04-30 09:46:07
章若楠空杯到底有多美?網友說:這顏值誰頂得住,難怪都想娶!

章若楠空杯到底有多美?網友說:這顏值誰頂得住,難怪都想娶!

暖心萌阿菇涼
2026-04-30 13:13:01
怒罵隊友后王鈺棟道歉:想贏球有些著急,球場上出現不成熟行為

怒罵隊友后王鈺棟道歉:想贏球有些著急,球場上出現不成熟行為

奧拜爾
2026-04-30 18:44:36
馬斯克等了八年的卡車,終于量產了

馬斯克等了八年的卡車,終于量產了

我是一個養蝦人
2026-04-30 06:25:18
親日辱華、知三當三?這一次,57歲的陳紅被兒子丈夫“害”慘了

親日辱華、知三當三?這一次,57歲的陳紅被兒子丈夫“害”慘了

凡知
2026-04-08 14:09:55
35歲女子去做私處緊縮,縫針斷在肉里,醫生徒手掏了半小時沒找著

35歲女子去做私處緊縮,縫針斷在肉里,醫生徒手掏了半小時沒找著

離離言幾許
2026-04-21 19:53:18
143頁!人大知名教授被舉報:名人之后、9個愛人,聊天內容流出

143頁!人大知名教授被舉報:名人之后、9個愛人,聊天內容流出

溫柔看世界
2026-04-30 11:32:33
1950年,志愿軍師長進隧道休息,突感異常,對面山坡竟有大片帳篷

1950年,志愿軍師長進隧道休息,突感異常,對面山坡竟有大片帳篷

浩渺青史
2026-04-19 15:54:31
三星One UI8.5國行更新名單正式發布:5月向國內用戶迎來系統更新

三星One UI8.5國行更新名單正式發布:5月向國內用戶迎來系統更新

小柱解說游戲
2026-05-01 06:26:31
爆料:“中國版 FSD”或只有 3 種駕駛模式,<自動倒車功能>大概也沒!

爆料:“中國版 FSD”或只有 3 種駕駛模式,<自動倒車功能>大概也沒!

新浪財經
2026-04-30 16:06:42
《高山下的花環》導演那些很隱晦的暗示,你真的看懂了嗎?

《高山下的花環》導演那些很隱晦的暗示,你真的看懂了嗎?

看電影的禮
2026-05-01 06:09:13
亨德利對趙心童未來做出預測:如果他拿不到4個世錦賽冠軍我會很意外

亨德利對趙心童未來做出預測:如果他拿不到4個世錦賽冠軍我會很意外

硯底沉香
2026-04-30 19:13:52
發現一個奇怪現象:喜歡吼老公,訓孩子的女人,其實很值得尊重

發現一個奇怪現象:喜歡吼老公,訓孩子的女人,其實很值得尊重

枕邊聊育兒
2026-03-30 09:54:59
中國股市里永遠賺錢的一種人:從巨虧到巨賺,始終牢記這一招!

中國股市里永遠賺錢的一種人:從巨虧到巨賺,始終牢記這一招!

一方聊市
2026-04-29 13:15:54
9元油價才醒悟:油車買的不是省錢,是踏實和自由

9元油價才醒悟:油車買的不是省錢,是踏實和自由

娛樂圈的筆娛君
2026-05-01 10:49:32
交警再次提醒!電子眼鎖定7種違規行為,司機看完再也不被罰

交警再次提醒!電子眼鎖定7種違規行為,司機看完再也不被罰

老特有話說
2026-04-30 13:24:18
2026-05-01 12:04:49
鈦媒體APP incentive-icons
鈦媒體APP
獨立財經科技媒體
133071文章數 862127關注度
往期回顧 全部

科技要聞

蘋果上季在華收入繼續大增 iPhone收入新高

頭條要聞

遼寧艦遭日本偵察機偵察 解放軍一句警告讓其放棄企圖

頭條要聞

遼寧艦遭日本偵察機偵察 解放軍一句警告讓其放棄企圖

體育要聞

季后賽場均5.4分,他憑啥在騎士打首發?

娛樂要聞

鄧超在景德鎮被偶遇,穿黑外套逛茶園

財經要聞

GPU神話松動,AI真正的戰場變了

汽車要聞

專訪捷途汪如生:捷途雙線作戰 全球化全面落地

態度原創

時尚
教育
健康
本地
公開課

今年夏天的裙子,長長長長一點更好看!

教育要聞

今天上午9點,環球中心!成都150所中學集結,等你來咨詢

干細胞治燒燙傷面臨這些“瓶頸”

本地新聞

用青花瓷的方式,打開西溪濕地

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版