網易首頁 > 網易號 > 正文 申請入駐

Deepseek V4對存儲、光模塊需求的打擊尚待顯現

0
分享至

對國產算卡對高端存儲對光模塊

五一期間,密集在Agent模式下,體驗Deepseek V4,尤其是便宜的Deepseek V4 Flash。

一邊用,一邊算價格,一邊感嘆:Deepseek V4的緩存讀取價格,真是便宜到離譜

經常調用大模型API的應該知道,大模型的定價,在百萬token下,有三個核心定價:未命中緩存讀入、命中緩存讀入和輸出。

在Agent時代,由于大模型要頻繁調用工具,需要頻繁將之前的上下文重新發給大模型,所以命中緩存讀入的價格,對整體費用的影響極大——前段時間Cluade Code被大家吐槽的一點就是,悄悄在上下文“加料”,讓許多用第三方模型搭配Cluade Code的玩家,遭遇緩存未命中,成本驟增的問題。

正因此,模型廠商如何定價命中緩存的價格折扣,對長期使用成本,影響不小。

下圖是我整理的幾個國產廠商模型的讀入價格對比,均為百萬token的人民幣報價。你會發現國產“御三家”,也就是Kimi、GLM和Minimax都是20%上下,小米Mimo也是,Qwen便宜不少,是10%。但這些折扣,和Deepseek V4放到一起,就黯然失色。Deepseek V4 Flash是2%,而Deepseek V4 Pro竟然只有0.8%,只要是命中緩存,價格便宜到離譜!!



今次Deepseek V4的發布,許多人覺得模型中庸,沒有驚喜。

驚喜,或許就藏在緩存價格中。

Deepseek的緩存價格,不是從來那么便宜的。

特地查了一下去年V3.2發布時,緩存的價格是未命中緩存的10%,算便宜,但沒那么離譜。



顯然,Deepseek V4的技術上,有足夠的突破,把緩存讀入的成本打下來。

Reddit上有一篇帖子,對Deepseek幾代模型的KV Cache做了一個分析,這或許是Deepseek V4緩存讀入價格折扣巨大的原因——成本的確下降。



我只是大模型的普通用戶,專業這塊是不懂的,所以也只能看看Gemini Deepresearch的綜述,它是如此概括:

  • 在DeepSeek V4的架構下,處理被緩存的百萬Token前綴,其在GPU算力核心上產生的實際浮點運算(FLOPs)趨近于零。供應商所需支出的成本,實際上僅剩下微小的PCIe傳輸能耗與硬盤折舊費。相較于傳統GQA架構即使緩存也必須吃滿HBM帶寬的窘境,DeepSeek將I/O依賴轉化為異步輕量操作。因此,向開發者收取$0.003625(僅為未命中成本的約0.83%)或Flash版本的$0.0028(2%),是在精準覆蓋這層極薄的硬件傳輸成本后,依然具備商業毛利的必然結果。

那么這個技術優勢如果未來被更多模型尤其是國產模型接納,對整個硬件架構會有什么影響?

作為門外漢,依然是請Gemini 3.1 Pro的搜索和分析,僅供參考。

國產芯片最大的痛點是顯存帶寬(HBM)和片間互聯(類似 NVLink)不夠強。V4 的 MLA 架構大幅壓縮了 KV Cache 體積,在 attention 環節對 HBM 帶寬的需求顯著降低,這在一定程度上緩解了國產芯片的帶寬劣勢——雖然 FFN 和 MoE expert 調度等其他環節的帶寬需求仍然存在。

據報道,DeepSeek V4 原生適配了華為 CANN 架構,在昇騰上的利用率從以往的 60% 左右提升到了 85% 以上。如果數據屬實,這意味著在特定推理場景下,國產芯片與英偉達 A100/H100 的實際效能差距正在縮小。

HBM(高帶寬顯存)一直是 AI 芯片(如 NVIDIA H100/B200)最昂貴的組件。DeepSeek V4 大幅削減了 KV Cache 的體積,如果這一技術路線被廣泛采用,對 HBM 容量和帶寬的需求增速可能放緩。韓國(SK 海力士、三星)目前是 HBM 的絕對統治者。

換個角度看,KV Cache 從 HBM 向更低成本的存儲層級遷移,或許會利好“大容量、通用型”的存儲方案(SSD 和 DDR5 內存),國產存儲廠商有機會從中受益。當然,HBM 的需求不只取決于 KV Cache,訓練側和其他推理環節仍是 HBM 的大戶。

DeepSeek V4 降低了單次推理對極致瞬時帶寬的依賴,如果現有的 400G/800G 網絡環境已能滿足推理需求,那么向 1.6T 或 3.2T 超高速模塊升級的緊迫感可能會被削弱。

另一方面,V4 采用的 Engram 架構將部分知識存放在 SSD 和內存中,推理時需要在“計算節點(GPU)”和“存儲節點(SSD 陣列)”之間交換數據。這種計算與存儲分離的架構(Disaggregated Architecture),反而可能創造新的機柜間光纖連接需求。

整體趨勢或許是從追求“極速”轉向更看重“極穩”與“高密度”。

是的,這些分析大多來自Gemini的搜索綜述,我作為門外漢只能做粗線條的轉述和判斷,細節上一定有不夠精確的地方。

但有一點我比較確定:當大家還在討論Deepseek V4的跑分夠不夠驚艷時,它在架構層面對成本結構的重塑,或許才是更值得關注的變量。0.8%的緩存折扣不是營銷噱頭,背后是KV Cache體積實打實的壓縮。這個變化如果沿著產業鏈往下傳導——從HBM到存儲,從光模塊到算卡——影響不會小,只是需要時間顯現。

標題里用了“尚待”兩個字。坦率講,多久能顯現,我不知道,我不懂。但價格信號往往是最誠實的,當緩存讀入便宜到只剩零頭的時候,硬件端的賬遲早要重新算一遍。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
北京網友已無法下單無人機,超小型都不行,黑飛被抓可被拘留

北京網友已無法下單無人機,超小型都不行,黑飛被抓可被拘留

映射生活的身影
2026-05-03 17:27:17
美國被踢出局,英國牽頭,10國確定派兵,聯合遠征軍已鎖定俄羅斯

美國被踢出局,英國牽頭,10國確定派兵,聯合遠征軍已鎖定俄羅斯

影孖看世界
2026-05-03 19:42:36
太離譜!華西醫院五一放假引爭議,被罵想休息別當醫生,網友吵翻

太離譜!華西醫院五一放假引爭議,被罵想休息別當醫生,網友吵翻

譚談社會
2026-05-02 14:27:21
山東公務員夫妻裸辭,花光40萬不上班,女兒12年不上學:如今他們怎么樣了?

山東公務員夫妻裸辭,花光40萬不上班,女兒12年不上學:如今他們怎么樣了?

黎兜兜
2026-05-04 12:11:43
又少了一個大師!

又少了一個大師!

鈞言堂
2026-05-03 19:14:55
10-7!凌晨5點,斯諾克捷報:中國小將吳宜澤殺瘋,沖冠時間如下

10-7!凌晨5點,斯諾克捷報:中國小將吳宜澤殺瘋,沖冠時間如下

大秦壁虎白話體育
2026-05-04 05:29:03
“超級牛散”,持倉曝光!

“超級牛散”,持倉曝光!

新浪財經
2026-05-04 11:06:16
念念不忘的正規軍,腰臀比絕了!

念念不忘的正規軍,腰臀比絕了!

貴圈真亂
2026-05-04 11:39:21
62年毛主席約談陳云,22天后陳云向中央請假:今后不參加任何會議

62年毛主席約談陳云,22天后陳云向中央請假:今后不參加任何會議

歷史龍元閣
2026-05-04 08:50:12
霍爾木茲海峽,美伊誰說了算

霍爾木茲海峽,美伊誰說了算

大象新聞
2026-05-04 11:54:10
張雪機車奪冠后突遇故障憾然退賽,師父牙哥平靜回應

張雪機車奪冠后突遇故障憾然退賽,師父牙哥平靜回應

大象新聞
2026-05-04 16:14:09
騎士搶七擊敗猛龍!證明湖人若想贏雷霆,詹姆斯必須激活1人

騎士搶七擊敗猛龍!證明湖人若想贏雷霆,詹姆斯必須激活1人

小路看球
2026-05-04 16:21:47
黑尾醬,徹底消失了?

黑尾醬,徹底消失了?

生如稗草
2026-03-15 08:48:11
燒烤簽喂狗擼串后續:更多惡心事被扒,已道歉認慫,店主含淚停業

燒烤簽喂狗擼串后續:更多惡心事被扒,已道歉認慫,店主含淚停業

天天熱點見聞
2026-05-04 12:02:49
東方甄選主播明明首播慘淡:在線4萬卻零銷售,究竟發生了什么?

東方甄選主播明明首播慘淡:在線4萬卻零銷售,究竟發生了什么?

草莓解說體育
2026-05-04 02:17:22
“典型的惡婆婆面相”,3年級男孩還要喂飯,母親的面相暴露問題

“典型的惡婆婆面相”,3年級男孩還要喂飯,母親的面相暴露問題

妍妍教育日記
2026-05-04 15:49:36
宣布護航之際突發意外!油輪在阿聯酋外海遭不明物體擊中,美軍約1.5萬人緊急部署

宣布護航之際突發意外!油輪在阿聯酋外海遭不明物體擊中,美軍約1.5萬人緊急部署

荷蘭豆愛健康
2026-05-04 17:44:01
我國距離最近的兩個縣,縣中心相距只有300米,卻分屬兩個省

我國距離最近的兩個縣,縣中心相距只有300米,卻分屬兩個省

長風文史
2026-05-04 15:43:39
老師多次提醒:軍校是沒有回頭路的,如果因為軍隊待遇好而報考,建議別報!

老師多次提醒:軍校是沒有回頭路的,如果因為軍隊待遇好而報考,建議別報!

譚老師地理大課堂
2026-04-24 00:05:13
爆料:伊朗暗示妥協

爆料:伊朗暗示妥協

魯中晨報
2026-05-02 19:43:45
2026-05-04 19:00:49
EarlETF只投基不炒股 incentive-icons
EarlETF只投基不炒股
只投基不炒股,賺錢更容易一些
924文章數 3073關注度
往期回顧 全部

科技要聞

OpenAI“復活”了QQ寵物,網友直接玩瘋

頭條要聞

伊朗:美軍艦試圖進入霍爾木茲海峽 伊朗發射兩枚導彈

頭條要聞

伊朗:美軍艦試圖進入霍爾木茲海峽 伊朗發射兩枚導彈

體育要聞

騎士破猛龍:加雷特·阿倫的活力

娛樂要聞

張敬軒還是站上了英皇25周年舞臺

財經要聞

魔幻的韓國股市,父母給嬰兒開戶買股票

汽車要聞

同比大漲190% 方程豹4月銷量29138臺

態度原創

本地
手機
游戲
親子
藝術

本地新聞

用青花瓷的方式,打開西溪濕地

手機要聞

iOS 27亮點全解析:獨立Siri、衛星通信四連發、蘋果智能新能力!

任天堂NS2銷量成功險勝PS5!4月全球首周銷量榜出爐

親子要聞

4歲女兒說她錢都花沒了,奶奶立馬拿出錢給她,隔輩就是親啊

藝術要聞

《三國志》手抄墨稿出土!這才是最純正的晉人書法,比王羲之的字還要風靡

無障礙瀏覽 進入關懷版