網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

DeepSeek永久降價，其實(shí)是瞄準(zhǔn)了10萬億美元？

2026-05-26 02:44:23　來源: 虎嗅APP

北京舉報

分享至

本文來自微信公眾號：字母AI，作者：苗正，頭圖來自：AI生成

業(yè)內(nèi)一直有這么一個共識，DeepSeek影響力雖然很大，但DeepSeek就是不賺錢。

說到底，無非就是DeepSeek沒有訂閱、沒有額外收費(fèi)項目，只有API收費(fèi)，可API價格太便宜了，而且動不動就打折降價。

就比如5月22日晚上，DeepSeek宣布最新旗艦?zāi)Ｐ陀谰媒祪r75%，從6月1日開始生效。

但你有想過這一切背后的邏輯是什么嗎？

亞馬遜AWS新加坡區(qū)域生成式AI技術(shù)負(fù)責(zé)人吉里什·迪利普·帕蒂爾（Girish Dilip Patil）在周末寫了這么一篇文章，標(biāo)題是《DeepSeek的10萬億美元大戰(zhàn)略》，從業(yè)內(nèi)視角，對DeepSeek的底層邏輯進(jìn)行了剖析。

文章給出了一個極其反常識的判斷，他說DeepSeek正在以低價為主要敘事手段，進(jìn)而在整個AI產(chǎn)業(yè)鏈引起一場海嘯，徹底瓦解AI硬件現(xiàn)有的產(chǎn)業(yè)結(jié)構(gòu)，英偉達(dá)、SK 海力士、三星、美光等公司將會喪失如今的領(lǐng)先地位，而且部分市場，也會讓中國公司取代。

這10萬億美元代表的，就是整個基于DeepSeek而牽動的市場機(jī)會。

文章一經(jīng)發(fā)出迅速爆火，它還不止是只在中文圈火，它是直接火遍了整個X上的AI圈。

X上有一個非常有影響力的AI內(nèi)容博主叫做羅漢·保羅（Rohan Paul），他就轉(zhuǎn)載了這篇文章，并對文章表示了高度的認(rèn)可。

國內(nèi)可能對羅漢這個名字比較陌生，但是他有一個粉絲你肯定認(rèn)識，那就是皮查伊，谷歌現(xiàn)任CEO。

說回文章作者，吉里什不是那種只懂?dāng)?shù)學(xué)或者代碼的人，由于工作的原因，他每天都要接觸AI全棧，因此他是既懂大模型架構(gòu)和推理，也熟悉GPU、云服務(wù)、企業(yè)部署、開發(fā)者生態(tài)和商業(yè)化場景。

所以他分析DeepSeek時，關(guān)注點(diǎn)不是“模型”本身，而是從最底層的技術(shù)，慢慢談到硬件，最后上升到整個產(chǎn)業(yè)。

那么文章具體是怎么說的呢？

一、改寫底層邏輯

我們對“便宜”這個詞的理解，主要來自于過去的各種大戰(zhàn)，比如網(wǎng)約車大戰(zhàn)、外賣大戰(zhàn)、共享單車大戰(zhàn)等等。“便宜就是搶流量，便宜就是搶市場”幾乎刻在了網(wǎng)友們的DNA里。

然而DeepSeek的便宜，并非是簡單的搶量，它其實(shí)是一種“解綁”，讓把AI不再依賴特定的硬件。

從V3到V4，DeepSeek有兩件事影響很大，一個是模型記憶，一個是模型推理，不過最終都落到了一個字上，“省”。

大模型每聊一句，都要把前面的上下文存在KV Cache里，而這部分通常吃的是最貴、最緊張的HBM。

根據(jù)吉里什的測算，在100萬token上下文、8bit KV精度和16bit索引的精度下，DeepSeek V4的KV Cache只占5.48GB HBM。作為對比，GLM5要60GB，Qwen3-235B-A22B要89GB。

差距不只在參數(shù)大小，而在架構(gòu)。DeepSeek V4的MoE、MLA、DSA、CSA、HCA設(shè)計，本質(zhì)上都在做同一件事，把長上下文從“顯存黑洞”變成可以被壓縮、轉(zhuǎn)存、重新加載的系統(tǒng)工程。

而一旦KV Cache被壓縮到很小的規(guī)模，那就意味著，模型推理可以更多地放在SSD、NAND閃存、LPDDR內(nèi)存這些價格親民的存儲介質(zhì)上，這樣你就可以少花點(diǎn)錢去買HBM，同時這也表示，你不再需要那么多英偉達(dá)GPU了。

以前你想入局AI，那你就得老老實(shí)實(shí)花大幾百萬去買英偉達(dá)GPU，錢花出去也就算了，關(guān)鍵是你還得等，因為HBM已經(jīng)嚴(yán)重供不應(yīng)求。

現(xiàn)在缺貨到什么程度呢？2025年11月下單的GB200，起碼要等到2026年第二季度才能拿到貨。2022年特斯拉芯片短缺最嚴(yán)重的時期，一輛Model Y最長交付周期也才24周。

一張GPU，已經(jīng)比一輛新能源汽車還難造了。

因此，DeepSeek的敘事對中國AI產(chǎn)業(yè)鏈很重要。

國產(chǎn)芯片今天最大的機(jī)會，未必是正面追平英偉達(dá)最頂級GPU，而是先找到可以真實(shí)承接負(fù)載的場景。

DeepSeek把模型做得更省顯存、更適合長上下文、更容易被拆到不同硬件上運(yùn)行，就等于給國產(chǎn)GPU、存儲廠商、服務(wù)器廠商和異構(gòu)計算框架留出了接口。

以前英偉達(dá)、SK 海力士、三星、美光這些廠商收入暴漲，就是因為AI硬件所有的壓力全在GPU和HBM上。

DeepSeek把國產(chǎn)廠商拉進(jìn)游戲里了，可以參與到推理、緩存、存儲、調(diào)度的每一個環(huán)節(jié)。

模型不再只為最強(qiáng)的硬件服務(wù)，硬件也不必只有最強(qiáng)的那一類才有價值。中國機(jī)會就在這里。

再看API定價策略。

就在這篇文章發(fā)出前一天，DeepSeek V4 Pro宣布token價格75%永降，輸入token價格降至每百萬0.435美元，緩存命中更是低至0.0036美元。

這個價格比Claude Opus 4.7便宜19倍，比GPT-5.5便宜12倍。

DeepSeek的降價絕非是賠本賺吆喝，原因在于，在DeepSeek開啟首次融資后，梁文鋒就曾跟投資人表態(tài)，要給DeepSeek一個健康的商業(yè)模式。

顯然他不能讓DeepSeek虧錢。

低價API本質(zhì)上是一種生態(tài)策略，也是DeepSeek在向整個產(chǎn)業(yè)鏈發(fā)出信號。

DeepSeek仍然在賺錢，但是梁文鋒不急著去賺“大錢”，他要做的是讓足夠多的開發(fā)者、企業(yè)、硬件廠商圍繞這套技術(shù)體系做適配和投入。

原因無他，就是便宜，所以試錯成本極低。幾百塊錢，甚至幾十塊錢就能適配，那對企業(yè)來說可太劃算了。

當(dāng)生態(tài)形成時，DeepSeek就不是基座模型公司了，它是AI基礎(chǔ)設(shè)施公司，負(fù)責(zé)制定標(biāo)準(zhǔn)，定義產(chǎn)業(yè)，這可能才是梁文鋒看重的。

DeepSeek的技術(shù)選擇和商業(yè)策略背后，存在著一個清晰的邏輯鏈條。

降低模型對頂級硬件的依賴，讓更多硬件廠商有參與機(jī)會，形成良性競爭；硬件廠商們開始競爭，分散風(fēng)險并降低整體成本；降低整體成本，支撐更低的API價格；更低的API價格，吸引更多開發(fā)者和應(yīng)用；更多的應(yīng)用，產(chǎn)生更大的推理負(fù)載；更大的推理負(fù)載，就需要更多的數(shù)據(jù)中心、存儲、電力和散熱設(shè)施。

這是一個正向循環(huán)，DeepSeek站在這個循環(huán)的起點(diǎn)。

就像當(dāng)年的Linux不靠操作系統(tǒng)授權(quán)費(fèi)賺錢，卻撬動了整個開源軟件生態(tài)。

DeepSeek的開源策略、低價API、技術(shù)論文毫無保留分享，都在為同一個目標(biāo)服務(wù)。成為標(biāo)準(zhǔn)，然后在標(biāo)準(zhǔn)之上構(gòu)建的龐大產(chǎn)業(yè)鏈中獲取價值。

二、從算力到電力

假如，我是說假如，DeepSeek真的是想要站在整個AI生態(tài)的開端，那么寧德時代投資DeepSeek這件事，就說得通了。

雖然我們總是習(xí)慣用英偉達(dá)來代表AI基礎(chǔ)設(shè)施，但是AI基礎(chǔ)設(shè)施并不等于GPU，它應(yīng)該是數(shù)據(jù)中心、供電系統(tǒng)、散熱方案、儲能設(shè)備和電網(wǎng)調(diào)度能力的總和。

這里有一個反直覺的現(xiàn)象。

DeepSeek把推理成本打下來了，按理說應(yīng)該降低對硬件和電力的需求。實(shí)際情況恰恰相反。降本會觸發(fā)需求膨脹。

當(dāng)API價格從每百萬token幾美元降到幾毛錢人民幣，很多過去嫌貴、不敢多用的場景，都會開始大量調(diào)用模型。

使用量的增長速度，會遠(yuǎn)超單次推理成本的下降速度。最終結(jié)果是，總的推理負(fù)載不是減少，而是大幅增加。

需求膨脹的必然結(jié)果就是基礎(chǔ)設(shè)施壓力爆炸。

你要更多的硬件去支撐業(yè)務(wù)，而這些硬件運(yùn)作起來就需要更多的電。

所以到最后你會發(fā)現(xiàn)一個事，數(shù)據(jù)中心的供電能力、散熱效率、能源成本，會成為AI公司的核心競爭力之一。

這不是我說著玩的，這是現(xiàn)如今的事實(shí)。

OpenAI與AMD的戰(zhàn)略合作協(xié)議中，就明確約定了以千兆瓦為單位的算力部署里程碑。

一千兆瓦是什么概念？相當(dāng)于一座大型核電站的發(fā)電量。說到底，AI基礎(chǔ)設(shè)施的競爭，早就是能源競爭了。

還有一點(diǎn)，AI數(shù)據(jù)中心，正在成為新型能源基礎(chǔ)設(shè)施。

傳統(tǒng)數(shù)據(jù)中心的負(fù)載相對容易預(yù)測，AI推理則更容易被應(yīng)用流量帶著走。

一個新產(chǎn)品爆了，模型調(diào)用量可能很快沖上去，服務(wù)器、電力和散熱壓力也會跟著上來。

對數(shù)據(jù)中心來說，問題不只是電夠不夠用，還有電價怎么管、波動怎么扛、備用電源和儲能怎么配。

舉個最簡單的例子，很多地方工業(yè)電價都有峰谷差，夜里用電便宜，白天高峰時段更貴。

數(shù)據(jù)中心如果配儲能，就可以在夜里低價充電，白天電價高、負(fù)載上來的時候放電，既少買一部分高價電，也給突發(fā)流量留出緩沖。

過去一年，寧德時代通過關(guān)聯(lián)方接觸了數(shù)據(jù)中心和電力設(shè)備領(lǐng)域，世紀(jì)互聯(lián)（VNET）是第三方數(shù)據(jù)中心運(yùn)營商，中恒電氣做HVDC（高壓直流）供電系統(tǒng)，這些都和AI數(shù)據(jù)中心的電力側(cè)有關(guān)。

DeepSeek這輪融資的投資者名單，本身就是一張產(chǎn)業(yè)地圖。

國家AI基金代表的是政策支持和長期資本，意味著這是國家戰(zhàn)略層面的布局；騰訊代表的是應(yīng)用層和分發(fā)渠道，意味著DeepSeek的技術(shù)，會快速滲透到消費(fèi)互聯(lián)網(wǎng)的各個場景；寧德時代代表的是能源和數(shù)據(jù)中心底座，意味著國產(chǎn)AI基礎(chǔ)設(shè)施的競爭，已經(jīng)從算力延伸到了電力。

這不是一次普通的創(chuàng)業(yè)融資，而是在建立一個圍繞DeepSeek的AI基建聯(lián)盟。

三、部分Harness閉環(huán)與需求制造

去年，DeepSeek、智譜、MiniMax、月之暗面還沒有現(xiàn)如今這么大的區(qū)別，大家都還只是“小龍”。但是到了今天，這4家已經(jīng)完全不同了

智譜走的是政企和企業(yè)市場路線。

S&P Global對智譜的描述是，公司收入主要來自本地部署（on-premise deployments）和云端部署（cloud-based offerings）。

智譜的token可不便宜，它不僅不便宜，它還是“小龍”里面最貴的。不過這并不妨礙智譜增長，如今，智譜的市值已經(jīng)達(dá)到了5700億港元，上市短短四個多月，股價累計漲幅已超過10倍。

智譜的增長是怎么來的？智譜最大的客戶群體是企業(yè)以及政府，他們要的是能穩(wěn)定交付、能過合規(guī)審查、能在客戶自己的機(jī)房里跑起來。

這剛好也是智譜的強(qiáng)項，與此同時，唐杰還表示，目前看好長周期任務(wù)，或許在暗示，GLM的下一階段特性，就是長周期任務(wù)。

雖然說智譜也開源，但智譜學(xué)不來DeepSeek。

因為它已經(jīng)上市，必須證明收入增長。壓低API價格就意味著降低利潤，顯然違背了股東意愿。

MiniMax跟智譜、DeepSeek都不一樣，它更偏應(yīng)用和多模態(tài)產(chǎn)品。

在它的收入結(jié)構(gòu)里，海螺、星野、Mavis這些AI原生產(chǎn)品的占比很大。

MiniMax 2025年財報顯示，AI原生產(chǎn)品收入從2024年的2180萬美元增至2025年的5310萬美元，總收入增至7900萬美元。

所以MiniMax的邏輯是盡快把模型能力包裝成用戶能付費(fèi)的產(chǎn)品，然后再靠產(chǎn)品去打動客戶。

MiniMax會學(xué)DeepSeek的成本效率，因為視頻、語音、Agent都是重算力產(chǎn)品，成本壓不下來，商業(yè)化就很難跑通。

然而MiniMax和智譜一樣，它同樣也需要利潤，需要用戶訂閱，以及它非常需要海外收入。

話說回來，Kimi才是最接近DeepSeek的，不過也沒那么接近。

首先，Kimi沒有上市，和DeepSeek一樣。

它既有C端聊天和會員，也有API，也在開源Kimi K2.6這類模型。

外媒報道稱，月之暗面年化經(jīng)常性收入（ARR）在4月超過了2億美元，其增長來自付費(fèi)訂閱和API使用。

在API方面，根據(jù)OpenRouter數(shù)據(jù)，調(diào)用Kimi K2.5最多的兩個場景，就是OpenClaw和AI編程軟件Kilo Code，全都是日常辦公的入口。

Kimi跟DeepSeek的區(qū)別在于，前者更注重打開次數(shù)。

對Kimi來說，C端的產(chǎn)品體驗非常重要，因為Kimi的強(qiáng)項，比如長文本、代碼、Agent，這些都是“直接面向用戶”的場景。Kimi要做的是把模型能力包裝成一個用戶愿意長期使用的產(chǎn)品入口。

DeepSeek的APP雖然流量大，但它不是一個超級APP，它頂多就算是一個只有問答功能的小程序。

歸根結(jié)底，智譜、MiniMax、Kimi都在回答一個問題，用戶為什么為我付費(fèi)。

DeepSeek不一樣，它要回答產(chǎn)業(yè)鏈為什么圍著我適配。

DeepSeek的API、開源模型、以及對國產(chǎn)AI芯片的適配，本質(zhì)上是讓自己成為一個“定價標(biāo)準(zhǔn)”。

企業(yè)采購模型會拿它比，開發(fā)者選模型會拿它比，芯片和存儲廠商做適配也會拿它比。

一旦DeepSeek的生態(tài)起點(diǎn)坐實(shí)，整個AI產(chǎn)業(yè)鏈都得圍繞著梁文鋒重新定價。

這也是為什么DeepSeek敢在API價格上如此賣力，因為這才是DeepSeek整個故事里，最容易被人看到的部分。

本文來自微信公眾號：字母AI，作者：苗正

本內(nèi)容由作者授權(quán)發(fā)布，觀點(diǎn)僅代表作者本人，不代表虎嗅立場。如對本稿件有異議或投訴，請聯(lián)系 tougao@huxiu.com。

本文來自虎嗅，原文鏈接：https://www.huxiu.com/article/4861242.html?f=wyxwapp

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.