![]()
本文來自微信公眾號:字母AI,作者:苗正,頭圖來自:AI生成
業(yè)內(nèi)一直有這么一個共識,DeepSeek影響力雖然很大,但DeepSeek就是不賺錢。
說到底,無非就是DeepSeek沒有訂閱、沒有額外收費(fèi)項目,只有API收費(fèi),可API價格太便宜了,而且動不動就打折降價。
就比如5月22日晚上,DeepSeek宣布最新旗艦?zāi)P陀谰媒祪r75%,從6月1日開始生效。
但你有想過這一切背后的邏輯是什么嗎?
亞馬遜AWS新加坡區(qū)域生成式AI技術(shù)負(fù)責(zé)人吉里什·迪利普·帕蒂爾(Girish Dilip Patil)在周末寫了這么一篇文章,標(biāo)題是《DeepSeek的10萬億美元大戰(zhàn)略》,從業(yè)內(nèi)視角,對DeepSeek的底層邏輯進(jìn)行了剖析。
文章給出了一個極其反常識的判斷,他說DeepSeek正在以低價為主要敘事手段,進(jìn)而在整個AI產(chǎn)業(yè)鏈引起一場海嘯,徹底瓦解AI硬件現(xiàn)有的產(chǎn)業(yè)結(jié)構(gòu),英偉達(dá)、SK 海力士、三星、美光等公司將會喪失如今的領(lǐng)先地位,而且部分市場,也會讓中國公司取代。
這10萬億美元代表的,就是整個基于DeepSeek而牽動的市場機(jī)會。
文章一經(jīng)發(fā)出迅速爆火,它還不止是只在中文圈火,它是直接火遍了整個X上的AI圈。
X上有一個非常有影響力的AI內(nèi)容博主叫做羅漢·保羅(Rohan Paul),他就轉(zhuǎn)載了這篇文章,并對文章表示了高度的認(rèn)可。
國內(nèi)可能對羅漢這個名字比較陌生,但是他有一個粉絲你肯定認(rèn)識,那就是皮查伊,谷歌現(xiàn)任CEO。
說回文章作者,吉里什不是那種只懂?dāng)?shù)學(xué)或者代碼的人,由于工作的原因,他每天都要接觸AI全棧,因此他是既懂大模型架構(gòu)和推理,也熟悉GPU、云服務(wù)、企業(yè)部署、開發(fā)者生態(tài)和商業(yè)化場景。
所以他分析DeepSeek時,關(guān)注點(diǎn)不是“模型”本身,而是從最底層的技術(shù),慢慢談到硬件,最后上升到整個產(chǎn)業(yè)。
那么文章具體是怎么說的呢?
一、改寫底層邏輯
我們對“便宜”這個詞的理解,主要來自于過去的各種大戰(zhàn),比如網(wǎng)約車大戰(zhàn)、外賣大戰(zhàn)、共享單車大戰(zhàn)等等。“便宜就是搶流量,便宜就是搶市場”幾乎刻在了網(wǎng)友們的DNA里。
然而DeepSeek的便宜,并非是簡單的搶量,它其實(shí)是一種“解綁”,讓把AI不再依賴特定的硬件。
從V3到V4,DeepSeek有兩件事影響很大,一個是模型記憶,一個是模型推理,不過最終都落到了一個字上,“省”。
大模型每聊一句,都要把前面的上下文存在KV Cache里,而這部分通常吃的是最貴、最緊張的HBM。
根據(jù)吉里什的測算,在100萬token上下文、8bit KV精度和16bit索引的精度下,DeepSeek V4的KV Cache只占5.48GB HBM。作為對比,GLM5要60GB,Qwen3-235B-A22B要89GB。
![]()
差距不只在參數(shù)大小,而在架構(gòu)。DeepSeek V4的MoE、MLA、DSA、CSA、HCA設(shè)計,本質(zhì)上都在做同一件事,把長上下文從“顯存黑洞”變成可以被壓縮、轉(zhuǎn)存、重新加載的系統(tǒng)工程。
而一旦KV Cache被壓縮到很小的規(guī)模,那就意味著,模型推理可以更多地放在SSD、NAND閃存、LPDDR內(nèi)存這些價格親民的存儲介質(zhì)上,這樣你就可以少花點(diǎn)錢去買HBM,同時這也表示,你不再需要那么多英偉達(dá)GPU了。
以前你想入局AI,那你就得老老實(shí)實(shí)花大幾百萬去買英偉達(dá)GPU,錢花出去也就算了,關(guān)鍵是你還得等,因為HBM已經(jīng)嚴(yán)重供不應(yīng)求。
現(xiàn)在缺貨到什么程度呢?2025年11月下單的GB200,起碼要等到2026年第二季度才能拿到貨。2022年特斯拉芯片短缺最嚴(yán)重的時期,一輛Model Y最長交付周期也才24周。
一張GPU,已經(jīng)比一輛新能源汽車還難造了。
因此,DeepSeek的敘事對中國AI產(chǎn)業(yè)鏈很重要。
國產(chǎn)芯片今天最大的機(jī)會,未必是正面追平英偉達(dá)最頂級GPU,而是先找到可以真實(shí)承接負(fù)載的場景。
DeepSeek把模型做得更省顯存、更適合長上下文、更容易被拆到不同硬件上運(yùn)行,就等于給國產(chǎn)GPU、存儲廠商、服務(wù)器廠商和異構(gòu)計算框架留出了接口。
以前英偉達(dá)、SK 海力士、三星、美光這些廠商收入暴漲,就是因為AI硬件所有的壓力全在GPU和HBM上。
DeepSeek把國產(chǎn)廠商拉進(jìn)游戲里了,可以參與到推理、緩存、存儲、調(diào)度的每一個環(huán)節(jié)。
模型不再只為最強(qiáng)的硬件服務(wù),硬件也不必只有最強(qiáng)的那一類才有價值。中國機(jī)會就在這里。
再看API定價策略。
就在這篇文章發(fā)出前一天,DeepSeek V4 Pro宣布token價格75%永降,輸入token價格降至每百萬0.435美元,緩存命中更是低至0.0036美元。
這個價格比Claude Opus 4.7便宜19倍,比GPT-5.5便宜12倍。
DeepSeek的降價絕非是賠本賺吆喝,原因在于,在DeepSeek開啟首次融資后,梁文鋒就曾跟投資人表態(tài),要給DeepSeek一個健康的商業(yè)模式。
顯然他不能讓DeepSeek虧錢。
低價API本質(zhì)上是一種生態(tài)策略,也是DeepSeek在向整個產(chǎn)業(yè)鏈發(fā)出信號。
DeepSeek仍然在賺錢,但是梁文鋒不急著去賺“大錢”,他要做的是讓足夠多的開發(fā)者、企業(yè)、硬件廠商圍繞這套技術(shù)體系做適配和投入。
原因無他,就是便宜,所以試錯成本極低。幾百塊錢,甚至幾十塊錢就能適配,那對企業(yè)來說可太劃算了。
當(dāng)生態(tài)形成時,DeepSeek就不是基座模型公司了,它是AI基礎(chǔ)設(shè)施公司,負(fù)責(zé)制定標(biāo)準(zhǔn),定義產(chǎn)業(yè),這可能才是梁文鋒看重的。
DeepSeek的技術(shù)選擇和商業(yè)策略背后,存在著一個清晰的邏輯鏈條。
降低模型對頂級硬件的依賴,讓更多硬件廠商有參與機(jī)會,形成良性競爭;硬件廠商們開始競爭,分散風(fēng)險并降低整體成本;降低整體成本,支撐更低的API價格;更低的API價格,吸引更多開發(fā)者和應(yīng)用;更多的應(yīng)用,產(chǎn)生更大的推理負(fù)載;更大的推理負(fù)載,就需要更多的數(shù)據(jù)中心、存儲、電力和散熱設(shè)施。
這是一個正向循環(huán),DeepSeek站在這個循環(huán)的起點(diǎn)。
就像當(dāng)年的Linux不靠操作系統(tǒng)授權(quán)費(fèi)賺錢,卻撬動了整個開源軟件生態(tài)。
DeepSeek的開源策略、低價API、技術(shù)論文毫無保留分享,都在為同一個目標(biāo)服務(wù)。成為標(biāo)準(zhǔn),然后在標(biāo)準(zhǔn)之上構(gòu)建的龐大產(chǎn)業(yè)鏈中獲取價值。
二、從算力到電力
假如,我是說假如,DeepSeek真的是想要站在整個AI生態(tài)的開端,那么寧德時代投資DeepSeek這件事,就說得通了。
雖然我們總是習(xí)慣用英偉達(dá)來代表AI基礎(chǔ)設(shè)施,但是AI基礎(chǔ)設(shè)施并不等于GPU,它應(yīng)該是數(shù)據(jù)中心、供電系統(tǒng)、散熱方案、儲能設(shè)備和電網(wǎng)調(diào)度能力的總和。
這里有一個反直覺的現(xiàn)象。
DeepSeek把推理成本打下來了,按理說應(yīng)該降低對硬件和電力的需求。實(shí)際情況恰恰相反。降本會觸發(fā)需求膨脹。
當(dāng)API價格從每百萬token幾美元降到幾毛錢人民幣,很多過去嫌貴、不敢多用的場景,都會開始大量調(diào)用模型。
使用量的增長速度,會遠(yuǎn)超單次推理成本的下降速度。最終結(jié)果是,總的推理負(fù)載不是減少,而是大幅增加。
需求膨脹的必然結(jié)果就是基礎(chǔ)設(shè)施壓力爆炸。
你要更多的硬件去支撐業(yè)務(wù),而這些硬件運(yùn)作起來就需要更多的電。
所以到最后你會發(fā)現(xiàn)一個事,數(shù)據(jù)中心的供電能力、散熱效率、能源成本,會成為AI公司的核心競爭力之一。
這不是我說著玩的,這是現(xiàn)如今的事實(shí)。
OpenAI與AMD的戰(zhàn)略合作協(xié)議中,就明確約定了以千兆瓦為單位的算力部署里程碑。
一千兆瓦是什么概念?相當(dāng)于一座大型核電站的發(fā)電量。說到底,AI基礎(chǔ)設(shè)施的競爭,早就是能源競爭了。
還有一點(diǎn),AI數(shù)據(jù)中心,正在成為新型能源基礎(chǔ)設(shè)施。
傳統(tǒng)數(shù)據(jù)中心的負(fù)載相對容易預(yù)測,AI推理則更容易被應(yīng)用流量帶著走。
一個新產(chǎn)品爆了,模型調(diào)用量可能很快沖上去,服務(wù)器、電力和散熱壓力也會跟著上來。
對數(shù)據(jù)中心來說,問題不只是電夠不夠用,還有電價怎么管、波動怎么扛、備用電源和儲能怎么配。
舉個最簡單的例子,很多地方工業(yè)電價都有峰谷差,夜里用電便宜,白天高峰時段更貴。
數(shù)據(jù)中心如果配儲能,就可以在夜里低價充電,白天電價高、負(fù)載上來的時候放電,既少買一部分高價電,也給突發(fā)流量留出緩沖。
過去一年,寧德時代通過關(guān)聯(lián)方接觸了數(shù)據(jù)中心和電力設(shè)備領(lǐng)域,世紀(jì)互聯(lián)(VNET)是第三方數(shù)據(jù)中心運(yùn)營商,中恒電氣做HVDC(高壓直流)供電系統(tǒng),這些都和AI數(shù)據(jù)中心的電力側(cè)有關(guān)。
DeepSeek這輪融資的投資者名單,本身就是一張產(chǎn)業(yè)地圖。
國家AI基金代表的是政策支持和長期資本,意味著這是國家戰(zhàn)略層面的布局;騰訊代表的是應(yīng)用層和分發(fā)渠道,意味著DeepSeek的技術(shù),會快速滲透到消費(fèi)互聯(lián)網(wǎng)的各個場景;寧德時代代表的是能源和數(shù)據(jù)中心底座,意味著國產(chǎn)AI基礎(chǔ)設(shè)施的競爭,已經(jīng)從算力延伸到了電力。
這不是一次普通的創(chuàng)業(yè)融資,而是在建立一個圍繞DeepSeek的AI基建聯(lián)盟。
三、部分Harness閉環(huán)與需求制造
去年,DeepSeek、智譜、MiniMax、月之暗面還沒有現(xiàn)如今這么大的區(qū)別,大家都還只是“小龍”。但是到了今天,這4家已經(jīng)完全不同了
智譜走的是政企和企業(yè)市場路線。
S&P Global對智譜的描述是,公司收入主要來自本地部署(on-premise deployments)和云端部署(cloud-based offerings)。
智譜的token可不便宜,它不僅不便宜,它還是“小龍”里面最貴的。不過這并不妨礙智譜增長,如今,智譜的市值已經(jīng)達(dá)到了5700億港元,上市短短四個多月,股價累計漲幅已超過10倍。
智譜的增長是怎么來的?智譜最大的客戶群體是企業(yè)以及政府,他們要的是能穩(wěn)定交付、能過合規(guī)審查、能在客戶自己的機(jī)房里跑起來。
這剛好也是智譜的強(qiáng)項,與此同時,唐杰還表示,目前看好長周期任務(wù),或許在暗示,GLM的下一階段特性,就是長周期任務(wù)。
雖然說智譜也開源,但智譜學(xué)不來DeepSeek。
因為它已經(jīng)上市,必須證明收入增長。壓低API價格就意味著降低利潤,顯然違背了股東意愿。
MiniMax跟智譜、DeepSeek都不一樣,它更偏應(yīng)用和多模態(tài)產(chǎn)品。
在它的收入結(jié)構(gòu)里,海螺、星野、Mavis這些AI原生產(chǎn)品的占比很大。
MiniMax 2025年財報顯示,AI原生產(chǎn)品收入從2024年的2180萬美元增至2025年的5310萬美元,總收入增至7900萬美元。
所以MiniMax的邏輯是盡快把模型能力包裝成用戶能付費(fèi)的產(chǎn)品,然后再靠產(chǎn)品去打動客戶。
MiniMax會學(xué)DeepSeek的成本效率,因為視頻、語音、Agent都是重算力產(chǎn)品,成本壓不下來,商業(yè)化就很難跑通。
然而MiniMax和智譜一樣,它同樣也需要利潤,需要用戶訂閱,以及它非常需要海外收入。
話說回來,Kimi才是最接近DeepSeek的,不過也沒那么接近。
首先,Kimi沒有上市,和DeepSeek一樣。
它既有C端聊天和會員,也有API,也在開源Kimi K2.6這類模型。
外媒報道稱,月之暗面年化經(jīng)常性收入(ARR)在4月超過了2億美元,其增長來自付費(fèi)訂閱和API使用。
在API方面,根據(jù)OpenRouter數(shù)據(jù),調(diào)用Kimi K2.5最多的兩個場景,就是OpenClaw和AI編程軟件Kilo Code,全都是日常辦公的入口。
Kimi跟DeepSeek的區(qū)別在于,前者更注重打開次數(shù)。
對Kimi來說,C端的產(chǎn)品體驗非常重要,因為Kimi的強(qiáng)項,比如長文本、代碼、Agent,這些都是“直接面向用戶”的場景。Kimi要做的是把模型能力包裝成一個用戶愿意長期使用的產(chǎn)品入口。
DeepSeek的APP雖然流量大,但它不是一個超級APP,它頂多就算是一個只有問答功能的小程序。
歸根結(jié)底,智譜、MiniMax、Kimi都在回答一個問題,用戶為什么為我付費(fèi)。
DeepSeek不一樣,它要回答產(chǎn)業(yè)鏈為什么圍著我適配。
DeepSeek的API、開源模型、以及對國產(chǎn)AI芯片的適配,本質(zhì)上是讓自己成為一個“定價標(biāo)準(zhǔn)”。
企業(yè)采購模型會拿它比,開發(fā)者選模型會拿它比,芯片和存儲廠商做適配也會拿它比。
一旦DeepSeek的生態(tài)起點(diǎn)坐實(shí),整個AI產(chǎn)業(yè)鏈都得圍繞著梁文鋒重新定價。
這也是為什么DeepSeek敢在API價格上如此賣力,因為這才是DeepSeek整個故事里,最容易被人看到的部分。
本文來自微信公眾號:字母AI,作者:苗正
本內(nèi)容由作者授權(quán)發(fā)布,觀點(diǎn)僅代表作者本人,不代表虎嗅立場。如對本稿件有異議或投訴,請聯(lián)系 tougao@huxiu.com。
本文來自虎嗅,原文鏈接:https://www.huxiu.com/article/4861242.html?f=wyxwapp
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.