![]()
新智元報道
![]()
【新智元導讀】DeepSeek正用開源、降價和底層架構創新,重畫AI硬件生態的成本曲線,把目標指向十萬億美元產業與AGI的星辰大海。
DeepSeek最近動作頻頻。
先是5月22日,彭博社爆出他們正在推進700億元人民幣的融資,投前估值高達450億美元。
![]()
同一天,DeepSeek官宣V4-Pro API永久降價75%——把促銷價直接焊死成正價。
一邊向投資人要錢,一邊向開發者讓利。這操作,多少有點讓人迷糊。
那么問題來了,DeepSeek到底要靠什么賺錢,而且還要賺很多很多錢?
畢竟,AGI可不是能口嗨出來的。
這正是x博主@bookwormengr最近研究的一個狠問題。
他在長文《DeepSeek's 10 trillion USD grand strategy》中提出一個非常大膽的判斷:DeepSeek真正的星辰大海,可能不是賣編程套餐,不是賣語音助手,而是參與塑造一個價值10萬億美元級別的AI硬件生態,并在這個生態里沖擊萬億美元級估值。
![]()
仔細讀完@bookwormengr的這篇萬字長文,你會發現:梁文鋒不是瘋子,他是棋手。
而且是高手,他下的是一盤價值10萬億美元的棋。
英雄之旅
一場反共識的技術長征
回顧DeepSeek的成長軌跡,用「英雄之旅」來形容不為過。
在所有人都在堆Dense模型、卷參數量的時候,DeepSeek去啃最難訓的MoE(混合專家模型),用更少的計算量撬動更高的智能。
別人用PPO做強化學習,他們從第一性原理出發,發明了更便宜的GRPO算法。
別人還在討論RLHF的天花板,他們已經跑通了RLVR(基于可驗證獎勵的強化學習),把推理能力拉上了新臺階。
MLA、DSA(解耦稀疏注意力)、mHC(流形約束超連接)、CSA和HCA——這些都不是論文里的花拳繡腿,每一項都在回答同一個問題:怎樣在有限的硬件條件下,榨出最大的AI算力?
英雄從來不是一開始就知道自己的使命。他在路上不斷戰斗、不斷發現,最終找到了自己的終極宿命。
DeepSeek的宿命,從來都不是賣API套餐。
一道有趣的數學題
KV Cache的秘密
讓我們從一個具體的數字開始講這個故事。
打開kvcache.ai的在線計算器,輸入100萬token上下文、8bit KV精度、16bit索引精度,你會看到一組讓人瞠目的對比:DeepSeek V4僅需5.48GBHBM。
![]()
相比之下,其他頂級開源模型則動輒需要60GBHBM。
注意,DeepSeek V4是一個1.6萬億參數的模型,體量遠大于其他開源模型,KV Cache占用卻只有它們的零頭。
這意味著DeepSeek可以把緩存命中的價格定到一個令人發指的低位——V4-Pro緩存命中價僅0.025元/百萬Token,不到Claude Sonnet 4.6同類價格的3%,而且可以持續緩存數小時。
永久降價后,輸入緩存未命中3元/百萬Token,輸出6元/百萬Token,全部是原價的四分之一。
![]()
梁文鋒兩年前就說過DeepSeek的定價哲學:我們的原則是不貼錢,也不賺取暴利。
現在看來,他說的是實話——當你的KV Cache只有別人的十分之一,你的成本就是別人的零頭。
但更深的問題是:這個紅利到底流向了哪里?
十萬億美元的棋盤
硬件生態的重構
答案藏在三個縮寫里:SSD、LPDDR、HBM。
第一層:SSD與NAND閃存。KV Cache被壓縮到極小之后,可以高效地卸載(offload)到SSD上,等需要時再快速加載回HBM。
DeepSeek在Dual Path論文中還專門優化了從SSD加載KV Cache的速度。這直接減少了對昂貴HBM的依賴。
誰是SSD和NAND閃存的大玩家?DeepSeek每壓縮一分KV Cache,就在為NAND和SSD創造一個龐大的新市場。
第二層:LPDDR內存。SGLang團隊發表的研究表明,LPDDR完全可以作為「權重暫存區」——模型權重先放在LPDDR里,需要時再流式傳輸到HBM中,大幅緩解HBM的容量壓力。
![]()
![]()
DeepSeek的MoE架構天然適配這個方案:專家數量多、權重可以4bit量化,流式加載非常高效。
誰在做LPDDR?國產速度只落后0.5代,密度落后1代,追趕的腳步已經很近。
第三層:GPU/ASIC的減壓。Engram模塊用LPDDR中的哈希查表替代Transformer的前向傳播計算,本質上是用每比特成本極低的「內存讀取」替代每比特成本極高的「GPU運算」。
這對中國AI芯片意義重大——由于EUV光刻機受限,國產GPU在原始FLOPs上落后。但如果你能用更多的便宜內存來替代更少的昂貴算力,那這種「換道超車」就變得合理了。
再加上TileLang——DeepSeek投資的跨硬件內核編譯框架,可以讓一套計算代碼同時跑在多種硬件平臺上,相當于繞過了「CUDA護城河」。國產芯片廠商,都有可能因此獲得生態層面的突破。
現在你明白了嗎?DeepSeek做的每一項技術創新,都在指向同一個方向:降低對頂級硬件的依賴,讓中國現有的存儲、芯片、網絡生態變得足夠用,甚至好用。
![]()
@bookwormengr算了一筆大賬:全球AI相關股票的總市值早已遠超10萬億美元。
如果DeepSeek能幫助中國構建一個等量級的AI硬件生態,它自己在這盤棋里拿到1萬億美元的估值,完全合乎邏輯。
![]()
不賺快錢的邏輯
回頭看DeepSeek的所有「不做」——不做多模態(V4.1才開始試水圖像和音頻)、不做語音模型、不做視頻模型、API一降再降——就說得通了。
不是「不會賺錢」,而是「暫時不屑于賺這種錢」。
@bookwormengr提出了一個精彩的類比:OpenAI拿到了AMD和Cerebras的股權認購權證,只要達成算力采購里程碑就可以低價買入股票。這本質上是「用承諾換股權」——你幫我造芯片,我給你訂單,我們一起把蛋糕做大。
![]()
DeepSeek完全可以復制這個模式。
只不過它面對的不是AMD和Cerebras,而是整條國產AI硬件產業鏈。
梁文鋒是量化基金出身,被稱為「Jim Simmon的忠實粉絲」。這樣一個人,不可能不懂資本運作的精妙之處。
事實上,融資消息傳出前,他已經在2026年4月完成了一次關鍵的股權調整——通過直接與間接持股控制公司約84.29%的股權,表決權100%。
![]()
寧德時代投DeepSeek——它要鎖定未來AI數據中心的儲能訂單。京東、網易入局,各有各的戰略訴求。
國家大基金下場,更是把DeepSeek定位成了國家級AI基礎設施。
這些投資者看到的,不是一個賣API的小生意。他們看到的,是一個可能重塑全球AI硬件格局的戰略支點。
終極使命
大規模強化學習與AGI
但如果你以為DeepSeek的終點是「做中國AI硬件生態的發動機」,那可能還是低估了梁文鋒。
據彭博社報道,梁文鋒在投資者會議上明確表態:DeepSeek的主要目標是推動技術邊界,追求AGI。
![]()
硬件生態是手段,AGI才是目的。
邏輯是這樣:當更多硬件選擇變得可用、當算力需求本身被技術創新大幅壓低,DeepSeek就能以更低的成本啟動更大規模的訓練——特別是強化學習(RL)后訓練和遞歸自我改進(RSI)。
大規模RL意味著模型需要生成海量的推理軌跡——萬億級token的生成量,計算成本極其恐怖。而100萬上下文的長程任務,要求軌跡本身也足夠長。
如果沒有極致的硬件效率優化,這種訓練根本跑不起來。
RSI則更加大膽——讓AI自己設計實驗、執行實驗、分析結果、改進自身。這是一個試錯密度極高的過程,對算力的需求是無底洞。
但如果DeepSeek通過重構硬件生態把算力成本打下來,這條路就變得可行。
從MoE到MLA,從DSA到CSA,從Engram到TileLang,從KV Cache壓縮到LPDDR流式加載——所有這些創新,最終都匯聚到同一個終點:讓AGI的訓練從「燒不起」變成「燒得起」。
梁文鋒與DeepSeek的星辰大海,從來不是海面上的浪花,而是洋流本身。
編輯:所羅門
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.