網易首頁 > 網易號 > 正文 申請入駐

等了一年的DeepseekV4終于來了,沒有發布會只有一份改好的文檔

0
分享至

V4來了
沒有發布會
只有一份改好的文檔

DeepSeek V4 深度解讀

2026年4月24日

4月24日上午10點56分,DeepSeek微信公眾號推送了一條消息。

沒有發布會,沒有技術報告,沒有媒體吹風會。開發者平臺的API文檔頁面悄然刷新——deepseek-v4-flashdeepseek-v4-pro兩個新模型名出現在接口列表里,旁邊多了一行公告:現有的deepseek-chat和deepseek-reasoner將于7月24日停止使用。

就這么發了。

這就是DeepSeek的風格。上次V3發布也是半夜改了個文檔,這一次連時間都沒換——上午推了一條微信,完事。全世界等了半年的V4,落地方式像極了一個程序員改完代碼直接上線,連commit message都懶得寫。

但你細品,這哪里是"懶"?這是一種態度。不造勢、不炫耀、不開發布會、不請媒體吹風——我做好了,放這兒了,你用就是。全球AI行業已經習慣了每次大模型發布都要搞一場秀,DeepSeek偏偏不配合這個劇本。不是做不出發布會的排場,是不覺得那是該做的事。

V4發布文檔的最后一句話是八個字:「不誘于譽,不恐于誹」。這八個字,是讀懂V4全部選擇的鑰匙。

01

百萬上下文,從奢侈品變水電煤

V4不是一個大模型,是兩個。

V4-Pro

V4-Flash

總參數

1.6萬億

激活參數

490億

130億

預訓練數據

33萬億tokens

32萬億tokens

上下文窗口

100萬tokens

100萬tokens

最大輸出

38.4萬tokens

38.4萬tokens

定位

旗艦推理,復雜任務

極致性價比,通用任務

最關鍵的一行:兩個版本標配同樣的100萬token超長上下文。沒有因為你是Flash就砍上下文,這點很DeepSeek。

100萬token意味著什么?不是數字變大,是工作范式變了。一次性吞下數十萬字的并購盡調材料、整本書籍、大型代碼庫——以前需要人工切文檔、分段喂給模型的活,現在直接扔進去。

百萬上下文一旦成為標配,沒有的廠商連牌桌都上不了。這會倒逼閉源廠商跟進,否則將失去"上牌桌"的資格。

而V4-Pro在開源領域已無對手——Codeforces Rating 3206,超越GPT-5.4的3168。處理能力較V3.2提升近8倍。但更狠的是成本。

1M上下文,V3.2時代算力撐到極限才128K。直接拉到100萬,算力和內存都要炸。DeepSeek的解法是——不再硬算,而是換了一種注意力機制。

? CSA + HCA:壓縮篩重點,低成本看全局

  • CSA(壓縮序列注意力)

    :每4個token的KV緩存合并成一條摘要,每個query只在摘要中選出top-k條計算注意力。先看目錄,再翻重點章節。

  • HCA(重度壓縮注意力)

    :每128個token合并成一條,對剩余摘要做稠密注意力。只看每章的總結。

  • 滑動窗口分支

    :處理近距離token的細節依賴。


V4-Pro 效率

算力 27% · 顯存 10%

1M上下文下,單token推理計算量只有V3.2的27%,KV Cache顯存占用僅10%

V4-Flash 效率

算力 10% · 顯存 7%

Flash版更極端,算力和顯存分別壓到V3.2的10%和7%

上下文翻了8倍,算力反而只要原來的1/4,內存只要1/10。百萬上下文從奢侈品變成了水電煤。

注意,Flash版和Pro版標配同樣的100萬上下文——沒有因為你是"經濟版"就砍能力。這個選擇本身就在說話:普惠不是口號,是標配。你要做行業基礎設施,就不能只讓付得起錢的人用。

另一個架構創新值得說:V4采用萬億參數MoE架構,并引入類似Engram的條件內存技術,實現推理邏輯與知識存儲分離,以極低顯存消耗支撐超大模型。模型不是越做越臃腫,而是越做越輕——激活49B,總參1.6T,這就是MoE的魔法。

02

Day 0適配:從備選到核心平臺

這是V4最硬核的信號,沒有之一。

發布當日,華為昇騰、寒武紀、天數智芯等國產芯片廠商即完成了對V4-Pro和V4-Flash的全量適配。

注意這個"Day 0"。以前新模型發布,國產芯片要等數月才能適配,永遠是追趕者。這次,發布當天就能跑——徹底改變了游戲規則。

更關鍵的是:DeepSeek首次在官方技術報告中將華為昇騰與英偉達并列寫入硬件驗證清單。不是"兼容",不是"適配",是并列。國產芯片第一次從"備選方案"躍升為"核心算力平臺"。

? 這意味著什么?

  • 全球第一個萬億參數級模型,在 國產算力底座 上完成了訓練與推理的全鏈路驗證

  • V4采用FP4(mxFP4)精度,恰好是 昇騰950PR 芯片的原生支持格式

  • 推理與訓練代碼從 CUDA生態遷移至華為CANN框架

  • 4月24日晚7點,華為昇騰CANN官方B站賬號進行 獨家首發直播

CUDA脫鉤不再是一個口號,而是一個已經發生的事實。但更準確地說——這也不是"脫鉤",是"率道而行"。按自己的路走,不被別人的生態綁架。

對金融、能源、政企等對自主可控有剛性需求的行業來說,V4傳遞的信號很明確:性能不打折、部署不被卡脖子。Apache 2.0協議開源 + 優先適配國產芯片,這條技術棧從第一天就為你鋪好了。

當然,Pro版本在昇騰上的吞吐還受限,官方也坦誠"受限于高端算力供給"。但預計下半年昇騰950超節點批量上市后,Pro版價格將大幅下調。

現在只是上半場。

03

漣漪已起,子彈還在飛

定價就不用多說了——價格屠夫又來了。

輸入(緩存命中)

輸入(緩存未命中)

輸出

V4-Flash

0.2元

1元

2元

V4-Pro

1元

12元

24元

單位:元/百萬token

同一天,OpenAI發布GPT-5.5,API定價飆升至每百萬token輸出30美元(約210元人民幣),是前代三倍。V4-Flash的輸出價格是GPT-5.5的1%。

一邊是"開源普惠、成本重構",另一邊是"性能登頂、價格翻倍"。同一天的隔空對撞,AI行業徹底撕裂成了兩條路。

容易被忽略的細節

  • Anthropic兼容

    :V4上線同時開放了Anthropic兼容端點,成為國內首家同時兼容OpenAI和Anthropic兩大接口標準的AI公司

  • 遷移零門檻

    :舊模型7月24日停用,Flash已整合上一代兩個獨立接口的能力,遷移只需改個模型名

  • 這不是在競爭,這是在挖墻角

但是。

漣漪已經產生,子彈還需要再飛一會兒。別急著all in。幾個冷思考:

1 應用場景會爆發,但需要時間兌現

百萬上下文會淘汰人工切文檔的模式,在法律、金融、代碼管理催生全新工作流。但下半年昇騰950量產、Pro版價格下調之后,推理成本降到新低,全量客服質檢、分鐘級供應鏈監控、個性化教育這些因成本受限的應用才會集中爆發。現在能看到方向,但還沒到收獲期。

2 生態布局窗口已打開,但別把情緒當利潤

V4發布是未來一年行業規則重寫的起點。企業和研發團隊應該立即著手基于DeepSeek生態進行產品研發和布局,以在算力到位、價格落地后搶占先機——但股價可以先漲,業績不能先來。短期情緒沖高是確定的,產業利潤兌現至少等到下半年。

3 關注國產算力的真實交付,不只是概念

V4驗證了AI應用(特別是Agent爆發)對算力的強勁拉動。市場關注點應從情緒轉向產業鏈——國產算力在超節點系統、高速互聯、液冷、電力等基礎設施層面的真實交付能力,才是決定這輪行情能走多遠的關鍵。

4 DeepSeek自身也在變

公司正從一個理想主義的技術烏托邦,轉向重視產品與商業化的務實公司。內部已組建產品團隊探索Agent等形態,開始招募大量產品經理和中文系學生(用于人文數據標注)。V4不是終點,而是DeepSeek從"極客實驗室"到"基礎設施提供商"的轉折點。

不誘于譽,不恐于誹

V4發布文檔的最后一頁,沒有性能參數,沒有對標數據,只留了一句話:

「不誘于譽,不恐于誹,率道而行,端然正己?!?/p>

這句話出自《荀子·非十二子》,講的是君子之道——不被贊譽誘惑,不被毀謗恐嚇,循著正道前行,端正自己的行為。

放在V4的語境里,每一個字都不是空話:

不誘于譽 ——做出了1.6萬億參數的模型,不開發布會,不改技術報告,推送一條微信就上線。不造勢,是因為自信不需要造勢。

不恐于誹 ——自認落后閉源3-6個月,坦然寫在文檔里。不遮掩,是因為追趕不是靠嘴,而是靠每一代產品的交付。

率道而行 ——從CUDA切到CANN,從閉源切到Apache 2.0,從高端定價切到平民價格。每一步都逆著行業慣性走,不是因為別人走錯了,而是因為自己認定的道不一樣。

端然正己 ——Pro在昇騰上吞吐受限,直接承認"受限于高端算力供給"。不畫餅,是因為畫餅不如做好下一代。

這是中國企業在中華文化浸潤下表現出的一種特質——不張揚,不回避,踏實做自己的事。硅谷在卷能力上限,DeepSeek在卷成本下限;硅谷在用價格篩選用戶,DeepSeek在用價格打開市場;硅谷在用閉源筑墻,DeepSeek在用開源鋪路。

這不是"中國版ChatGPT"的故事。這是兩條完全不同的路。

漣漪已經產生,但子彈還需要再飛一會兒。V4劃了方向,昇騰950量產兌現算力,價格下調打開應用場景,產業鏈交付能力決定行情縱深——這是一條至少一年的兌現鏈。

方向對了,子彈在飛。別追著子彈跑,站在彈著點等。

本文僅代表作者個人觀點,不構成投資建議。市場有風險,投資需謹慎。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
羅馬諾:曼聯已和巴萊巴達成口頭加盟協議!皇馬了解穆帥希望回歸

羅馬諾:曼聯已和巴萊巴達成口頭加盟協議!皇馬了解穆帥希望回歸

足球偵探
2026-04-27 08:35:08
央行終于出手!借唄、微粒貸逾期的朋友,再不用為網絡支付為難了

央行終于出手!借唄、微粒貸逾期的朋友,再不用為網絡支付為難了

我不叫阿哏
2026-04-27 11:09:33
尼日爾撕毀4億美元合同,并驅逐中方高管,我方暗藏后手漂亮反擊

尼日爾撕毀4億美元合同,并驅逐中方高管,我方暗藏后手漂亮反擊

詭譎怪談
2025-04-30 22:17:42
“二女兒會恨死你”,家長曬兩娃名字,重男輕女簡直刻在骨子里

“二女兒會恨死你”,家長曬兩娃名字,重男輕女簡直刻在骨子里

澤澤先生
2026-04-25 21:49:06
孫楊私生子眉毛嘴巴和他一模一樣,13歲在北京練擊劍

孫楊私生子眉毛嘴巴和他一模一樣,13歲在北京練擊劍

喜歡歷史的阿繁
2026-04-28 00:37:17
突發!艾頓高效19+10后肘擊申京脖頸 被吹罰二級惡犯驅逐離場

突發!艾頓高效19+10后肘擊申京脖頸 被吹罰二級惡犯驅逐離場

醉臥浮生
2026-04-27 11:26:52
官宣 | 張效瑞,臨時接手主教練!

官宣 | 張效瑞,臨時接手主教練!

硯底沉香
2026-04-27 13:21:39
明碼標價5折甩賣,番禺這個樓盤看得人心驚肉跳!

明碼標價5折甩賣,番禺這個樓盤看得人心驚肉跳!

黃師娘
2026-04-27 22:00:46
別再惡意抹黑!余承東曬問界車有多結實:5輛車才算把M6撞翻

別再惡意抹黑!余承東曬問界車有多結實:5輛車才算把M6撞翻

快科技
2026-04-27 12:47:35
竇靖童和宋妍霏巴黎被偶遇,留著寸頭很帥氣,兩人在一起很久了

竇靖童和宋妍霏巴黎被偶遇,留著寸頭很帥氣,兩人在一起很久了

老好人的憤怒
2026-04-27 08:07:21
未來10年最吃香的 “鐵飯碗”,這6個行業,抓住一個終身躺贏!

未來10年最吃香的 “鐵飯碗”,這6個行業,抓住一個終身躺贏!

細說職場
2026-04-25 19:55:42
有一種痛苦叫買了“一梯一戶”,以為高大上,結果入住就后悔

有一種痛苦叫買了“一梯一戶”,以為高大上,結果入住就后悔

裝修秀
2026-04-26 10:55:03
女子酒店抓獲丈夫出軌,無法容忍不戴避孕套,丈夫:她是我朋友

女子酒店抓獲丈夫出軌,無法容忍不戴避孕套,丈夫:她是我朋友

李晚書
2026-04-24 10:39:33
斯諾克世錦賽太殘酷:隨著吳宜澤13-11晉級,11名中國選手僅存2名

斯諾克世錦賽太殘酷:隨著吳宜澤13-11晉級,11名中國選手僅存2名

側身凌空斬
2026-04-28 00:07:38
華子缺陣G5:森林狼的背水一戰

華子缺陣G5:森林狼的背水一戰

賽場速報局
2026-04-28 04:04:26
東南亞隱藏的“電詐大佬”,一個個正在浮出水面

東南亞隱藏的“電詐大佬”,一個個正在浮出水面

現實的聲音
2026-04-27 20:36:14
廣東一男子臆想同學要害自己,持刀致同學及其弟弟1死1傷,經鑒定男子患精神分裂癥;被害人:兇手行兇前曾問有什么話要跟他說

廣東一男子臆想同學要害自己,持刀致同學及其弟弟1死1傷,經鑒定男子患精神分裂癥;被害人:兇手行兇前曾問有什么話要跟他說

臺州交通廣播
2026-04-28 02:15:19
五次“末日現金”押注!巴菲特60年只出手5次,每次都在崩盤前夜

五次“末日現金”押注!巴菲特60年只出手5次,每次都在崩盤前夜

徐sir財經
2026-04-27 08:39:49
Opta更新歐冠奪冠概率:阿森納35.7%,拜仁34.9%

Opta更新歐冠奪冠概率:阿森納35.7%,拜仁34.9%

懂球帝
2026-04-28 03:51:04
北京車展最貴展臺火了!2000萬國產超跑被富豪當場拿下

北京車展最貴展臺火了!2000萬國產超跑被富豪當場拿下

科技湃
2026-04-26 23:21:11
2026-04-28 05:12:49
靜姐的財富第六感 incentive-icons
靜姐的財富第六感
趨勢投資|財富管理|大類資產配置
77文章數 21關注度
往期回顧 全部

科技要聞

DeepSeek V4上線三天,第一批實測出來了

頭條要聞

坐在特朗普身邊親歷槍擊案的女記者 身份非常不一般

頭條要聞

坐在特朗普身邊親歷槍擊案的女記者 身份非常不一般

體育要聞

人類馬拉松"破二"新紀元,一場跑鞋軍備競賽

娛樂要聞

黃楊鈿甜為“耳環風波”出鏡道歉:謠言已澄清

財經要聞

Meta 140億收購Manus遭中國發改委否決

汽車要聞

不那么小眾也可以 smart的路會越走越寬

態度原創

游戲
手機
教育
數碼
時尚

《AC黑旗》重制版新增專屬劇情!原版編劇親自執筆

手機要聞

一加Nord CE6 Lite官宣5月7日發布,7000mAh電池

教育要聞

你不說這是計算障礙,我真以為我是智障呢

數碼要聞

6K/3K雙模切換!三星這款顯示器什么水平?

絲巾的10種系法,愛美的女人必看

無障礙瀏覽 進入關懷版