網易首頁 > 網易號 > 正文申請入駐

DeepSeek V4全量發布已進入最后倒計時

2026-04-13 18:32:43　來源: ZAKER科技

廣東舉報

分享至

4月，據知情人士透露，DeepSeek創始人梁文鋒在內部溝通中首次明確，新一代旗艦大模型DeepSeek V4計劃于4月下旬正式發布。

V4的核心突破集中在算力、架構適配與功能升級三大方面。

算力適配突破：全鏈路 "去 CUDA 化" 的里程碑嘗試。

消息顯示，該模型在推理階段將首次全面適配華為昇騰等國產AI芯片，成為國內首個在全鏈路算力上旨在徹底擺脫對英偉達CUDA生態依賴的萬億級大模型。

市場對V4發布的預期已經產生了實際影響。據報道，為迎接新模型的集成與部署，阿里巴巴、字節跳動、騰訊等國內科技巨頭已提前預訂了數十萬片新一代AI算力芯片，計劃通過各自的云服務平臺提供基于DeepSeek V4的模型服務。

核心架構設計根據爆料，該模型總參數達到萬億級別，采用混合專家（MoE）稀疏激活架構，每次推理僅激活約370億參數。行業分析指出，這種設計使推理速度較V3提升約35倍、能耗降低約40%，推理成本僅為GPT-4的七十分之一。

同時，V4支持約百萬Token的無損上下文處理，較V3系列實現質的飛躍，可一次性處理數本書籍或超長代碼庫，大幅提升復雜場景處理能力。此外，V4全面運行于國產AI芯片，底層代碼完成生態遷移，適配相關框架，延續了DeepSeek的自主可控發展思路，且計劃以Apache 2.0協議開源，支持企業自主部署與二次開發。

日前，4月8日凌晨DeepSeek網頁端及APP悄然上線分層模式。新增“專家模式”，這是其首次引入產品端模式分層設計，外界認為這屬于V4灰度測試的一部分。

快速模式：主打即時響應，適配日常對話與輕量場景，支持圖片及文件文字識別。

專家模式：聚焦代碼生成、數學推理等復雜任務，高峰時段需排隊等待。

界面中還有“視覺”第三選項正在灰度測試，業內普遍認為這是V4原生多模態能力的預演，也是算力精細化調度的落地嘗試。

而官方API仍以2025年12月更新的V3.2為主，但V4已進入全網灰度測試階段，網頁端“體驗DeepSeek V3.2”的標識也已消失。

近期DeepSeek曾經歷服務波動，成為V4上線前的小插曲。

其實早在3月底，其網頁、App及API接口連續三天出現異常，最長中斷時長近12小時，創下成立以來單次服務中斷紀錄。目前所有服務已全面恢復，業內人士推測，此次故障或與V4上線前的壓力測試有關，用于驗證模型集群穩定性與成本邊界。

一邊籌備V4上線，一邊DeepSeek內部也在經歷重要調整。

自2025年秋天起，梁文鋒開始更多提及“產品化和商業化”，公司已組建數十人的產品團隊，并開放產品、設計及行政等崗位招聘，適配團隊規模擴大需求。隨著同類企業上市后市值攀升，DeepSeek此前未融資、無明確估值的模式正帶來內部壓力，員工手中未定價的期權價值成疑，梁文鋒近期已著手考慮公司估值問題。此外，去年底至今，包括數位核心技術作者在內的多名核心成員先后離職。

業內普遍認為，V4的正式發布有望延續這一優勢，進一步鞏固DeepSeek在全球大模型競爭中的領先地位。

來源：布谷財經

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.