4月,據知情人士透露,DeepSeek創始人梁文鋒在內部溝通中首次明確,新一代旗艦大模型DeepSeek V4計劃于4月下旬正式發布。
![]()
V4的核心突破集中在算力、架構適配與功能升級三大方面。
算力適配突破:全鏈路 "去 CUDA 化" 的里程碑嘗試。
消息顯示,該模型在推理階段將首次全面適配華為昇騰等國產AI芯片,成為國內首個在全鏈路算力上旨在徹底擺脫對英偉達CUDA生態依賴的萬億級大模型。
市場對V4發布的預期已經產生了實際影響。據報道,為迎接新模型的集成與部署,阿里巴巴、字節跳動、騰訊等國內科技巨頭已提前預訂了數十萬片新一代AI算力芯片,計劃通過各自的云服務平臺提供基于DeepSeek V4的模型服務。
核心架構設計根據爆料,該模型總參數達到萬億級別,采用混合專家(MoE)稀疏激活架構,每次推理僅激活約370億參數。行業分析指出,這種設計使推理速度較V3提升約35倍、能耗降低約40%,推理成本僅為GPT-4的七十分之一。
同時,V4支持約百萬Token的無損上下文處理,較V3系列實現質的飛躍,可一次性處理數本書籍或超長代碼庫,大幅提升復雜場景處理能力。此外,V4全面運行于國產AI芯片,底層代碼完成生態遷移,適配相關框架,延續了DeepSeek的自主可控發展思路,且計劃以Apache 2.0協議開源,支持企業自主部署與二次開發。
日前,4月8日凌晨DeepSeek網頁端及APP悄然上線分層模式。新增“專家模式”,這是其首次引入產品端模式分層設計,外界認為這屬于V4灰度測試的一部分。
快速模式:主打即時響應,適配日常對話與輕量場景,支持圖片及文件文字識別。
專家模式:聚焦代碼生成、數學推理等復雜任務,高峰時段需排隊等待。
界面中還有“視覺”第三選項正在灰度測試,業內普遍認為這是V4原生多模態能力的預演,也是算力精細化調度的落地嘗試。
而官方API仍以2025年12月更新的V3.2為主,但V4已進入全網灰度測試階段,網頁端“體驗DeepSeek V3.2”的標識也已消失。
近期DeepSeek曾經歷服務波動,成為V4上線前的小插曲。
其實早在3月底,其網頁、App及API接口連續三天出現異常,最長中斷時長近12小時,創下成立以來單次服務中斷紀錄。目前所有服務已全面恢復,業內人士推測,此次故障或與V4上線前的壓力測試有關,用于驗證模型集群穩定性與成本邊界。
一邊籌備V4上線,一邊DeepSeek內部也在經歷重要調整。
自2025年秋天起,梁文鋒開始更多提及“產品化和商業化”,公司已組建數十人的產品團隊,并開放產品、設計及行政等崗位招聘,適配團隊規模擴大需求。隨著同類企業上市后市值攀升,DeepSeek此前未融資、無明確估值的模式正帶來內部壓力,員工手中未定價的期權價值成疑,梁文鋒近期已著手考慮公司估值問題。此外,去年底至今,包括數位核心技術作者在內的多名核心成員先后離職。
業內普遍認為,V4的正式發布有望延續這一優勢,進一步鞏固DeepSeek在全球大模型競爭中的領先地位。
來源:布谷財經
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.