剛剛,期待已久的DeepSeek-V4 終于更新了。
DeepSeek 正式上線并開源了 DeepSeek-V4 的預覽版,分為 Pro 和 Flash 兩個版本。DeepSeek-V4 擁有百萬字超長上下文,在 Agent 能力、世界知識和推理性能上均實現國內與開源領域的領先。
這次的更新力度不小,有兩個核心變化:一是,V4 擁有 1M 的超長上下文,1M 上下文已經成為了標配;二是,Agent 能力大幅的增強。
DeepSeek 官方提到,V4-Pro 在 Agentic Coding 評測中已經達到了當前開源模型最佳水平,也是公司內部員工日常在使用的 Agentic Coding 模型。據內部員工評測,V4-Pro 的反饋體驗優于 Sonnet 4.5,交付質量接近 Opus 4.6 非思考模式。
目前,DeepSeek-V4 已經在官網、官方 App 中上線,用戶可以直接體驗。同時,API 也已同步上線,model_name 改為 deepseek-v4-pro 或 deepseek-v4-flash 即可調用。
??關注 Founder Park,最及時最干貨的創業分享
Founder Park 正在持續尋找值得被看見的 AI 團隊與項目。
我們將通過「AI 產品市集」、內容報道、社群分發等方式,幫你觸達早期用戶、獲得真實反饋,以及建立關鍵連接。
如果你正在做 AI 相關的事,歡迎和我們聊聊。
01兩款新模型:Flash、Pro 版本
此次更新的 DeepSeek-V4 模型,按大小分為兩個版本:DeepSeek-V4-Pro 和 DeepSeek-V4-Flash。
![]()
V4-Pro 擁有 1.6T 總參數、49B 激活參數;V4-Flash 為 284B 總參數、13B 激活參數,兩款模型均原生支持 1M token 的上下文長度。
此外,V4-Flash 在 32T tokens 上完成預訓練,V4-Pro 則在 33T tokens 上完成預訓練。
DeepSeek-V4-Pro是這次發布的旗艦版本,各項能力均對標頂級閉源模型。
![]()
其中,Agent 能力是突出的升級方向。在 Agentic Coding 評測中,V4-Pro 已達到當前開源模型最佳水平,并在其他 Agent 相關評測中同樣表現優異。據 DeepSeek 內部員工評測反饋,使用體驗優于 Sonnet 4.5,交付質量接近 Opus 4.6 非思考模式,但與 Opus 4.6 思考模式仍存在一定差距。
值得一提的是,V4-Pro 還針對 Claude Code、OpenClaw、OpenCode、CodeBuddy 等主流 Agent 產品進行了專項適配和優化,在代碼任務、文檔生成任務等方面的表現均有提升。
在世界知識方面,V4-Pro 在測評中大幅領先其他開源模型,僅稍遜于頂尖閉源模型 Gemini-Pro-3.1。
推理性能同樣亮眼,在數學、STEM、競賽型代碼的測評中,V4-Pro 超越了當前所有已公開評測的開源模型,取得了比肩世界頂級閉源模型的成績。
![]()
DeepSeek-V4-Flash則是更多面向對成本和速度更敏感的場景。相比于 V4-Pro,V4-Flash 在世界知識儲備方面稍遜,但推理能力接近。
由于模型參數和激活更小,Flash 版能夠提供更加快捷、經濟的 API 服務。在 Agent 評測中,V4-Flash 在簡單任務上與 V4-Pro 相當,但在高難度任務上仍有一定差距。
02提出全新的注意力機制
一百萬上下文成為標配
DeepSeek 官方特別提到,DeepSeek-V4 使用了一種全新的注意力機制,在 token 維度進行壓縮,結合 DSA 稀疏注意力(DeepSeek Sparse Attention),實現了全球領先的長上下文能力。同時,相比傳統方法大幅降低了對計算和顯存的需求。從現在起,一百萬上下文將是 DeepSeek 所有官方服務的標配。
![]()
DeepSeek-V4 和 DeepSeek-V3.2 的計算量和顯存容量隨上下文長度的變化
DeepSeek-V4 的技術報告中提到,這次架構升級包含了三項核心創新:
CSA+HCA 混合注意力機制(Compressed Sparse Attention 與 Heavily Compressed Attention),這是實現超長上下文高效處理的核心所在;
mHC(Manifold-Constrained Hyper-Connections,流形約束超連接),用于強化傳統殘差連接,提升信號在層間傳播的穩定性;
引入Muon 優化器,帶來更快的收斂速度與更穩定的訓練過程;
在效率層面,技術報告同樣給出了更具體的量化數據:在 1M token 上下文場景下,V4-Pro 的單 token 推理 FLOPs 僅為 DeepSeek-V3.2 的27%,KV Cache 大小僅為10%。V4-Flash 的效率提升更為激進,FLOPs 僅為10%,KV Cache 僅為7%。
03官網、App、API 同步上線,即日可用
目前,DeepSeek API 已經同步上線了 V4-Pro 和 V4-Flash,支持 OpenAI ChatCompletions 接口與 Anthropic 接口。訪問新模型時,base_url 不變,model 參數改為 deepseek-v4-pro 或 deepseek-v4-flash 即可。
V4-Pro 與 V4-Flash 最大上下文長度均為 1M,同時支持非思考模式與思考模式。其中思考模式支持通過 reasoning_effort 參數設置思考強度(high / max)。對于復雜的 Agent 場景,DeepSeek 官方建議使用思考模式并將強度設置為 max。
![]()
需要注意的是,舊有的兩個模型名 deepseek-chat 與 deepseek-reasoner 將于三個月后(2026-07-24)停止使用。當前階段內,這兩個模型名分別對應的是 deepseek-v4-flash 的非思考模式與思考模式。
更詳細的調用方式請參考官方文檔:api-docs.deepseek.com
開源權重和本地部署
DeepSeek-V4 模型開源鏈接:
https://huggingface.co/collections/deepseek-ai/deepseek-v4
https://modelscope.cn/collections/deepseek-ai/DeepSeek-V4
DeepSeek-V4 技術報告:
https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro/blob/main/DeepSeek_V4.pdf
![]()
轉載原創文章請添加微信:founderparker
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.