无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

梁文鋒署名論文!DeepSeek首輪融資后大動作:生成速度大漲85%

0
分享至


智東西
作者 李水青
編輯 心緣

智東西6月27日報道,繼完成500億元融資后,今日,DeepSeek首次放出開源新成果!

剛剛,DeepSeek開源了一套讓現有模型跑得更快的工程方案:推出DeepSeek-V4-Pro-DSpark、DeepSeek-V4-Flash-DSpark模型,并開源推測解碼(Speculative Decoding)框架DSpark以及推測解碼訓練框架DeepSpec


▲DeepSeek-V4-Pro-DSpark開源上新頁面截圖

根據同步上傳的梁文鋒署名、聯合北京大學完成的論文《DSpark:基于半自回歸生成的置信度調度推測解碼(DSpark: Confidence-Scheduled Speculative Decoding with Semi-Autoregressive Generation)》,將DSpark部署在DeepSeek-V4線上服務系統、承接真實用戶流量時,它有效減少了無效校驗帶來的算力浪費。

相較于成熟的生產基線方案(MTP-1),在保持整體吞吐不變的前提下,DSpark把單用戶生成速度提升60%-85%。更關鍵的是,在嚴格交互時延約束下,DSpark避免了吞吐率大幅滑坡,實現了以往無法達成的性能檔位,推高了整套服務系統的帕累托最優邊界。


▲DSpark論文截圖

Hugging Face地址:
https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro-DSpark
GitHub地址:
https://github.com/deepseek-ai/DeepSpec
論文地址:
https://github.com/deepseek-ai/DeepSpec/blob/main/DSpark_paper.pdf

根據Hugging Face上的模型卡,DeepSeek-V4-Pro-DSpark和DeepSeek-V4-Flash-DSpark并非新模型,而是在原有版本的基礎上,增加了一個推測解碼模塊,用以加快推理速度、降低成本。

推測解碼,簡單來說,是一種大模型推理無損技術,核心流程為先打草稿、后驗證。其將草稿生成與目標模型校驗解耦,以此加速大語言模型推理。

當前主流并行草稿器能夠單次前向運算生成超長token序列,但由于token之間缺少依賴關系,草稿后續內容的通過率會快速下滑。此外,如果對整段長候選序列無差別校驗,會把寶貴的批次算力浪費在極易被駁回的token上,從而導致高并發服務場景下整體吞吐率大幅下降。

為此,DeepSeek提出DSpark推測解碼框架,把高吞吐并行生成與自適應、感知負載的校驗機制結合在一起。為保證草稿質量,DSpark采用半自回歸架構:將并行主干網絡與輕量串行模塊相結合,建模塊內token依賴,緩解末尾內容通過率衰減問題。


▲DSpark架構與解碼流程

為優化系統運行效率,DSpark引入置信度調度校驗機制:根據預估的前綴通過概率與引擎吞吐特征,為每一條請求動態調整校驗長度。在多領域離線基準測試中,相比當前最優的自回歸草稿器與并行草稿器,DSpark能夠顯著提升有效通過序列長度。

如下圖所示,針對這DeepSeek-V4-Pro-DSpark和DeepSeek-V4-Flash-DSpark兩款模型,DeepSeek提供了一個最小推理示例。


▲DeepSeek提供的最小推理示例

總的來說,用戶在部署DSpark版本的DeepSeek-V4模型后,有望在生成速度、首token延遲、并發能力等方面獲得體驗提升。

再來看看DeepSpec,這是一個用于訓練和評估推測性解碼草稿模型(Draft Model)的全棧代碼庫,或者說工具鏈,它包含數據準備工具、草稿模型實現、訓練代碼和評估腳本,支持MIT許可。


▲DeepSpec開源上新頁面截圖

DeepSpec的工作流程如下,它會按順序運行各個階段,每個階段的輸出為下一個階段提供反饋:

1、數據準備:下載提示,重新生成目標答案,并構建目標緩存。
2、訓練:針對緩存的目標輸出訓練一個模型。
3、評估:在基準任務上衡量推測解碼的接受程度。

目前,DeepSpec支持的算法包括三個草稿模型:DSpark、DFlash和Eagle3。

DeepSpec團隊還在最后向SpecForge(Apache-2.0)、DFlash(MIT)以及Qwen3和Gemma發文致謝。


▲DeepSeek致謝情況

可以看到,DeepSeek不僅發布相關模型,還開放完整的訓練框架,供開發者和企業用這套工具給自己的Qwen3、Gemma等模型訓練草稿模型。

結語:推理重要度提高,考驗工程化能力

DeepSeek本次發布雖然低調,也不是新模型迭代,但實際含金量不低。DeepSeek發布了一套讓現有模型跑得更快的工程方案,有望帶來更快更低成本的推理體驗,并降低推測解碼的落地門檻。

大模型競賽已進入訓練與推理并重的系統博弈階段。本次也是DeepSeek完成融資后,率先落子推理優化賽道。戰略意圖也很明確:不僅要加速模型迭代和產品化,還要向下搶占算力效率競爭制高點。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
章亞若臨終告妹:桂林生子,實情與記載不同,母親代做深遠決定

章亞若臨終告妹:桂林生子,實情與記載不同,母親代做深遠決定

人生錄
2026-06-24 14:31:00
2026-06-27 18:40:49
智東西 incentive-icons
智東西
智東西,AI產業新媒體,專注報道人工智能的前沿技術發展,和技術應用帶來的千行百業產業變革。
12142文章數 117112關注度
往期回顧 全部

財經要聞

OpenAI推遲IPO重創軟銀!

頭條要聞

兩不滿14歲女孩稱被強奸警方立案后撤案 辦案刑警回應

頭條要聞

兩不滿14歲女孩稱被強奸警方立案后撤案 辦案刑警回應

體育要聞

世界杯最火門將,站到了阿根廷和梅西面前

娛樂要聞

四提白玉蘭終封后,楊紫:仍覺不真實

科技要聞

GPT-5.6發布,你暫時用不了!Mythos也放行

汽車要聞

搭載華為乾崑ADS 5 全新猛士M817上市售29.99萬起

態度原創

旅游
房產
本地
公開課
軍事航空

旅游要聞

上海小囡集合!美影廠變身開放式園區!2家文創店+3大主題展超好逛!打卡攻略

房產要聞

全國高考大放水,300分就能上本科!論上岸率,海南沒輸過!

本地新聞

世界杯球迷節:比球賽更好玩的派對

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

黎以美達成三方框架協議

無障礙瀏覽 進入關懷版