无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

DeepSeek最新論文:如何讓大模型跑得更快?梁文鋒署名

0
分享至

當行業(yè)在討論誰的模型更聰明時,DeepSeek仍然把目光投向更現(xiàn)實的問題:如何讓模型更快。

6月27日,DeepSeek官方在Github低調(diào)更新了一篇最新論文,介紹其推理加速框架DSpark,試圖解決大語言模型在高并發(fā)場景下的推理效率瓶頸。

從作者署名來看,這篇論文由DeepSeek與北京大學聯(lián)合發(fā)布,DeepSeek創(chuàng)始人梁文鋒也位列作者名單。在論文中,團隊開源了DSpark模型權(quán)重,并同步發(fā)布了面向推測解碼、由算法驅(qū)動的訓練代碼倉庫DeepSpec。


DeepSeek最新論文截圖

此次論文仍是DeepSeek一貫的技術(shù)派風格,論文標題就較為晦澀——《DSpark:基于置信度調(diào)度的半自回歸生成推測解碼》(《DSpark:Confidence-Scheduled Speculative Decoding with Semi-Autoregressive Generation》)。

在論文中,DeepSeek首先解釋了需要解決的問題。大語言模型采用自回歸方式生成文本:每一個新詞元(token)的生成,都需要基于全部前置詞元完成一次完整前向傳播,結(jié)果是輸出越長,等待越久。由此帶來GPU利用率低下、用戶等待時間過長的問題,這是大語言模型線上服務(wù)的核心性能瓶頸,在實時對話助手、多輪智能體工作流等低時延敏感場景中尤為突出。

目前的主流方案分為自回歸草稿模型(Eagle3)、并行草稿模型(DFlash)兩條路線,二者各有缺陷,包括生成質(zhì)量瓶頸和系統(tǒng)效率瓶頸等,且現(xiàn)有方案均缺乏負載自適應(yīng)校驗機制。

基于此,DeepSeek提出DSpark推測解碼框架,采用半自回歸架構(gòu),通過兩套互補機制,解決草稿生成與校驗環(huán)節(jié)的權(quán)衡矛盾,將高吞吐并行生成與自適應(yīng)負載感知校驗機制融為一體。

根據(jù)論文,在數(shù)學推理、代碼生成、日常閑聊三類任務(wù)的受控離線基準測試中,相較于自回歸草稿模型與并行草稿模型,Dspark框架能夠大幅提升單輪平均可接受詞元長度。

DeepSeek已經(jīng)將DSpark部署到DeepSeek-V4在線服務(wù)系統(tǒng)中,并基于真實用戶流量評估其實際性能。結(jié)果顯示,相較于現(xiàn)有生產(chǎn)環(huán)境基線系統(tǒng)MTP-1,在相同吞吐量條件下,DSpark將用戶端生成速度提升了60%-85%。

此外,DeepSeek也將這一框架部署在其他模型上,以阿里旗下的Qwen3-4B、8B、14B三個模型為例,相較于自回歸草稿模型,DSpark平均單輪可接受詞元長度分別提升了30.9%、26.7%、30%;相較于并行草稿模型,DSpark分別提升了16.3%、18.4%、18.3%。

從技術(shù)角度來看,這篇論文的主要價值在于,通過算法創(chuàng)新顯著提升了模型的推理生成速度。在當前大模型行業(yè)逐漸走向落地的背景下,誰能更便宜、更快速地輸出結(jié)果,也是一項重要的競爭力。此外,通過開源,DeepSeek也再次推動了社區(qū)發(fā)展。

“AI Infra再次被DeepSeek加速了?!痹谏缃黄脚_,有開發(fā)者評價道。也有用戶認為,DeepSeek最讓人佩服的點在于,模型迭代的同時,推理基礎(chǔ)設(shè)施也在同步更新,發(fā)布V4時,連推理優(yōu)化一起發(fā),有論文也有代碼,還驗證了跨模型通用性。

即便近期頻頻傳出融資消息,未來可能需要走向商業(yè)化,但通過這一開源,DeepSeek似乎在證明自己仍會堅持開源初心。

責任編輯:李曦_NN2587

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
曝馮小剛《抓特務(wù)》現(xiàn)場打路人手機,現(xiàn)場畫面曝光,小剛一言不發(fā)

曝馮小剛《抓特務(wù)》現(xiàn)場打路人手機,現(xiàn)場畫面曝光,小剛一言不發(fā)

四斤
2026-06-26 15:41:00
海清現(xiàn)身周杰倫演唱會,發(fā)際線后移,兒子渾身肌肉,齜牙假笑靦腆

海清現(xiàn)身周杰倫演唱會,發(fā)際線后移,兒子渾身肌肉,齜牙假笑靦腆

曉銊就是我
2026-06-28 09:47:54
Nice!斯瑪特!火箭,爽了!

Nice!斯瑪特!火箭,爽了!

技巧君侃球
2026-06-27 23:42:22
大衣哥再次登上熱搜!演出結(jié)束后與友人聚餐,面前放滿光瓶白酒,引網(wǎng)友熱議

大衣哥再次登上熱搜!演出結(jié)束后與友人聚餐,面前放滿光瓶白酒,引網(wǎng)友熱議

喜歡歷史的阿繁
2026-06-28 09:14:07
九華山美女道士,靠身體施法“日進斗金”,8個男徒弟曝光內(nèi)幕

九華山美女道士,靠身體施法“日進斗金”,8個男徒弟曝光內(nèi)幕

蘇大強專欄
2025-05-08 15:16:18
美團回應(yīng)“帶娃送外賣”等視頻:經(jīng)核實,“小洪”3月至今完成19單,發(fā)布15條視頻并開通帶貨功能、定期直播;提醒MCN不要策劃苦情劇本

美團回應(yīng)“帶娃送外賣”等視頻:經(jīng)核實,“小洪”3月至今完成19單,發(fā)布15條視頻并開通帶貨功能、定期直播;提醒MCN不要策劃苦情劇本

極目新聞
2026-06-26 17:42:55
一部被否掉的科幻爛劇,如何把馬修·派瑞送進《老友記》

一部被否掉的科幻爛劇,如何把馬修·派瑞送進《老友記》

固件更新中
2026-06-27 01:18:17
太無恥!許家印副手向法院“哭窮”:我一個月要花30萬

太無恥!許家印副手向法院“哭窮”:我一個月要花30萬

說財貓
2026-06-28 06:04:47
穆里尼奧笑了!皇馬巨星世界杯完成蛻變,伯納烏下賽季將徹底盤活

穆里尼奧笑了!皇馬巨星世界杯完成蛻變,伯納烏下賽季將徹底盤活

瀾歸序
2026-06-28 08:48:01
醫(yī)生發(fā)現(xiàn):每天早起后先排便的人,用不了半年,身體或迎來5改變

醫(yī)生發(fā)現(xiàn):每天早起后先排便的人,用不了半年,身體或迎來5改變

任醫(yī)生聊健康
2026-06-08 20:00:48
南方主雨帶明起北抬,多地高溫在線需注意防暑,近期天氣一覽

南方主雨帶明起北抬,多地高溫在線需注意防暑,近期天氣一覽

極目新聞
2026-06-28 09:13:48
斯卡洛尼:梅西將在末輪替補,目標是讓球隊以同樣的方式比賽

斯卡洛尼:梅西將在末輪替補,目標是讓球隊以同樣的方式比賽

懂球帝
2026-06-27 17:30:44
手心攥滿冷汗:只要民主剛果取勝,韓國就可以結(jié)束煎熬回家了

手心攥滿冷汗:只要民主剛果取勝,韓國就可以結(jié)束煎熬回家了

側(cè)身凌空斬
2026-06-28 07:29:17
塞爾維亞總統(tǒng)武契奇:將在數(shù)周后辭職

塞爾維亞總統(tǒng)武契奇:將在數(shù)周后辭職

新京報
2026-06-28 07:55:16
中美都不忍了,一個直接加稅一個直接斷交,法國歐盟這次惹到硬茬

中美都不忍了,一個直接加稅一個直接斷交,法國歐盟這次惹到硬茬

縱擁千千晚星
2026-06-28 02:06:08
上海警方偵破碎尸案件,遇害女子原來死有余辜 | 大案紀實

上海警方偵破碎尸案件,遇害女子原來死有余辜 | 大案紀實

深夜探案館
2026-06-28 02:01:06
300054,高端光刻膠新增批量訂單,股價創(chuàng)歷史新高

300054,高端光刻膠新增批量訂單,股價創(chuàng)歷史新高

數(shù)據(jù)寶
2026-06-28 08:12:12
學歷嚴重貶值!底層家庭到底還有沒有必要供孩子讀書…

學歷嚴重貶值!底層家庭到底還有沒有必要供孩子讀書…

曹莽看世界
2026-06-27 17:50:14
不許城市變“伊斯蘭堡”!丹麥擔憂伊斯蘭化,將重啟禁止宣禮調(diào)查

不許城市變“伊斯蘭堡”!丹麥擔憂伊斯蘭化,將重啟禁止宣禮調(diào)查

全城探秘
2026-06-27 15:12:24
一場1-0讓世界冠軍恥辱出局,世界杯黑馬再破紀錄,韓國坐享其成

一場1-0讓世界冠軍恥辱出局,世界杯黑馬再破紀錄,韓國坐享其成

球盲百小易
2026-06-27 13:01:18
2026-06-28 11:08:49
第一財經(jīng)資訊 incentive-icons
第一財經(jīng)資訊
第一財經(jīng)官方賬號
257423文章數(shù) 622831關(guān)注度
往期回顧 全部

科技要聞

DeepSeek最新論文:如何讓大模型跑得更快

頭條要聞

牛彈琴:協(xié)議就是用來撕毀的 果然美伊又猛烈打起來了

頭條要聞

牛彈琴:協(xié)議就是用來撕毀的 果然美伊又猛烈打起來了

體育要聞

世界杯最火門將,站到了阿根廷和梅西面前

娛樂要聞

白玉蘭獎落幕,唯她被罵慘

財經(jīng)要聞

兩只股票撐起的韓國股市,半年熔斷?33 次

汽車要聞

搭載華為乾崑ADS 5 全新猛士M817上市售29.99萬起

態(tài)度原創(chuàng)

藝術(shù)
游戲
教育
數(shù)碼
軍事航空

藝術(shù)要聞

看完他的局部,我原諒了整個世界的不完美

有人試圖以數(shù)百美元高價轉(zhuǎn)售《GTA 6》預(yù)購訂單

教育要聞

文科沒前途嗎?文科教授談高考志愿:時代變了,老眼光要改!

數(shù)碼要聞

聯(lián)想拯救者神秘新平板真機曝光:50MP單攝+環(huán)形RGB

軍事要聞

黎以美達成三方框架協(xié)議

無障礙瀏覽 進入關(guān)懷版