无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

DeepSeek最新論文:如何讓大模型跑得更快?梁文鋒署名

0
分享至

當(dāng)行業(yè)在討論誰(shuí)的模型更聰明時(shí),DeepSeek仍然把目光投向更現(xiàn)實(shí)的問題:如何讓模型更快。

6月27日,DeepSeek官方在Github低調(diào)更新了一篇最新論文,介紹其推理加速框架DSpark,試圖解決大語(yǔ)言模型在高并發(fā)場(chǎng)景下的推理效率瓶頸。

從作者署名來看,這篇論文由DeepSeek與北京大學(xué)聯(lián)合發(fā)布,DeepSeek創(chuàng)始人梁文鋒也位列作者名單。在論文中,團(tuán)隊(duì)開源了DSpark模型權(quán)重,并同步發(fā)布了面向推測(cè)解碼、由算法驅(qū)動(dòng)的訓(xùn)練代碼倉(cāng)庫(kù)DeepSpec。


DeepSeek最新論文截圖

此次論文仍是DeepSeek一貫的技術(shù)派風(fēng)格,論文標(biāo)題就較為晦澀——《DSpark:基于置信度調(diào)度的半自回歸生成推測(cè)解碼》(《DSpark:Confidence-Scheduled Speculative Decoding with Semi-Autoregressive Generation》)。

在論文中,DeepSeek首先解釋了需要解決的問題。大語(yǔ)言模型采用自回歸方式生成文本:每一個(gè)新詞元(token)的生成,都需要基于全部前置詞元完成一次完整前向傳播,結(jié)果是輸出越長(zhǎng),等待越久。由此帶來GPU利用率低下、用戶等待時(shí)間過長(zhǎng)的問題,這是大語(yǔ)言模型線上服務(wù)的核心性能瓶頸,在實(shí)時(shí)對(duì)話助手、多輪智能體工作流等低時(shí)延敏感場(chǎng)景中尤為突出。

目前的主流方案分為自回歸草稿模型(Eagle3)、并行草稿模型(DFlash)兩條路線,二者各有缺陷,包括生成質(zhì)量瓶頸和系統(tǒng)效率瓶頸等,且現(xiàn)有方案均缺乏負(fù)載自適應(yīng)校驗(yàn)機(jī)制。

基于此,DeepSeek提出DSpark推測(cè)解碼框架,采用半自回歸架構(gòu),通過兩套互補(bǔ)機(jī)制,解決草稿生成與校驗(yàn)環(huán)節(jié)的權(quán)衡矛盾,將高吞吐并行生成與自適應(yīng)負(fù)載感知校驗(yàn)機(jī)制融為一體。

根據(jù)論文,在數(shù)學(xué)推理、代碼生成、日常閑聊三類任務(wù)的受控離線基準(zhǔn)測(cè)試中,相較于自回歸草稿模型與并行草稿模型,Dspark框架能夠大幅提升單輪平均可接受詞元長(zhǎng)度。

DeepSeek已經(jīng)將DSpark部署到DeepSeek-V4在線服務(wù)系統(tǒng)中,并基于真實(shí)用戶流量評(píng)估其實(shí)際性能。結(jié)果顯示,相較于現(xiàn)有生產(chǎn)環(huán)境基線系統(tǒng)MTP-1,在相同吞吐量條件下,DSpark將用戶端生成速度提升了60%-85%。

此外,DeepSeek也將這一框架部署在其他模型上,以阿里旗下的Qwen3-4B、8B、14B三個(gè)模型為例,相較于自回歸草稿模型,DSpark平均單輪可接受詞元長(zhǎng)度分別提升了30.9%、26.7%、30%;相較于并行草稿模型,DSpark分別提升了16.3%、18.4%、18.3%。

從技術(shù)角度來看,這篇論文的主要價(jià)值在于,通過算法創(chuàng)新顯著提升了模型的推理生成速度。在當(dāng)前大模型行業(yè)逐漸走向落地的背景下,誰(shuí)能更便宜、更快速地輸出結(jié)果,也是一項(xiàng)重要的競(jìng)爭(zhēng)力。此外,通過開源,DeepSeek也再次推動(dòng)了社區(qū)發(fā)展。

“AI Infra再次被DeepSeek加速了。”在社交平臺(tái),有開發(fā)者評(píng)價(jià)道。也有用戶認(rèn)為,DeepSeek最讓人佩服的點(diǎn)在于,模型迭代的同時(shí),推理基礎(chǔ)設(shè)施也在同步更新,發(fā)布V4時(shí),連推理優(yōu)化一起發(fā),有論文也有代碼,還驗(yàn)證了跨模型通用性。

即便近期頻頻傳出融資消息,未來可能需要走向商業(yè)化,但通過這一開源,DeepSeek似乎在證明自己仍會(huì)堅(jiān)持開源初心。

責(zé)任編輯:李曦_NN2587

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
葡萄牙0-0平局引爭(zhēng)議,C羅遭嘲諷,飯圈現(xiàn)象引思考

葡萄牙0-0平局引爭(zhēng)議,C羅遭嘲諷,飯圈現(xiàn)象引思考

陳秣愛釣魚
2026-06-28 10:03:27
美麗的背影:那不是離開,是正在走向自己的路

美麗的背影:那不是離開,是正在走向自己的路

疾跑的小蝸牛
2026-06-28 23:49:33
前水晶宮老板:不敢相信紐卡竟沒有為安德森設(shè)置二次轉(zhuǎn)會(huì)分成

前水晶宮老板:不敢相信紐卡竟沒有為安德森設(shè)置二次轉(zhuǎn)會(huì)分成

懂球帝
2026-06-28 20:53:02
伊朗要變天了!穆杰塔巴可能已失去所有權(quán)力,三分天下格局形成?

伊朗要變天了!穆杰塔巴可能已失去所有權(quán)力,三分天下格局形成?

驚視
2026-06-26 05:59:36
世界杯48強(qiáng)最水球隊(duì)出爐:3連敗狂丟12球墊底!7次參賽都小組出局

世界杯48強(qiáng)最水球隊(duì)出爐:3連敗狂丟12球墊底!7次參賽都小組出局

球場(chǎng)沒跑道
2026-06-28 16:39:10
AI狂歡,老登吃土!港股更慘?答案來了

AI狂歡,老登吃土!港股更慘?答案來了

說股鯨
2026-06-28 22:15:03
被火箭隊(duì)清理,卻引6隊(duì)追逐!底薪就能簽?斯通放棄第3中鋒失算了

被火箭隊(duì)清理,卻引6隊(duì)追逐!底薪就能簽?斯通放棄第3中鋒失算了

熊哥愛籃球
2026-06-28 22:40:18
澤連斯基發(fā)現(xiàn)重大機(jī)遇,俄羅斯或已窮途末路,打好了能直接翻盤?

澤連斯基發(fā)現(xiàn)重大機(jī)遇,俄羅斯或已窮途末路,打好了能直接翻盤?

瀟湘煙雨水
2026-06-29 01:35:34
山西肉鋪傷人后續(xù):又殺害兩名顧客,3人當(dāng)場(chǎng)死亡,家屬曝隱情

山西肉鋪傷人后續(xù):又殺害兩名顧客,3人當(dāng)場(chǎng)死亡,家屬曝隱情

離離言幾許
2026-06-16 20:59:36
反擊稀土斷供,日本“最強(qiáng)”反制來了!

反擊稀土斷供,日本“最強(qiáng)”反制來了!

種花島
2026-06-28 09:37:59
廣州打網(wǎng)約車鬧大了,預(yù)估43元結(jié)賬149元,司機(jī)端基礎(chǔ)車費(fèi)才38元

廣州打網(wǎng)約車鬧大了,預(yù)估43元結(jié)賬149元,司機(jī)端基礎(chǔ)車費(fèi)才38元

小虎新車推薦員
2026-06-28 15:43:02
馬桶不用的時(shí)候,蓋子是掀開好還是關(guān)上好?很多人還不懂,看完就明白了!

馬桶不用的時(shí)候,蓋子是掀開好還是關(guān)上好?很多人還不懂,看完就明白了!

設(shè)計(jì)最前沿
2026-06-26 23:01:06
上海交大發(fā)現(xiàn):吃大蒜能在24小時(shí)內(nèi)降低60%的血糖,是真的嗎?

上海交大發(fā)現(xiàn):吃大蒜能在24小時(shí)內(nèi)降低60%的血糖,是真的嗎?

冷眼看世界728
2026-06-27 22:06:43
中美歐情況有變?中國(guó)不忍了,特朗普也不忍了,普京做夢(mèng)都該笑醒

中美歐情況有變?中國(guó)不忍了,特朗普也不忍了,普京做夢(mèng)都該笑醒

離離言幾許
2026-06-29 00:33:34
中國(guó)大使館新址驚現(xiàn)35枚“中國(guó)制造”竊聽器,外界震動(dòng)

中國(guó)大使館新址驚現(xiàn)35枚“中國(guó)制造”竊聽器,外界震動(dòng)

匹夫來搞笑
2026-06-28 19:15:42
高金素梅好樣的,確認(rèn)出手,鄭麗文迎來強(qiáng)援!四名藍(lán)委有新動(dòng)作!

高金素梅好樣的,確認(rèn)出手,鄭麗文迎來強(qiáng)援!四名藍(lán)委有新動(dòng)作!

娛樂的宅急便
2026-06-29 01:51:01
日本軍事體系全球罕見,已實(shí)現(xiàn)五大戰(zhàn)備突破,爆兵速度最值得警惕

日本軍事體系全球罕見,已實(shí)現(xiàn)五大戰(zhàn)備突破,爆兵速度最值得警惕

黑洞觀星
2026-05-08 16:29:24
衰老為何催人長(zhǎng)肚子?新研究找到脂肪干細(xì)胞推手

衰老為何催人長(zhǎng)肚子?新研究找到脂肪干細(xì)胞推手

萬物皆可科普啊
2026-06-28 03:02:57
日本終于有人敢捅破窗戶紙!臺(tái)灣問題不解決,日本永遠(yuǎn)別想翻身!

日本終于有人敢捅破窗戶紙!臺(tái)灣問題不解決,日本永遠(yuǎn)別想翻身!

阿纂看事
2026-06-29 01:50:28
網(wǎng)購(gòu)時(shí)要注意了,“旗艦店”和“官方店”一字之差,天壤地別!

網(wǎng)購(gòu)時(shí)要注意了,“旗艦店”和“官方店”一字之差,天壤地別!

另子維愛讀史
2026-05-25 07:55:09
2026-06-29 04:43:00
第一財(cái)經(jīng)資訊 incentive-icons
第一財(cái)經(jīng)資訊
第一財(cái)經(jīng)官方賬號(hào)
257474文章數(shù) 622838關(guān)注度
往期回顧 全部

科技要聞

DeepSeek最新論文:如何讓大模型跑得更快

頭條要聞

四川宜賓市高縣發(fā)生5.5級(jí)地震 震中距宜賓28公里

頭條要聞

四川宜賓市高縣發(fā)生5.5級(jí)地震 震中距宜賓28公里

體育要聞

兩周飛5萬公里!因凡蒂諾遭環(huán)保人士猛批

娛樂要聞

曾沛慈拿下《乘風(fēng)2026》年度總冠軍

財(cái)經(jīng)要聞

省錢,我只服梁文鋒

汽車要聞

搭載華為乾崑六件套 東風(fēng)奕派M8預(yù)售19.98萬起

態(tài)度原創(chuàng)

旅游
家居
數(shù)碼
本地
公開課

旅游要聞

不用遠(yuǎn)行!昆明人的周末救贖,被這片免費(fèi)濕地狠狠治愈

家居要聞

綠意盎然 自然之境

數(shù)碼要聞

古爾曼:預(yù)計(jì)蘋果今年發(fā)布搭載M5 Ultra芯片的Mac Studio

本地新聞

世界杯球迷節(jié):比球賽更好玩的派對(duì)

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版