无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

<small id="hngjb"><tbody id="hngjb"></tbody></small>

<small id="hngjb"><tbody id="hngjb"></tbody></small>

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

省錢，我只服梁文鋒

2026-06-28 12:17:48　來源: 字母榜

北京舉報

0

分享至

DeepSeek最讓人詬病的地方就是服務器總崩，但是從現在開始，DeepSeek可能再也不會出現服務器卡頓和宕機了。

原因在于，梁文鋒掛名發表了一篇論文，標題為《DSpark：基于置信度調度的推測解碼與半自回歸生成》。按照DeepSeek的傳統，DSpark讀起來應該是D·Spark，而不是DS·park。

這是梁文鋒從2024年發表的《DeepSeek LLM》之后，他掛名發表的第12篇論文。不只是如此，DSpark這篇論文，還和梁文鋒在2010年發表的碩士畢業論文“撞車”了。

DSpark相當于是給DeepSeek裝上了加速器，對用戶來說，體感就是快、穩、不崩。

同樣質量的回答，速度直接快了60%到80%，原來等10秒的回復現在五六秒就出來.

最關鍵的是，高峰時段，DeepSeek也不會再一直“轉圈”了。

這個DSpark到底有多神奇？別急，我講給你聽。

01

DSpark到底是什么，解決了DeepSeek什么老問題

大模型生成文字這件事，本質上是一個“猜字游戲”。模型每寫一個字，都要把前面所有寫過的字重新看一遍，算一遍，才能決定下一個字該寫什么。

每寫一個字，AI就得從頭到尾跑一次，寫100個字，就要把自己寫的東西重新消化99遍。學術上，把這個“自己回歸自己”的過程，叫做“自回歸生成”。

整個過程就是現在的自己在跟上一步的自己較勁，上一步沒算完，下一步就動不了。

所以過去幾年，業界都在琢磨同一件事，能不能讓模型一口氣猜一串字？

這個思路，就是DSpark論文中提到的核心機制——投機解碼（Speculative Decoding）。

它的運行邏輯是這樣的，找一個跑得快但水平一般的模型當草稿，讓它先憑感覺一口氣猜出后面好幾個字，然后把這一串字一次性拿給大模型驗證。

大模型掃一眼，前面連續猜對的直接保留，從第一個猜錯的地方開始，大模型自己寫一個對的，草稿模型再接著往下猜。

這樣就可以確保，輸出的內容是大模型認可的，而且速度還比一個字一個字猜地要快。

業內普遍認為有兩種投機解碼。

第一種是“老實人”打法。草稿模型也一個字一個字地猜，猜完一個、看一眼前文、再猜下一個。好處是輸出質量更高，壞處是它猜得太慢了，速度跟大模型自己寫都差不多了。

第二種是不管三七二十一，刷刷刷一口氣把后面所有字全猜出來。雖然速度快，但是猜字時根本不會考慮前面完整的句子，它只看上一個字是什么。

這就導致一開始還好，但是猜字越往后，輸出質量就會越低。

論文里把這個現象叫“后綴衰減”：第一個字的正確率還行，第二個大幅下滑，到了第五個第六個基本上就是在瞎猜了。

DSpark的核心思路叫半自回歸生成。簡單來說，它把上述兩種辦法給結合在一起了。

第一步，以極快的手速嘩嘩嘩把后面的字全給你猜出來。猜完之后回過頭來檢查一遍，看看有沒有什么語句不通順、錯別字之類地。

第二步，DSpark會給每個字打個“靠譜分”，比如第一個字90分，第二個80分，第三個60分，第四個30分。但是這里有個問題，打完分之后，DSpark就知道哪個字寫錯了，如果要給它改對，相當于回到了一開始自回歸的方法當中，好不容易提高的效率，又送回去了。

所以DSpark提出了一個方法，它會提前測量好大模型在不同批大小下的處理速度，然后每個請求的草稿按靠譜分從高到低排好隊。

它先把所有請求里最高分的那一批，拿給大模型驗。

這個過程很快，因為量少。然后它問自己：要不要把第二批也加進去？加了之后大模型要多花一點時間，這批字有80%是對的，能多賺幾百個正確結果。多花的時間除以多賺的正確字，算出來一個效率值。賺了，加。第三批，60%正確率。以此類推。

根據當前服務器的忙碌程度，不忙的時候，全拿過去，能多猜對一個就多猜對一個。

如果大模型此時很忙，那就只把前幾個高分拿過去讓大模型驗，后面那些大概率錯的就別去添亂了，省下時間多服務幾個用戶。

整個過程，叫做置信度調度驗證。

之前有很多加速方案，但它們都有一個共同的毛病，那就是單用戶測起來快得不得了，一上高并發就崩。

現在的DeepSeek，一到晚上高峰就卡、就崩。

本質上就是高峰時段用戶請求多，GPU的批處理壓力極大，但之前MTP-1的投機解碼方案會把大量算力浪費在驗證那些大概率猜錯的token上。

這些token被草稿模型隨便猜出來，大模型看了一眼就駁回，但駁回的過程已經消耗了寶貴的GPU周期。

有效吞吐量被嚴重拉低，請求越積越多，排隊越來越長，用戶體驗就是卡頓甚至加載不出來。

DSpark部署后，這個問題應該會得到緩解。

實測數據顯示，在嚴格的低延遲要求下，比如V4-Flash要保證每個用戶每秒看到120個字，之前的MTP-1系統基本撐不住多少并發就崩了，而DSpark還能保持6倍以上的吞吐量。

在更常規的中等負載場景下，要求每個用戶每秒80個字，DSpark單GPU的總吞吐量從10000 token每秒提升到15100 token每秒，直接漲了51%。

02

成本打下來多少，會不會犧牲回答質量？

在AI行業，訓練成本是一次性的，推理成本卻是永續的。

怎么理解這個問題呢？你訓練一個大模型，不管你花了幾個億、幾十個億，花完就花完了。

推理不一樣，模型上線之后，用戶每問一個問題，GPU就要跑一次，這個成本7×24小時不停，用戶越多跑得越多，永遠停不下來。

這就意味著，誰能把推理成本打下來，誰就能賺錢。也可以反過來說，模型再強，如果推理成本控制不住，那么模型的規模越大，廠商死得就越快。

同樣的GPU數量，DSpark在完全不改變硬件的前提下，可以讓每個用戶的生成速度快60%到85%。

原來等10秒鐘才出來的回復，現在五六秒就出來了。

DeepSeek還給出了一個非常極端的場景。遇到熱點事件、大量用戶同時涌進來的時候，之前的系統如果扛不住，要么排隊排到用戶放棄，要么直接崩掉。擴容需要時間，GPU也不是你說加就能立刻加上的。

DSpark靠動態調度，負載一高，自動縮短驗證長度，避免占用關鍵的批處理容量。這樣就能在不擴容的情況下扛住流量尖峰。

那么問題又來了，快是快了，DeepSeek會因此而偷工減料？回答質量會不會下降？

答案是零損失。

這是投機解碼這個技術路線本身的數學性質決定的。拒絕采樣機制從數學上嚴格保證：大模型最終輸出的每一個token，它的概率分布和大模型自己一個字一個字寫出來的分布完全一致。所以單從數學驗證上來講，質量不會下降。

DSpark論文原文寫到：“the acceptance rule preserves the target distribution exactly, speculative decoding accelerates generation without any quality loss.”接納規則能夠精準完整地保留目標分布，投機解碼可在不損失輸出質量的前提下加速生成過程。

不僅如此，論文還在數學推理、代碼生成、日常對話三個領域做了離線準確率測試，和原模型沒有統計顯著差異。

線上部署之后，也沒有收到回答質量下降的用戶反饋。

而且由于草稿模型本身體積非常小，只占總計算量的不到10%，雖然多多少少會影響服務器負載，但是在51%的實測提升面前，這點負載可以忽略不計。

DeepSeek向來以便宜著稱，推理成本打下來40%之后，DeepSeek就有了更大的降價空間。

它本來的API定價就已經是行業最低的了，現在成本再降一截，token價格可能也會跟著降。甚至有可能進一步提高免費用戶的額度。

更關鍵的是，這次DeepSeek不光是發了模型權重，還把整個DeepSpec訓練框架開源了。

DeepSpec是專門用來訓練投機解碼草稿模型的統一訓練工具箱，也就是說，你可以用這套工具給自己的Qwen3、Gemma等模型訓練草稿模型。

等于把整個行業的推理成本基準線又往下拉了一個臺階。

03

堅持省錢16年

2010年，梁文鋒在浙江大學讀碩士，他的碩士論文題目叫《基于低成本PTZ攝像機的目標跟蹤算法研究》。

這個名字現在看起來非?！傲何匿h”。

當時做計算機視覺目標跟蹤的實驗室，標配是幾萬塊一臺的工業相機，精度高、可控性強。梁文鋒不買，他用的是幾百塊錢的普通民用球機。

他的論點是，硬件的差距可以用算法補。通過自研的跟蹤算法優化，他把便宜攝像頭的跟蹤精度做到了接近貴價設備的水平。

16年過去，梁文鋒依然執著于用算法給硬件省錢，可以說是相當的不忘初心了。

為什么別的大模型公司都想方設法提升性能，DeepSeek卻想要省錢？因為錢是梁文鋒自己的。

在DeepSeek完成融資后，外媒爆料稱，DeepSeek成立近三年，完全由梁文鋒創立的幻方量化用利潤養活，并且期間多次拒絕外部投資。

幻方量化2025年平均收益率高達56.55%，全年營收約86億元，梁文鋒個人持股85%，每年分紅數十億元，個人資產據估算在500億至1000億元之間。今年啟動的首輪超500億元融資中，梁文鋒個人掏了200億，占總融資額的40%，是最大單一出資方。

外部投資者的錢不直接進 DeepSeek 主體，而是先注入由梁文鋒擔任普通合伙人的有限合伙企業，外部投資方成為有限合伙人，只有收益權和財務信息查閱權，沒有任何投票權，全部股份鎖定五年，禁止轉讓和退出。

在DeepSeek，梁文鋒同時扮演投資者、管理者和研究者。

省下來的每一分成本，都是直接裝進梁文鋒自己的口袋里。

面對“多買100張GPU還是讓團隊做工程優化”這道題時，大多數人的答案都是前者?？?，并且有OpenAI和Anthropic作為開路先鋒，花的又不是自己的錢，是投資人的錢，也沒什么好心疼的。

梁文鋒選后者，因為他比任何人都清楚這張卡要跑多少token才能回本。

三個角色疊在一個人身上，產生了一個AI行業里極其罕見的決策閉環。

研究者提出“可以省”，管理者判斷“應該省”，投資者確定“自己買單也愿意省”。沒有層級匯報，沒有跨部門拉齊。

DSpark就是這條決策鏈的最新產物。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

剛剛，DeepSeek V4更新DSpark，推理速度提升80%

機器之心Pro 2026-06-28 09:52:25
6 跟貼 6
破解領域視頻數據理解難題，華為GTS提出關鍵幀動態選擇新范式

新智元 2026-06-27 10:37:58
0 跟貼 0

MLCC觀察報告：食堂里的六張面孔

鈦媒體APP 2026-06-28 08:51:17
1 跟貼 1

BrowserBC：克隆人類點擊，讓一次網頁操作轉化為所有Agent的能力

量子位 2026-06-27 20:34:19
25 跟貼 25
梁文鋒署名論文！DeepSeek首輪融資后大動作：生成速度大漲85%

智東西 2026-06-27 16:58:45
6 跟貼 6

拔電池、拆外殼、卸安卓，Google讓舊手機重生成了AI服務器

雷科技 2026-06-27 14:20:26
0 跟貼 0

Xbox 也漲價，游戲主機的便宜時代要結束了嗎？

遠觀雜記 2026-06-27 12:55:37
0 跟貼 0
玩家自制WCL本地日志解析工具，10秒出傷害統計，解決分G難題

山西三炮 2026-06-27 22:32:54
0 跟貼 0

GPT-5.6：最強的模型，最窄的門

鈦媒體APP 2026-06-27 18:00:08
1 跟貼 1
偽裝成Minecraft模組的惡意軟件，靠智能合約避開圍剿

閃存獵手 2026-06-27 04:19:52
0 跟貼 0
16臺機柜，追平高鐵驅動功率？數據中心供電拐點來了

量子位 2026-06-26 10:05:00
0 跟貼 0
臺海局勢反轉？解放臺灣戰略邏輯全拆解

一飲山河 2026-06-27 16:43:04
0 跟貼 0
謝寒冰批梁文杰邏輯錯亂：是民進黨改變兩岸現狀，不是大陸

百聞不如一鍵 2026-06-26 14:23:29
0 跟貼 0
北大哲學系主任畢業致辭：請原諒我不敢用堆砌起來的一組形容詞來祝福你們

新民周刊 2026-06-27 13:33:58
1343 跟貼 1343
全球局勢持續動蕩不安，為何中國獨享和平，深度解析背后核心邏輯

清晨的世界 2026-06-26 01:03:21
0 跟貼 0
兄弟倆開貨車跑貨運，在高速上偶遇許久未見同為貨車司機的老爸。網友：希望天下所有的爸爸都平平安安！

環球網資訊 2026-06-27 14:04:20
203 跟貼 203
俄羅斯戰略決策做對了什么？做錯了什么？

曹教員 2026-06-26 03:05:25
11 跟貼 11
英偉達年度「最危險」論文！AI自繁衍代碼，無限刷級進化

新智元 2026-06-28 12:20:04
1 跟貼 1
中國代表：絕不允許“新型軍國主義”成勢為患

新華社 2026-06-27 14:25:20
1674 跟貼 1674
這絕對是足球史上最聰明的門將！利用規則漏洞，對手氣到吃黃牌！

小雯講廢話 2026-06-28 00:54:03
1 跟貼 1
2028，RSI降臨！

新智元 2026-06-28 12:17:46
0 跟貼 0
山姆，又出事了！“蠕動的蟲子！”

今晚報 2026-06-27 17:03:00
1473 跟貼 1473
DeepSeeK 突然發布 DSpark，讓 AI 的回答不再「擠牙膏」

愛范兒 2026-06-28 13:39:43
0 跟貼 0
演員王安宇發布登報聲明：本人王安宇，不慎遺失中國傳媒大學本科畢業證書和學位證書，現聲明作廢

都市快報橙柿互動 2026-06-27 16:07:41
836 跟貼 836
解鎖年輕用戶理想座駕深度試駕新銳智慧SUV問界M6

AutoVideo 2026-06-27 23:14:55
1 跟貼 1
背完百個系統設計，首場面試為何還是垮了？

閃存獵手 2026-06-28 02:51:58
0 跟貼 0
特斯拉FSD低價破解生意盯上中國車主最高收費3萬！硬件破解有巨大安全隱患

快科技 2026-06-28 04:04:21
0 跟貼 0
小姑娘上一次哭得眼眶通紅，下一場直接颯爽過樁。最后的回眸驚艷眾人！

學申論的談妹 2026-06-27 20:52:49
118 跟貼 118
大模型高考放榜：為什么最能考試的是訊飛星火？

多鯨 2026-06-26 11:21:36
0 跟貼 0
印度人吃飯不給錢：服務器硬氣報警！

正哥說 2026-06-26 19:24:55
0 跟貼 0
為什么說梁處長兩眼一閉，連陣亡報告草稿都已經寫好了

聽風剪影 2026-06-26 12:33:09
1 跟貼 1
千覺機器人：讓觸覺成為與視覺并列的“認知模態”

鈦媒體APP 2026-06-09 09:04:46
0 跟貼 0
30分鐘人類第一人稱視頻，零樣本教會機器人雙臂操作

機器之心Pro 2026-06-14 19:58:42
0 跟貼 0
加拿大一女子與狗徒步遭遇灰熊，灰熊反復繞開女子要吃狗

南陽日報 2026-06-27 17:48:38
207 跟貼 207
論證思路題總答成“總分總”？四步拆出精準邏輯鏈

語文亦國學 2026-06-28 11:29:37
0 跟貼 0
中國新聞網｜中國黃淮海地區首個農業遙感大模型在濟南發布

天下泉城 2026-06-27 21:53:09
0 跟貼 0
80刀嫌貴？通脹算完我反而更迷糊了

渡川5 2026-06-28 11:02:18
0 跟貼 0
551部電影直接被蒸發！2025利潤75億就這？

霧野尋蹤2 2026-06-28 04:01:03
0 跟貼 0
每經熱評｜“77萬條未讀消息”背后：比“數字斷裂”更扎心的，是技術缺失的溫度

每日經濟新聞 2026-06-28 13:03:04
0 跟貼 0
你用的數學工具，可能正在讓你變笨

碳基打工人 2026-06-28 02:32:28
0 跟貼 0

今年90%的家長和“張雪峰們”都是用的AI志愿填報工具，最后反而丟掉了最大的撿漏機會

今年90%的家長和“張雪峰們”都是用的AI志愿填報工具，最后反而丟掉了最大的撿漏機會

帥領留學真話

2026-06-27 09:53:57

克羅地亞2-1加納第二出線！蘇契奇貼地斬魔笛助攻弗拉希奇制勝

克羅地亞2-1加納第二出線！蘇契奇貼地斬魔笛助攻弗拉希奇制勝

狍子歪解體壇

2026-06-28 06:59:49

身高猛漲！12歲喬治王子身高齊平凱特王妃，創下溫莎家族新紀錄

身高猛漲！12歲喬治王子身高齊平凱特王妃，創下溫莎家族新紀錄

墨印齋

2026-06-28 00:09:15

把中國游客擋在門外，高市不聽岸田勸告，中方對日本政府改了稱呼

把中國游客擋在門外，高市不聽岸田勸告，中方對日本政府改了稱呼

臨云史策

2026-06-28 13:04:35

烏媒：基輔遭彈道導彈襲擊，傳出強烈爆炸聲

烏媒：基輔遭彈道導彈襲擊，傳出強烈爆炸聲

環球網資訊

2026-06-28 07:37:04

首位90后白玉蘭視后誕生：不只是楊紫的勝利，更是代際交替的信號

首位90后白玉蘭視后誕生：不只是楊紫的勝利，更是代際交替的信號

極客電影

2026-06-27 21:27:38

王濛成團夜！把獎杯放在腳邊，缺席成團后采訪，原因曝光

王濛成團夜！把獎杯放在腳邊，缺席成團后采訪，原因曝光

情感大頭說說

2026-06-28 09:51:20

日本慌了！日本陷入唐朝以來千年最大敗局！百年優勢崩塌，無解

日本慌了！日本陷入唐朝以來千年最大敗局！百年優勢崩塌，無解

魔都姐姐雜談

2026-06-28 00:03:11

歷史唯一沒有農民起義的朝代，每任帝王都是明君，人口增長相當快

歷史唯一沒有農民起義的朝代，每任帝王都是明君，人口增長相當快

心中的麥田

2026-05-28 20:50:58

200萬粉絲博主詆毀袁隆平“三系雜交技術”，中國食品報痛批：“有的人倉廩實而知禮節，有的人吃飽了就撐得慌”，已提交舉報材料

200萬粉絲博主詆毀袁隆平“三系雜交技術”，中國食品報痛批：“有的人倉廩實而知禮節，有的人吃飽了就撐得慌”，已提交舉報材料

大風新聞

2026-06-28 09:33:02

人倫大亂，正在悄悄毀掉無數中國家庭，看似平常，實則家道衰敗

人倫大亂，正在悄悄毀掉無數中國家庭，看似平常，實則家道衰敗

藝鑒在線

2026-06-22 08:20:18

山東曲阜一牌坊頂部構件發生意外脫落致1死6傷

山東曲阜一牌坊頂部構件發生意外脫落致1死6傷

環球網資訊

2026-06-27 18:21:42

出局！宣布辭職！

五星體育

2026-06-28 09:53:33

小仙女為了8000元“舉報全班師生”，老師被停職，全班學生延畢

小仙女為了8000元“舉報全班師生”，老師被停職，全班學生延畢

妍妍教育日記

2026-06-28 08:10:07

韓紅“走個面”翻車事件升級！其戒指、手串、腕表被網友追問價格

韓紅“走個面”翻車事件升級！其戒指、手串、腕表被網友追問價格

火山詩話

2026-06-24 15:26:03

廣東一男子網購山楂條吃出整只蒼蠅尸體，向平臺索賠1000元，客服回應:可申請僅退款，并給100元積分

廣東一男子網購山楂條吃出整只蒼蠅尸體，向平臺索賠1000元，客服回應:可申請僅退款，并給100元積分

深圳晚報

2026-06-27 22:50:30

快訊！關于鄭麗文的消息！

有態度的何總

2026-06-28 10:58:31

林志穎捂了12年的kimi，首次公開正面照，網友：這臉，判若倆人……

林志穎捂了12年的kimi，首次公開正面照，網友：這臉，判若倆人……

可讀

2026-06-25 23:21:52

又一艘油輪遇襲，霍爾木茲海峽威脅等級被上調！打擊中東地區美軍多個目標后，伊朗最高領袖軍事顧問：將有力回應違反諒解備忘錄行為

又一艘油輪遇襲，霍爾木茲海峽威脅等級被上調！打擊中東地區美軍多個目標后，伊朗最高領袖軍事顧問：將有力回應違反諒解備忘錄行為

每日經濟新聞

2026-06-27 20:38:38

電影《四渡》票房破7000萬

界面新聞

2026-06-28 10:55:42

讓未來不止于大。

2574文章數 8066關注度

往期回顧全部

科技要聞

DeepSeek最新論文：如何讓大模型跑得更快

頭條要聞

三隊出線世界杯32強席位正式落定伊朗在最后一刻出局

頭條要聞

三隊出線世界杯32強席位正式落定伊朗在最后一刻出局

體育要聞

世界杯最火門將，站到了阿根廷和梅西面前

娛樂要聞

白玉蘭獎落幕，唯她被罵慘

財經要聞

兩只股票撐起的韓國股市，半年熔斷?33 次

汽車要聞

蔚來ES大五座體驗全場景行李艙讓你帶著生活出發

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

藝術

數碼

家居

公開課

軍事航空

藝術要聞

15幅喬治·莫蘭迪的靜物花卉特輯

數碼要聞

從RGB-Mini LED到全球首發RGBX！海信引領下一代顯示全新色彩賽道

家居要聞

綠意盎然自然之境

空間微調移形換境
自由流光回溯生活真意
雅奢之序五層別墅

公開課

李玫瑾：為什么性格比能力更重要？

白巖松談人口老齡化：社會要降低老年人門檻
為什么人類有不同的膚色？
布洛芬是怎么給人止痛的？
李彥宏：百度離破產30天

軍事要聞

特朗普又發文威脅：伊朗將不復存在

© 1997-2026 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版

^{<noscript id="xtxnn"></noscript>}

<small id="xtxnn"><tbody id="xtxnn"></tbody></small>

<sub id="xtxnn"><tr id="xtxnn"><th id="xtxnn"></th></tr></sub>