網易首頁 > 網易號 > 正文申請入駐

LM Studio 終于支持 MTP 了， Qwen3.6-35B 跑出 ~130 token 每秒

2026-05-24 21:11:22　來源: Ai學習的老章

北京舉報

分享至

LM Studio 終于把 MTP（Multi-Token Prediction）推測解碼做上了

事情還挺有故事性的：5 月 17 日 llama.cpp 合并了 MTP 支持，5 月 18 日就有用戶在 LM Studio 的 issue 區開帖催更：

? "llama 合并 MTP 三天了，LM Studio 怎么還沒支持？我快焦慮發作了，沒有 MTP 我整個世界會塌的（我看到征兆了…），LM Studio 的開發者們要是能聽見我說話，求求你們加上 MTP，我感覺留給我的時間不多了，請，LM Studio，救救我們。"

這哥們是真急

幸運的是，5 月 20 日 LM Studio 官方開發者 yagil 直接在 issue 下面回復："Fear not, it is here (in beta)"，0.4.14 Build 2 beta 上線，5 月 22 日 Build 4 正式穩定版發布

簡介

先快速科普一下，MTP（Multi-Token Prediction）是什么？

簡單講就是：傳統語言模型一次只能預測一個 token，每生成一個字都要把整個網絡跑一遍，慢。MTP 讓模型一次預測多個 token，然后用驗證機制保證質量，本質上是推測解碼（speculative decoding）的一種，但比傳統的 draft model 方案更優雅

它有兩個好處：

不用額外的 draft 小模型：MTP head 是和主模型一起訓練的，自帶"草稿能力"
天然對齊：因為是同一個模型出來的預測，驗證通過率高，加速倍數穩定

怎么開啟？六步打開 MTP

這里有幾個坑要避開，按官方和社區實測的步驟來：

升級 LM Studio 到 0.4.14 Build 4

打開 LM Studio，開啟 Developer Mode（開發者模式）

進入模型設置，確認 llama.cpp 引擎版本是 2.15.0 以上
下載支持 MTP 的模型推薦：

unsloth/Qwen3.6-35B-A3B-MTP-GGUF
unsloth/Qwen3.6-27B-MTP-GGUF

上一篇剛介紹過，作者也發了 MTP 頭版本，吞吐能跟 Qwen3.6 官方 MTP 跑出 1.66× 的對比

加載模型時勾選 MTP ，享受 ~2× 速度

? ?? 關鍵提示：普通 GGUF 模型開 MTP 不會變快，反而可能更慢，必須是帶 MTP head 的專用 GGUF。這點社區已經有不少坑貨反饋了

實測速度有多炸？

直接看社區跑出來的數據：

硬件

模型

不開 MTP

開 MTP

加速比

RTX 3090

Qwen3.6-27B MTP

~20.69 tok/s

~42 tok/s~2.0×

高端配置

Qwen3.6-35B-A3B MTP

~130 tok/s

已知問題（提前避坑）

按 issue 區扒下來的踩坑清單：

問題

狀態

Build 2 代碼輸出空白符被吞掉

? Build 3 已修復

非 MTP 推測解碼在 MTP 開啟時報錯

? Build 4 已修復

小模型（4B 級別）MTP 反向加速

?? 待優化，建議先用大模型

Gemma 4 MTP 不可用

?? 已知 bug

MTP 默認關閉，新手容易找不到

?? 必須開 Dev Mode + 選加載參數

llama.cpp 引擎版本要求 2.15.0

?? 在 beta 頻道，部分人要手動升級

和原生 llama.cpp 對比

也有網友提到一個值得關注的點：原生 llama.cpp 命令行可以用ubatch等更多調參選項，理論上優化空間比 LM Studio 大

我感覺這個需要分場景：

想最快上手、不折騰：LM Studio 0.4.14 + MTP 一鍵開，無腦享受 2× 提速
想壓榨到極限：還是回到 llama.cpp 原生命令行，手動調 ubatch、n_gpu_layers、KV cache 這些
配合 froggeric 修復模板：Qwen-Fixed-Chat-Templates 在 LM Studio 上也能用，工具調用穩定性能再上一檔

.cpp

制作不易，如果這篇文章覺得對你有用，可否點個關注。給我個三連擊：點贊、轉發和在看。若可以再給我加個，謝謝你看我的文章，我們下篇再見！

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

33歲丈夫腦死亡400余天，妻子卻執意將他“留”在身邊：他手腳還會動，舍不得放棄

瀟湘晨報 2026-06-17 15:27:18
198 跟貼 198
柬埔寨對華免簽落地首日即有老廣團出發

新快報新聞 2026-06-16 08:19:02
16993 跟貼 16993

法國學者嚴厲警告：相對來講歐洲衰落速度是清朝三倍

澎湃新聞 2026-06-17 14:44:47
5267 跟貼 5267

媒體：俄羅斯掉了架戰略轟炸機同一天美國也掉了一架

新民周刊 2026-06-17 09:42:07
307 跟貼 307
教育部同意：新設立32所本科高校

上觀新聞 2026-06-17 18:57:42
4539 跟貼 4539

90多歲老奶奶在夜市賣粽子煮雞蛋

瀟湘晨報 2026-06-17 10:41:40
124 跟貼 124

奔馳廣州4S店大興寶鴻悄然撤場近千名車主預付權益懸空

新快報新聞 2026-06-17 08:35:07
687 跟貼 687
上海市民驚呆：知名品牌進口牛奶怎么是淡黃色的水，還有股酸臭味？類似情況不止一次發生，網友：萬一小朋友直接用吸管吸

新民晚報 2026-06-17 09:14:37
1242 跟貼 1242

6萬億元投資“源源而來”，未來5年升級這張網→

極目新聞 2026-06-17 00:57:33
119 跟貼 119
寧德時代曾毓群“炮轟”動力電池行業亂象：部分競爭對手只會挖人偷技術，低價競爭源于心態浮躁、行為短視

每日經濟新聞 2026-06-17 21:01:02
16 跟貼 16
山姆中國首席采購官張青因個人原因將于6月底離任

澎湃新聞 2026-06-17 14:26:26
1175 跟貼 1175
萬萬沒想到，車子買來開了5年才知道還要續費？網友：吃相太難看！

大風新聞 2026-06-17 08:34:05
969 跟貼 969
勞力士被指為百年大展55元雇群演：客不好請，表不易賣

界面新聞 2026-06-17 11:40:53
181 跟貼 181
中國女排戰勝德國女排，收獲世界女排聯賽安卡拉站開門紅

澎湃新聞 2026-06-17 19:58:27
108 跟貼 108
孫興慜遭韓國記者嘲諷，賽后拒絕所有媒體采訪；韓國足協：深感震驚和失望，尊重、保護球員應當放在首位

大象新聞 2026-06-17 12:10:21
77 跟貼 77
梅西已在中國申請注冊多枚姓名商標

封面新聞 2026-06-17 11:48:56
2477 跟貼 2477
“佛得角感謝中國”，沖上熱搜

第一財經資訊 2026-06-17 08:52:33
1142 跟貼 1142
游客吐槽無錫國保園林寄暢園像“吸煙室”，古建古樹間煙霧彌漫，景區回應：已全面禁煙

上游新聞 2026-06-13 18:13:12
1546 跟貼 1546
余承東官宣享界G9定檔50萬級，鴻蒙智行首款硬派SUV實力幾何？

瀟湘晨報 2026-06-17 09:58:46
109 跟貼 109
祝賀！徐嘉余50仰破亞洲紀錄奪冠

極目新聞 2026-06-17 19:29:25
111 跟貼 111
夫妻領證后一起回家，女方改口叫“媽”，婆婆的反應十分有趣

星視頻 2026-06-17 09:00:36
94 跟貼 94
3億重點工程底座可徒手掰開？官方通報

南方都市報 2026-06-17 09:40:33
157 跟貼 157
開著“智駕”吵架撞護欄，罰款記3分：輔助駕駛≠自動駕駛

報錯免疫體 2026-06-18 02:57:53
0 跟貼 0
青沙公路車禍奪兩命，休班消防員夫婦身亡貨車司機被捕

全棧遛狗員 2026-06-18 02:11:16
0 跟貼 0

手機 / 數碼

房產 / 家居

LM Studio 終于支持 MTP 了， Qwen3.6-35B 跑出 ~130 token 每秒

馬斯克好友長文:他最可怕的，是這套方法論

荷蘭政府對中國進行無理指責 中使館發聲

荷蘭政府對中國進行無理指責 中使館發聲

梅西帽子戲法：紀錄厚重，球王輕盈

陳紅一反常態保持沉默

拉加德警告:AI可能引爆下一場金融危機

23.99萬起 比亞迪大唐帶2+2+3大七座掀桌子 這才是中國大家庭夢中情車！

態度原創

剖腹產后想少留疤，這三個細節要做好

《黑神話》狂賣3000萬份！還有國產3A能超越它嗎？

營養師：粽子怎么吃美味又健康？

蘋果iPhone傳四喜：辟謠、漲內存、漲影像、紀念版也有新變化！

荷蘭政府對中國進行無理指責中使館發聲

荷蘭政府對中國進行無理指責中使館發聲

23.99萬起比亞迪大唐帶2+2+3大七座掀桌子這才是中國大家庭夢中情車！