網易首頁 > 網易號 > 正文 申請入駐

神操作再現,單卡3090 起跑!Claude-4.6-Opus蒸餾Qwen3.5-27B

0
分享至

,介紹了 TeichAI 將 Claude 的高階推理能力蒸餾進大模型的操作。今天再來介紹兩個最新的硬核蒸餾模型,這次的主角換成了Qwen3.5-27B加上地表最強邏輯王之一的 Claude Opus 4.6

核心就是用 Claude Opus 4.6 的“思維鏈”(Chain-of-Thought, CoT)高質量數據,去重新訓練(蒸餾) Qwen3.5-27B 這個 270 億參數的中等體量開源模型。不僅推理能力有了質的飛躍,最關鍵的是:單張 RTX 3090 或 4090 就能輕松跑起來!

1. Jackrong/Qwen3.5-27B-Claude-4.6-Opus-Reasoning-Distilled

首先是 HuggingFace 用戶 Jackrong 做的開源版本,短短幾天已經在社區狂攬數萬次下載量。

它的訓練理念極其純粹:利用 Unsloth 框架,配合 LoRA(Rank=64),使用大概 3,280 條極高質量的 Claude Opus 4.6 推理數據進行監督微調(SFT)。有趣的是,作者使用了train_on_responses_only策略——強迫模型的 Loss 函數只在 思考過程和最終答案上計算,完全屏蔽了中間的任務要求。借此逼著模型去死磕和模仿 Claude 那種深度結構化思考模式。


https://huggingface.co/Jackrong/Qwen3.5-27B-Claude-4.6-Opus-Reasoning-Distilled

模型在推理時,會主動開啟思維鏈:

 

Let me analyze this request carefully:
1. Identify the core objective of the problem.
2. Break the task into clearly defined subcomponents.
3. Evaluate constraints and edge cases.
4. Formulate a step-by-step solution plan.
5. Execute the reasoning sequentially and verify consistency...


實測怎么跑最省錢?社區大佬分享,使用Q4_K_M量化版本:

  • 顯存占用只有約 16.5 GB,手捏 24G 顯存的 3090 老玩家毫無壓力!

  • 生成速度 29–35 tok/s,足夠絲滑。

  • 保留完整長上下文,沒有像早前一些劣質微調那樣把注意力窗口閹割到 8k,它宣稱跑滿 262K 上下文沒有打折。

  • 修復了官方模型在 Jinja 模板里不支持developerrole 導致的崩潰

而且這模型跟 AI 代碼智能體框架(如 Claude Code、OpenCode)天生一對,支持原生developer角色。實測中,它可以全自動在后臺跑上 9 分鐘,看報錯、修代碼、寫 README 一氣呵成,連中途死機卡頓的幾率都大幅降低。

2. TeichAI/Qwen3.5-27B-Claude-Opus-4.6-Distill

上次我們提過的“模型煉丹師” TeichAI 也沒有閑著,幾乎同時發布了同系列的高質量底模。他們同樣基于unsloth/Qwen3.5-27B為基座,配合自己的過濾版數據集進行調教。


https://huggingface.co/TeichAI/Qwen3.5-27B-Claude-Opus-4.6-Distill

相比其他的傻瓜包,TeichAI 非常貼心地給出了實戰跑模型的超參保姆級指南

  • 普通任務(思考模式):溫度調滿 1.0,Top_P 0.95,Min_P 0.0,可以極大限度激發 AI 創意推理。

  • 寫代碼/Web 開發(高精度防胡說模式):溫度降到 0.6,同時存在懲罰(presence_penalty)設為 0.0,讓它死死咬住你的邏輯不跑偏。

  • 輸出長度建議:普通對話放開到 32,768 tokens,如果是高難度編程競賽題,直接拉滿到 81,920 tokens,給思維鏈留下足夠揮灑的空間。

下圖就是模型卡里的對比圖:


TeichAI Benchmark

從模型卡里的表格看,TeichAI/Qwen3.5-27B-Claude-Opus-4.6-Distill相比unsloth/Qwen3.5-27B,至少在下面這些指標上是有提升的:


蒸餾的得與失

所以你會發現,這條線其實已經不是單點開花了,而是在慢慢形成一個“Claude reasoning distill 數據集 + Qwen 底座 + Unsloth 微調”的公開玩法。

萬事皆有代價,享受了極強的單體思維能力,也要承受某些缺失。原版 Qwen3.5-27B 的多模態技能在這些微調版上蕩然無存,這類蒸餾版目前專攻純代碼、純數學計算和重度邏輯推理場景。再加上由于是早期發布,相關的 prompt 模板生態還不算完美,偶爾可能會有些排版錯位的外殼 bug。

感興趣可以去弄個 GGUF 跑跑,看它是不是真的能平替掉某些時候昂貴的云端 API。

-Opus

制作不易,如果這篇文章覺得對你有用,可否點個關注。給我個三連擊:點贊、轉發和在看。若可以再給我加個,謝謝你看我的文章,我們下篇再見!

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
全球外交大地震!美俄同月訪華,世界徹底看清,中國才是終極港灣

全球外交大地震!美俄同月訪華,世界徹底看清,中國才是終極港灣

小祁談歷史
2026-04-24 05:23:52
一位漂亮素雅的新娘子!

一位漂亮素雅的新娘子!

情感大頭說說
2026-04-24 04:45:22
田亮做夢也沒想到,費心養大的14歲兒子,如今竟“壓自己一頭”

田亮做夢也沒想到,費心養大的14歲兒子,如今竟“壓自己一頭”

以茶帶書
2026-04-23 16:11:50
小寶與王某雷,誰探訪花的數量更多?

小寶與王某雷,誰探訪花的數量更多?

挪威森林
2026-01-31 12:15:26
笑不活了!女孩把雞畫得圓肥被判不合格,家長把雞的照片發給老師

笑不活了!女孩把雞畫得圓肥被判不合格,家長把雞的照片發給老師

火山詩話
2026-04-21 09:46:21
身價百億,坐擁北京一條街,出門私人飛機,京圈頂級富婆都有誰?

身價百億,坐擁北京一條街,出門私人飛機,京圈頂級富婆都有誰?

小椰的奶奶
2026-04-23 14:52:12
ASML公司CEO:中國芯片落后世界8年,因為他們已經8年沒有獲得我們的EUV光刻機

ASML公司CEO:中國芯片落后世界8年,因為他們已經8年沒有獲得我們的EUV光刻機

芯火相承
2026-04-23 17:33:03
酒店里,擠滿了偷偷開房的已婚女性

酒店里,擠滿了偷偷開房的已婚女性

二胡的歲月如歌
2026-04-22 19:03:26
更大規模海戰來了?

更大規模海戰來了?

中國新聞周刊
2026-04-22 20:50:08
段睿深夜悲痛發文:再也沒有人等我回去了!

段睿深夜悲痛發文:再也沒有人等我回去了!

原夢叁生
2026-04-22 20:06:36
劃清界限!高云翔憔悴發聲撇清張婉婷,不留情面,一句話暗含深意

劃清界限!高云翔憔悴發聲撇清張婉婷,不留情面,一句話暗含深意

離離言幾許
2026-04-24 07:12:13
她一嫁演員祝延平,二嫁杜淳老爸杜志國,現在老了與兒子相依為命

她一嫁演員祝延平,二嫁杜淳老爸杜志國,現在老了與兒子相依為命

混沌錄
2026-04-23 17:11:04
單身越久,死亡風險越高?中國科學家:每周2次性生活是安全線

單身越久,死亡風險越高?中國科學家:每周2次性生活是安全線

思思夜話
2026-04-23 11:30:19
人民日報發文,揭張桂梅真實現狀,卸任華坪女高校長傳聞早有真相

人民日報發文,揭張桂梅真實現狀,卸任華坪女高校長傳聞早有真相

歲暮的歸南山
2026-04-23 16:31:58
5月1日起,3萬塊就能把老板送進去,不明財產門檻卻漲到了300萬!

5月1日起,3萬塊就能把老板送進去,不明財產門檻卻漲到了300萬!

今朝牛馬
2026-04-23 23:23:59
比封鎖海峽更狠!伊朗亮出終極王牌,霍爾木茲海底光纜或將被切斷

比封鎖海峽更狠!伊朗亮出終極王牌,霍爾木茲海底光纜或將被切斷

芳芳歷史燴
2026-04-23 18:30:17
遼寧莊河回應“8歲男童爬山發現金礦線索”:當地已圈定200多處礦化點,事發地也有成金礦可能

遼寧莊河回應“8歲男童爬山發現金礦線索”:當地已圈定200多處礦化點,事發地也有成金礦可能

極目新聞
2026-04-23 10:00:21
中央定調,2026年養老金或調整,低于3600,補發7個月能漲700嗎?

中央定調,2026年養老金或調整,低于3600,補發7個月能漲700嗎?

游古史
2026-04-24 04:01:53
10萬元不翼而飛!上海老夫妻放在洗衣機里的現金沒了,護工堅稱自己清白,真相竟是→

10萬元不翼而飛!上海老夫妻放在洗衣機里的現金沒了,護工堅稱自己清白,真相竟是→

環球網資訊
2026-04-23 19:39:20
高市翻車了?日本打出藏了14年的“底牌”,外媒:根本攔不住了!

高市翻車了?日本打出藏了14年的“底牌”,外媒:根本攔不住了!

瘋狂小菠蘿
2026-04-23 14:27:12
2026-04-24 09:23:00
Ai學習的老章 incentive-icons
Ai學習的老章
Ai學習的老章
3348文章數 11139關注度
往期回顧 全部

科技要聞

馬斯克喊出"史上最大產品",但量產難預測

頭條要聞

女子網購1450單又退貨1450單 老板娘盤點后稱損失12萬

頭條要聞

女子網購1450單又退貨1450單 老板娘盤點后稱損失12萬

體育要聞

給文班剃頭的馬刺DJ,成為NBA最佳第六人

娛樂要聞

王大陸因涉黑討債被判 女友也一同獲刑

財經要聞

19家企業要"鋁代銅",格力偏不

汽車要聞

預售30.29萬起 嵐圖泰山X8配896線激光雷達

態度原創

教育
健康
游戲
藝術
公開課

教育要聞

相似無刻度直尺作圖,一個視頻學會!

干細胞如何讓燒燙傷皮膚"再生"?

《AC黑旗RE》超高清截圖公布!遠洋風光極致重塑

藝術要聞

江青對聯驚艷眾人,書法與寫字的界限究竟在哪?

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版