網易首頁 > 網易號 > 正文 申請入駐

在 Mac 上微調一切大模型

0
分享至

聊個讓我非常興奮的項目——mlx-tune

一句話概括:在你的 Mac 上,用 Unsloth 的 API 微調一切

LLM、視覺模型、TTS、STT、OCR、Embedding,全都能在 Apple Silicon 上本地微調

Mac 用戶的微調困境

做大模型微調的同學應該都有過這種體驗:想在本地跑個小實驗驗證下 idea,結果發現 Unsloth 依賴 Triton,而 Triton 不支持 Mac

于是你只剩兩條路:

  1. 1. 花錢開云 GPU —— 就跑個 100 條數據的實驗,有必要嗎?

  2. 2. 用 mlx-lm 原生 API —— 但代碼和 完全不兼容,到了云上還得重寫一遍

mlx-tune(github.com/ARahim3/mlx-tune)的作者也遇到了一模一樣的問題

他的解決思路非常簡單粗暴:把 MLX 包裝成 Unsloth 的 API

你在 Mac 上寫的訓練腳本,換個 import 就能直接在 CUDA 集群跑

# Unsloth (CUDA)                        # MLX-Tune (Apple Silicon)
from unsloth import FastLanguageModel from mlx_tune import FastLanguageModel
from trl import SFTTrainer from mlx_tune import SFTTrainer


# 后面的代碼一模一樣!

這才是真正解決問題的設計

下面這張圖清楚展示了 mlx-tune 的工作流——本地原型驗證,改個 import 就能上云訓練:


功能有多全?看完嚇一跳

它支持的訓練方法比很多正經公司的內部工具都全:

語言模型訓練:

  • ? SFT :基礎指令微調,這是最常用的

  • ? DPO / ORPO / KTO / SimPO :各種偏好學習方法全覆蓋

  • ? GRPO :DeepSeek R1 風格的多生成 + 獎勵訓練

  • ? CPT :持續預訓練,支持解耦學習率

多模態訓練:

  • ? Vision :支持 Gemma 4、Qwen3.5、PaliGemma、LLaVA、Pixtral 等 VLM 微調

  • ? TTS :Orpheus、OuteTTS、Spark-TTS、Sesame/CSM、Qwen3-TTS 五個 TTS 模型

  • ? STT :Whisper、Moonshine、Qwen3-ASR、NVIDIA Canary、Voxtral 五個 STT 模型

  • ? Embedding :BERT、ModernBERT、Qwen3-Embedding、Harrier,支持對比學習

  • ? OCR :DeepSeek-OCR、GLM-OCR、olmOCR、Qwen-VL,內置 CER/WER 指標

進階能力:

  • ? MoE 微調 :支持 39+ 種 MoE 架構,包括 Qwen3.5-35B、Mixtral、DeepSeek 系列

  • ? Gemma 4 Audio :12 層 Conformer 音頻塔,原生處理 16kHz 音頻

  • ? LFM2 :Liquid AI 的混合卷積+GQA 架構

說真的,一個社區項目做到這個程度,相當離譜

全景架構一覽——從 API 到硬件的五層設計:


快速上手

安裝很簡單,推薦用 uv:

# 標準安裝
uv pip install mlx-tune


# 帶音頻支持
uv pip install 'mlx-tune[audio]'
brew install ffmpeg

來個最基礎的 SFT 微調示例:

from mlx_tune import FastLanguageModel, SFTTrainer, SFTConfig
from datasets import load_dataset

# 加載模型(4bit 量化,省顯存)
model, tokenizer = FastLanguageModel.from_pretrained(
model_name="mlx-community/Llama-3.2-1B-Instruct-4bit",
max_seq_length=2048,
load_in_4bit=True,
)

# 加 LoRA
model = FastLanguageModel.get_peft_model(
model,
r=16,
target_modules=["q_proj", "k_proj", "v_proj", "o_proj"],
lora_alpha=16,
)

# 加載數據集
dataset = load_dataset("yahma/alpaca-cleaned", split="train[:100]")

# 訓練
trainer = SFTTrainer(
model=model,
train_dataset=dataset,
tokenizer=tokenizer,
args=SFTConfig(
output_dir="outputs",
per_device_train_batch_size=2,
learning_rate=2e-4,
max_steps=50,
),
)
trainer.train()

# 保存:三種格式隨你選
model.save_pretrained("lora_model") # LoRA 適配器
model.save_pretrained_merged("merged", tokenizer) # 合并后的完整模型
model.save_pretrained_gguf("model", tokenizer) # GGUF 格式,直接給 Ollama 用

如果你用過 Unsloth,這代碼看著是不是特別眼熟?對,就是同一套 API

視覺模型微調

VLM 微調也是同樣簡潔的體驗:

from mlx_tune import FastVisionModel, UnslothVisionDataCollator, VLMSFTTrainer
from mlx_tune.vlm import VLMSFTConfig

model, processor = FastVisionModel.from_pretrained(
"mlx-community/Qwen3.5-0.8B-bf16",
)

model = FastVisionModel.get_peft_model(
model,
finetune_vision_layers=True, # 視覺層也微調
finetune_language_layers=True,
r=16, lora_alpha=16,
)

# 訓練(數據集格式和 Unsloth 一致)
FastVisionModel.for_training(model)
trainer = VLMSFTTrainer(
model=model,
tokenizer=processor,
data_collator=UnslothVisionDataCollator(model, processor),
train_dataset=dataset,
args=VLMSFTConfig(max_steps=30, learning_rate=2e-4),
)
trainer.train()

Gemma 4、Qwen3.5、PaliGemma、LLaVA、Pixtral 都支持

你甚至可以用 Vision GRPO 來訓練視覺推理能力

TTS 微調:在 Mac 上克隆聲音

這個功能我覺得特別有意思——在 Mac 上本地微調 TTS 模型:

from mlx_tune import FastTTSModel, TTSSFTTrainer, TTSSFTConfig, TTSDataCollator
from datasets import load_dataset, Audio

# 自動檢測模型類型、編碼器和 token 格式
model, tokenizer = FastTTSModel.from_pretrained(
"mlx-community/orpheus-3b-0.1-ft-bf16"
)
model = FastTTSModel.get_peft_model(model, r=16, lora_alpha=16)

dataset = load_dataset("MrDragonFox/Elise", split="train[:100]")
dataset = dataset.cast_column("audio", Audio(sampling_rate=24000))

trainer = TTSSFTTrainer(
model=model, tokenizer=tokenizer,
data_collator=TTSDataCollator(model, tokenizer),
train_dataset=dataset,
args=TTSSFTConfig(output_dir="./tts_output", max_steps=60),
)
trainer.train()

Orpheus、OuteTTS、Spark-TTS、Sesame/CSM、Qwen3-TTS 都支持

想做聲音克隆或者風格化 TTS,再也不用租 GPU 了

工作流全景

mlx-tune 的定位非常清晰:本地原型 → 云端量產

本地 Mac (mlx-tune)              云端 GPU (Unsloth)
├── 快速實驗 ├── 大規模訓練
├── 小數據集驗證 ├── 完整數據集
├── 秒級迭代 ├── 生產級優化
└── 同一套代碼 ─────────────────── └── 同一套代碼

訓練完還能直接導出:

  • ? HuggingFace 格式 :標準保存

  • ? GGUF :直接丟給 Ollama / llama.cpp

  • ? push_to_hub :一鍵推到 HuggingFace Hub

它適合誰?

我覺得 mlx-tune 最適合這幾類人:

  1. 1. Mac 用戶 + 微調需求 :你有 M1/M2/M3/M4/M5,想在本地跑微調實驗,這是最佳選擇

  2. 2. 混合工作流用戶 :本地調試、云端訓練,代碼無縫遷移

  3. 3. 多模態探索者 :想同時玩 LLM、Vision、TTS、STT、OCR 微調的人

  4. 4. 學習者 :想理解微調原理,在本地快速迭代比去 Colab 排隊強太多

局限性也得說清楚:

  • ? 訓練速度肯定比不上 A100 + Unsloth,這是物理定律決定的

  • ? GGUF 導出對量化模型有限制,建議用非量化基座模型

  • ? 內存受限于 Mac 的統一內存(不過 Mac Studio 最高 512GB,夠用了)

如果你是 Mac 用戶,又對微調大模型感興趣,強烈建議試試

制作不易,如果這篇文章覺得對你有用,可否點個關注。給我個三連擊:點贊、轉發和在看。若可以再給我加個,謝謝你看我的文章,我們下篇再見!

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
全球外交大地震!美俄同月訪華,世界徹底看清,中國才是終極港灣

全球外交大地震!美俄同月訪華,世界徹底看清,中國才是終極港灣

小祁談歷史
2026-04-24 05:23:52
一位漂亮素雅的新娘子!

一位漂亮素雅的新娘子!

情感大頭說說
2026-04-24 04:45:22
田亮做夢也沒想到,費心養大的14歲兒子,如今竟“壓自己一頭”

田亮做夢也沒想到,費心養大的14歲兒子,如今竟“壓自己一頭”

以茶帶書
2026-04-23 16:11:50
小寶與王某雷,誰探訪花的數量更多?

小寶與王某雷,誰探訪花的數量更多?

挪威森林
2026-01-31 12:15:26
笑不活了!女孩把雞畫得圓肥被判不合格,家長把雞的照片發給老師

笑不活了!女孩把雞畫得圓肥被判不合格,家長把雞的照片發給老師

火山詩話
2026-04-21 09:46:21
身價百億,坐擁北京一條街,出門私人飛機,京圈頂級富婆都有誰?

身價百億,坐擁北京一條街,出門私人飛機,京圈頂級富婆都有誰?

小椰的奶奶
2026-04-23 14:52:12
ASML公司CEO:中國芯片落后世界8年,因為他們已經8年沒有獲得我們的EUV光刻機

ASML公司CEO:中國芯片落后世界8年,因為他們已經8年沒有獲得我們的EUV光刻機

芯火相承
2026-04-23 17:33:03
酒店里,擠滿了偷偷開房的已婚女性

酒店里,擠滿了偷偷開房的已婚女性

二胡的歲月如歌
2026-04-22 19:03:26
更大規模海戰來了?

更大規模海戰來了?

中國新聞周刊
2026-04-22 20:50:08
段睿深夜悲痛發文:再也沒有人等我回去了!

段睿深夜悲痛發文:再也沒有人等我回去了!

原夢叁生
2026-04-22 20:06:36
劃清界限!高云翔憔悴發聲撇清張婉婷,不留情面,一句話暗含深意

劃清界限!高云翔憔悴發聲撇清張婉婷,不留情面,一句話暗含深意

離離言幾許
2026-04-24 07:12:13
她一嫁演員祝延平,二嫁杜淳老爸杜志國,現在老了與兒子相依為命

她一嫁演員祝延平,二嫁杜淳老爸杜志國,現在老了與兒子相依為命

混沌錄
2026-04-23 17:11:04
單身越久,死亡風險越高?中國科學家:每周2次性生活是安全線

單身越久,死亡風險越高?中國科學家:每周2次性生活是安全線

思思夜話
2026-04-23 11:30:19
人民日報發文,揭張桂梅真實現狀,卸任華坪女高校長傳聞早有真相

人民日報發文,揭張桂梅真實現狀,卸任華坪女高校長傳聞早有真相

歲暮的歸南山
2026-04-23 16:31:58
5月1日起,3萬塊就能把老板送進去,不明財產門檻卻漲到了300萬!

5月1日起,3萬塊就能把老板送進去,不明財產門檻卻漲到了300萬!

今朝牛馬
2026-04-23 23:23:59
比封鎖海峽更狠!伊朗亮出終極王牌,霍爾木茲海底光纜或將被切斷

比封鎖海峽更狠!伊朗亮出終極王牌,霍爾木茲海底光纜或將被切斷

芳芳歷史燴
2026-04-23 18:30:17
遼寧莊河回應“8歲男童爬山發現金礦線索”:當地已圈定200多處礦化點,事發地也有成金礦可能

遼寧莊河回應“8歲男童爬山發現金礦線索”:當地已圈定200多處礦化點,事發地也有成金礦可能

極目新聞
2026-04-23 10:00:21
中央定調,2026年養老金或調整,低于3600,補發7個月能漲700嗎?

中央定調,2026年養老金或調整,低于3600,補發7個月能漲700嗎?

游古史
2026-04-24 04:01:53
10萬元不翼而飛!上海老夫妻放在洗衣機里的現金沒了,護工堅稱自己清白,真相竟是→

10萬元不翼而飛!上海老夫妻放在洗衣機里的現金沒了,護工堅稱自己清白,真相竟是→

環球網資訊
2026-04-23 19:39:20
高市翻車了?日本打出藏了14年的“底牌”,外媒:根本攔不住了!

高市翻車了?日本打出藏了14年的“底牌”,外媒:根本攔不住了!

瘋狂小菠蘿
2026-04-23 14:27:12
2026-04-24 09:23:00
Ai學習的老章 incentive-icons
Ai學習的老章
Ai學習的老章
3348文章數 11139關注度
往期回顧 全部

科技要聞

馬斯克喊出"史上最大產品",但量產難預測

頭條要聞

女子網購1450單又退貨1450單 老板娘盤點后稱損失12萬

頭條要聞

女子網購1450單又退貨1450單 老板娘盤點后稱損失12萬

體育要聞

給文班剃頭的馬刺DJ,成為NBA最佳第六人

娛樂要聞

王大陸因涉黑討債被判 女友也一同獲刑

財經要聞

19家企業要"鋁代銅",格力偏不

汽車要聞

預售30.29萬起 嵐圖泰山X8配896線激光雷達

態度原創

本地
親子
教育
手機
房產

本地新聞

SAGA GIRLS 2026女團選秀

親子要聞

法國寶媽在網上偷偷賣自己的奶!暗訪“母乳黑市”:細菌、乙肝……這能放心喝?

教育要聞

相似無刻度直尺作圖,一個視頻學會!

手機要聞

vivo X500 Pro Max被曝光:2nm工藝+5GHz,2K直屏九月發!

房產要聞

三亞安居房,突然官宣!

無障礙瀏覽 進入關懷版