![]()
【新模型上線】谷歌近日在其官方博客中宣布,正式推出采用量化感知訓練(QAT)技術的Gemma 4系列開源模型新檢查點。此次發布緊隨本周早些時候筆記本級Gemma 4 12B模型的推出,旨在通過新的訓練方法顯著降低模型在手機、筆記本等終端設備上的內存占用。
【技術亮點】與傳統的訓練后量化(PTQ)方法相比,QAT將量化過程融入模型訓練階段,能夠在壓縮模型體積的同時更好地保留模型性能,并加快解碼速度。谷歌表示,新版本采用了定制化的移動端量化方案,包括預先計算參數設置、對模型部分組件進行2比特壓縮,以及對詞匯表和短期記憶的壓縮處理,使模型在保持接近bfloat16精度質量的同時大幅減少內存需求。
【五種規格可選】此次推出的QAT優化版Gemma 4共有五種規格,分別為E2B、E4B、12B、26B A4B和31B。其中最小的純文本版本Gemma 4 E2B運行內存需求不足1GB,適合在手機端部署。模型提供四種下載格式:未量化QAT檢查點、GGUF格式、移動端優化格式以及壓縮張量格式。
【獲取渠道】用戶可通過Hugging Face平臺及LM Studio下載相應的移動端和桌面端模型權重,并在手機、筆記本或臺式機上運行。
參考鏈接:
https://www.androidauthority.com/gemma-4-qat-models-3675172
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.