今天,Liquid AI直接放出了LFM2.5-8B-A1B,一款專為消費級硬件設計的邊緣模型。團隊這次不打啞謎,明確說它的核心賣點是快速、可靠的工具調用——能在你手邊的筆記本上順暢串聯多項任務。繼去年10月LFM2-8B-A1B之后,新版本一口氣把上下文窗口從32,768個token拉到了128,000個token,預訓練token量也從12T暴增到38T,再加上大規模強化學習,詞匯量直接從65,536翻倍到128,000,專門優化非拉丁語言的分詞效率。
模型已經上架Hugging Face和Liquid自家的Playground,基礎版和訓練后版本同時開放。一同放出的文檔還教你如何在本地跑起來、做微調。團隊給出的三大亮點直接印在公告上:首先,這是為真實應用場景打造的設備端個人助手,能在各種設備上串聯工具調用、遵循復雜指令;其次,它用壓縮性能說話,在指令跟隨和代理任務上,敢于叫板參數規模大得多的稠密模型和MoE模型;第三,吞吐量在同等尺寸里沒有對手,無論CPU還是GPU推理,而且首發日就支持了llama.cpp、MLX、vLLM和SGLang。
![]()
和前代相比,這個版本最明顯的不同在于它變成了一個純推理模型——最終答案前會輸出明確的思維鏈。團隊給出的解釋很務實:MoE模型通常運行在計算密集的設定里,既然每次推理只激活少部分參數,每個推理token的成本就極低,正好能把思維鏈當作“廉價的質量增益”,不拖慢速度還能大幅提升表現。網絡架構沿用了上一代的組合:MoE、GQA加上門控短卷積模塊,沒有大動刀。
![]()
真正奠定多語言能力躍升的,是分詞器的就地擴展工程。原先的LFM2-8B-A1B用的是一個65K大小的BPE分詞器,優化主力語言覆蓋。這次Liquid沒有推倒重來,而是在原有合并結果的基礎上繼續在多語言語料上做BPE合并訓練,把詞匯量拉滿到128K。這樣做的好處是:已有token的ID都保持身份映射,每個新token又能按確定規則分解成原始子詞序列。新嵌入行直接用其子詞分解的均值來初始化,共享行則原封不動復制。接下來只用短短兩階段訓練就找回質量——先只訓練嵌入層,再進行全模型續訓。最終的效果就是能在印地語、泰語、越南語、印尼語和阿拉伯語上看到特別明顯的壓縮增益,每個token能攜帶更多文字信息。
![]()
從12T到38T的預訓練數據堆量,再疊加強化學習和思維鏈推理,這一代模型在基準上跑出了顯著優于前代的成績。Liquid AI用一份清晰的迭代答卷告訴開發者:在消費設備上跑出能干活的推理模型,不再需要為參數規模焦慮。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.