網易首頁 > 網易號 > 正文申請入駐

Liquid AI新邊緣模型: 128K上下文+鏈式思考

2026-05-30 02:52:55　來源: 灰度測試中

北京舉報

分享至

今天，Liquid AI直接放出了LFM2.5-8B-A1B，一款專為消費級硬件設計的邊緣模型。團隊這次不打啞謎，明確說它的核心賣點是快速、可靠的工具調用——能在你手邊的筆記本上順暢串聯多項任務。繼去年10月LFM2-8B-A1B之后，新版本一口氣把上下文窗口從32,768個token拉到了128,000個token，預訓練token量也從12T暴增到38T，再加上大規模強化學習，詞匯量直接從65,536翻倍到128,000，專門優化非拉丁語言的分詞效率。

模型已經上架Hugging Face和Liquid自家的Playground，基礎版和訓練后版本同時開放。一同放出的文檔還教你如何在本地跑起來、做微調。團隊給出的三大亮點直接印在公告上：首先，這是為真實應用場景打造的設備端個人助手，能在各種設備上串聯工具調用、遵循復雜指令；其次，它用壓縮性能說話，在指令跟隨和代理任務上，敢于叫板參數規模大得多的稠密模型和MoE模型；第三，吞吐量在同等尺寸里沒有對手，無論CPU還是GPU推理，而且首發日就支持了llama.cpp、MLX、vLLM和SGLang。

和前代相比，這個版本最明顯的不同在于它變成了一個純推理模型——最終答案前會輸出明確的思維鏈。團隊給出的解釋很務實：MoE模型通常運行在計算密集的設定里，既然每次推理只激活少部分參數，每個推理token的成本就極低，正好能把思維鏈當作“廉價的質量增益”，不拖慢速度還能大幅提升表現。網絡架構沿用了上一代的組合：MoE、GQA加上門控短卷積模塊，沒有大動刀。

真正奠定多語言能力躍升的，是分詞器的就地擴展工程。原先的LFM2-8B-A1B用的是一個65K大小的BPE分詞器，優化主力語言覆蓋。這次Liquid沒有推倒重來，而是在原有合并結果的基礎上繼續在多語言語料上做BPE合并訓練，把詞匯量拉滿到128K。這樣做的好處是：已有token的ID都保持身份映射，每個新token又能按確定規則分解成原始子詞序列。新嵌入行直接用其子詞分解的均值來初始化，共享行則原封不動復制。接下來只用短短兩階段訓練就找回質量——先只訓練嵌入層，再進行全模型續訓。最終的效果就是能在印地語、泰語、越南語、印尼語和阿拉伯語上看到特別明顯的壓縮增益，每個token能攜帶更多文字信息。

從12T到38T的預訓練數據堆量，再疊加強化學習和思維鏈推理，這一代模型在基準上跑出了顯著優于前代的成績。Liquid AI用一份清晰的迭代答卷告訴開發者：在消費設備上跑出能干活的推理模型，不再需要為參數規模焦慮。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.