IT之家 6 月 30 日消息,美團今日發布新一代萬億參數大模型LongCat-2.0,并將對外開源。
LongCat-2.0 宣稱是業界首個在五萬卡國產算力集群上完成全流程訓練與推理的萬億參數模型(總參數 1.6 T,平均激活約 48 B,動態范圍 33B~56B),從零開始預訓練,原生支持 1M 超長上下文。
正式版發布前,LongCat-2.0 預覽版本已通過 OpenRouter 平臺和 longcat.ai 面向全球開發者開放調用 ——截至目前該模型已躋身 OpenRouter 全球大模型調用量前三,月調用量在 Hermes、Claude Code 和 OpenClaw 分列全球第一、第二和第三位。
LongCat-2.0 預訓練數據規模超過 30T tokens,覆蓋中文、英文、多語言和代碼等多類數據;面對萬卡級訓練中的硬件故障、通信異常、顯存壓力與數值波動,LongCat 團隊從穩定性、正確性和效率三方面攻克國產算力訓練難題。
- 穩定性上,通過 HCCL 異常處理、彈性擴縮卡和自動故障恢復,將月均日故障率降低 70% 以上;
- 正確性上,通過自研設計確定性算子、Bitwise 一致性驗證和參數檢測,保障訓練結果的可靠,同時基于實踐提升關鍵模塊計算精度、優化 Reduce 邏輯;
- 效率上,通過流水線調度、顯存優化和算子級控核,訓練 MFU 提升 1.5 倍。
最終,LongCat 實現穩態日吞吐超過 1T tokens / day,完成萬億參數 MoE 模型在國產算力上的穩定訓練。
在推理階段,LongCat-2.0 圍繞模型、算子和框架進行協同優化:
- 通過大規模專家并行聚合訪存帶寬,支撐萬億參數 MoE 模型的低延遲解碼;
- 將零計算專家機制融入專家并行通信流程,使路由到零專家的 token 真正避免不必要的傳輸與計算;
- 針對通信、Attention、GEMM 等核心算子優化調度,結合提前下發與權重預取等框架機制,進一步降低推理鏈路中的等待開銷。
LongCat-2.0 采用 LongCat Sparse Attention(LSA)稀疏注意力機制,在處理長文本時不再“逐字逐句地看”,而是智能篩選關鍵信息,將計算量從平方級降至線性級。這使得模型在 100 萬 Token 的超長上下文中,依然保持信息定位與理解能力。
代碼任務中不同 token 復雜度差異巨大 —— 定義變量名和推導遞歸算法對算力的需求完全不同。LongCat-2.0 通過零計算專家實現 token 級動態激活(33B~56B),簡單 token 不消耗算力,復雜 token 自動獲得更多計算資源。
LongCat-2.0 通過 MOPD 架構融合 Agent、Reasoning、Interaction 三組專家能力 ——Agent Experts 專攻工具調用與自主糾錯,Reasoning Experts 深耕數學與 STEM 推理,Interaction Experts 優化指令遵循與交互體驗。推理時由門控網絡根據任務類型動態調度最擅長的專家,而非簡單合并參數。得益于此,模型在編程、推理、交互等維度均表現突出。
![]()
綜合評測結果顯示,LongCat-2.0 在 Code 和 General Agent 場景表現優異。
![]()
- 在編程能力方面,LongCat-2.0 在考察深層工程能力的 SWE-bench Pro 中獲得 59.5,領先 Gemini 3.1 Pro(54.2)、 GPT-5.5(58.6)和 Claude Opus 4.6(57.3);在 SWE-bench Multilingual 中取得 77.3 的成績,與 Claude Opus 4.6(77.8)保持在同一水位;此外,在真實終端指令交互評測 Terminal-Bench 2.1 中取得 70.8,體現了其在真實運維與開發終端任務中的穩定執行與糾錯能力。
- 在真實辦公場景的復雜任務處理方面,LongCat-2.0 在搜索智能體評測集 RWSearch 中獲得 78.8,在生產力場景評測集 FORTE 中獲得 73.2 ,在 BrowseComp 中獲得 79.9,均達到或接近前沿閉源模型水平,能夠較好的契合企業級 Agent 的落地需求。
![]()
IT之家附 API 開放平臺地址如下:
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.