兼顧效率、成本與能力，百靈開源旗艦推理模型 Ring-2.6-1T

2026-05-18 15:42:31　來源: AI前線

北京舉報

分享至

作者 | 冬梅

5 月 15 日，螞蟻百靈宣布其旗艦級思考模型 Ring-2.6-1T 正式開源，權重文件同步上線 Hugging Face、ModelScope 平臺。此前，該模型上線 OpenRouter，并開放限時免費 API 體驗。

Ring-2.6-1T 是一款擁有萬億個參數(shù)的旗艦級推理模型，專為現(xiàn)實世界的復雜任務場景而設計，可供開發(fā)人員、研究人員和企業(yè)環(huán)境進行驗證、調(diào)整和進一步開發(fā)。其核心設計邏輯是“按需思考”，模型引入了可調(diào)節(jié)的 Reasoning Effort 機制，支持 high 與 xhigh 兩種推理強度，開發(fā)者可以根據(jù)任務特性動態(tài)分配推理資源。

項目地址：https://huggingface.co/inclusionAI/Ring-2.6-1T

Ring-2.6-1T 的目標并非僅僅追求更大的參數(shù)規(guī)模，而是為了應對大型模型正在進入的實際生產(chǎn)環(huán)境：代理工作流、工程開發(fā)、科學研究分析、復雜的業(yè)務系統(tǒng)以及企業(yè)自動化流程。在這些場景中，模型不僅需要“回答問題”，還需要理解上下文、規(guī)劃步驟、調(diào)用工具、持續(xù)執(zhí)行，并在長期任務中保持穩(wěn)定性。

Ring-2.6-1T 在三個方面實現(xiàn)了關鍵升級：

全面增強代理執(zhí)行能力：從“能夠回答”到“能夠執(zhí)行”，在多步驟任務、工具協(xié)作、上下文規(guī)劃和推進復雜工作流程方面表現(xiàn)更穩(wěn)定。
Reasoning Effort 機制：支持兩種推理強度級別，high 和 xhigh，允許開發(fā)人員根據(jù)任務復雜性靈活調(diào)整思考深度，從而在效率、速度和成本之間取得更好的平衡。
異步強化學習訓練范式：在訓練層面，Ring-2.6-1T 采用異步（Async）強化學習訓練架構，將策略采樣與參數(shù)更新解耦為獨立流水線，解決了傳統(tǒng)同步訓練中 GPU 資源等待、訓練吞吐不足的問題，并支持更長周期的持續(xù)訓練。在此基礎上，百靈將此前在 Ring-1T 中驗證過的“棒冰算法”引入異步 RL 訓練，解決訓練不穩(wěn)定問題。

百靈表示，相關技術細節(jié)將在后續(xù)技術報告中公開。

根據(jù)權威評測，Ring-2.6-1T 的兩檔模式各有所長。high 模式下，PinchBench 得分 87.60，高于 GPT-5.4 xHigh 和 Gemini-3.1-Pro high，Tau2-Bench Telecom 達到 95.32，Agent 場景執(zhí)行能力顯著。xhigh 模式下，AIME 26 得分 95.83，接近多家頭部模型水平；GPQA Diamond 達到 88.27，體現(xiàn)出穩(wěn)健的科學知識理解與復雜推理能力。

會議推薦

Agent 從 Demo 到工程化還差什么？安全與可信這道坎怎么過？研發(fā)體系不重構，還能撐多久？

AICon 上海站 2026，13 大重磅專題已上線，誠摯邀請你登臺分享實戰(zhàn)經(jīng)驗。AICon 2026，期待與你同行。快來掃碼鎖定 8 折專屬席位或提交演講議題

今日薦文

你也「在看」嗎？

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.