![]()
作者 | 冬梅
5 月 15 日,螞蟻百靈宣布其旗艦級思考模型 Ring-2.6-1T 正式開源,權重文件同步上線 Hugging Face、ModelScope 平臺。此前,該模型上線 OpenRouter,并開放限時免費 API 體驗。
Ring-2.6-1T 是一款擁有萬億個參數(shù)的旗艦級推理模型,專為現(xiàn)實世界的復雜任務場景而設計,可供開發(fā)人員、研究人員和企業(yè)環(huán)境進行驗證、調(diào)整和進一步開發(fā)。其核心設計邏輯是“按需思考”,模型引入了可調(diào)節(jié)的 Reasoning Effort 機制,支持 high 與 xhigh 兩種推理強度,開發(fā)者可以根據(jù)任務特性動態(tài)分配推理資源。
項目地址:https://huggingface.co/inclusionAI/Ring-2.6-1T
Ring-2.6-1T 的目標并非僅僅追求更大的參數(shù)規(guī)模,而是為了應對大型模型正在進入的實際生產(chǎn)環(huán)境:代理工作流、工程開發(fā)、科學研究分析、復雜的業(yè)務系統(tǒng)以及企業(yè)自動化流程。在這些場景中,模型不僅需要“回答問題”,還需要理解上下文、規(guī)劃步驟、調(diào)用工具、持續(xù)執(zhí)行,并在長期任務中保持穩(wěn)定性。
Ring-2.6-1T 在三個方面實現(xiàn)了關鍵升級:
全面增強代理執(zhí)行能力:從“能夠回答”到“能夠執(zhí)行”,在多步驟任務、工具協(xié)作、上下文規(guī)劃和推進復雜工作流程方面表現(xiàn)更穩(wěn)定。
Reasoning Effort 機制:支持兩種推理強度級別,high 和 xhigh,允許開發(fā)人員根據(jù)任務復雜性靈活調(diào)整思考深度,從而在效率、速度和成本之間取得更好的平衡。
異步強化學習訓練范式:在訓練層面,Ring-2.6-1T 采用異步(Async)強化學習訓練架構,將策略采樣與參數(shù)更新解耦為獨立流水線,解決了傳統(tǒng)同步訓練中 GPU 資源等待、訓練吞吐不足的問題,并支持更長周期的持續(xù)訓練。在此基礎上,百靈將此前在 Ring-1T 中驗證過的“棒冰算法”引入異步 RL 訓練,解決訓練不穩(wěn)定問題。
百靈表示,相關技術細節(jié)將在后續(xù)技術報告中公開。
![]()
根據(jù)權威評測,Ring-2.6-1T 的兩檔模式各有所長。high 模式下,PinchBench 得分 87.60,高于 GPT-5.4 xHigh 和 Gemini-3.1-Pro high,Tau2-Bench Telecom 達到 95.32,Agent 場景執(zhí)行能力顯著。xhigh 模式下,AIME 26 得分 95.83,接近多家頭部模型水平;GPQA Diamond 達到 88.27,體現(xiàn)出穩(wěn)健的科學知識理解與復雜推理能力。
會議推薦
Agent 從 Demo 到工程化還差什么?安全與可信這道坎怎么過?研發(fā)體系不重構,還能撐多久?
AICon 上海站 2026,13 大重磅專題已上線,誠摯邀請你登臺分享實戰(zhàn)經(jīng)驗。AICon 2026,期待與你同行。快來掃碼鎖定 8 折專屬席位或提交演講議題
今日薦文
你也「在看」嗎?
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.