5 月 15 日,螞蟻百靈宣布其旗艦級思考模型 Ring-2.6-1T 正式開源,權重文件同步上線 Hugging Face、ModelScope 平臺。此前,該模型上線 OpenRouter,并開放限時免費 API 體驗。
Ring-2.6-1T 的核心設計邏輯是“按需思考”,模型引入了可調(diào)節(jié)的 Reasoning Effort 機制,支持 high 與 xhigh 兩種推理強度,開發(fā)者可以根據(jù)任務特性動態(tài)分配推理資源。其中,high 模式面向高頻 Agent 工作流獲得更高效率,適合多輪對話、工具協(xié)作與任務拆解;xhigh 模式則面向數(shù)學競賽、科研分析等高難任務,釋放能力上限。有開發(fā)者表示,這是“工程實用性”的進步。
根據(jù)權威評測,Ring-2.6-1T 的兩檔模式各有所長。high 模式下,PinchBench 得分 87.60,高于 GPT-5.4 xHigh和Gemini-3.1-Pro high,Tau2-Bench Telecom 達到 95.32,Agent 場景執(zhí)行能力顯著。xhigh 模式下,AIME 26 得分 95.83,接近多家頭部模型水平;GPQA Diamond 達到 88.27,體現(xiàn)出穩(wěn)健的科學知識理解與復雜推理能力。
![]()
在訓練層面,Ring-2.6-1T 采用異步(Async)強化學習訓練架構,將策略采樣與參數(shù)更新解耦為獨立流水線,解決了傳統(tǒng)同步訓練中 GPU 資源等待、訓練吞吐不足的問題,并支持更長周期的持續(xù)訓練。在此基礎上,百靈將此前在 Ring-1T 中驗證過的“棒冰算法”引入異步 RL 訓練,解決訓練不穩(wěn)定問題。百靈表示,相關技術細節(jié)將在后續(xù)技術報告中公開。
近一個月內(nèi),百靈迭代發(fā)布并開源了多款模型,覆蓋 Ling 語言模型和 Ring 推理模型。記者注意到,相較于追求更大的參數(shù)規(guī)模或更高的單點分數(shù),百靈更強調(diào)“真實生產(chǎn)環(huán)境使用”,系列模型集體切入“Token Efficiency”,強調(diào)用更少的 token 完成高質(zhì)量的任務輸出。市場對此也有明確反饋,Ling-2.6-flash 的匿名測試版本“Elephant Alpha”上線 OpenRouter 后,連續(xù)多日位列 Trending 榜首,日均 tokens 調(diào)用量達到100B級別。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.