網易首頁 > 網易號 > 正文 申請入駐

神秘模型排名超 Gemma 4 31B:不跟 Qwen 硬剛,主打“快”和“省 token”

0
分享至


整理 | 褚杏娟

這兩天,OpenRouter 一個名為“Elephant”(大象)的模型,Trending 榜排名突然超過 Gemma 4 31B,位列排行榜第二名。


根據 Kilo 的說法,這款模型來自一家知名開源模型實驗室,主打“智能效率”,在盡量減少 token 消耗的同時,提供接近同規模 SOTA 性能表現。

Elephant 是一款 100B 參數隱身模型(stealth model),支持 256K token 上下文窗口,可以一次性加載整個代碼倉庫或大型依賴樹;最大輸出長度為 32K token,適合單次生成完整模塊或整套測試代碼。與此同時,這款模型還支持提示緩存、函數調用和結構化輸出,明顯面向企業級開發和智能體工具鏈接入場景。

據 Kilo 介紹,Elephant 不是一款單純追求規模的“大模型”,更強調速度、響應和實際開發效率。Elephant 主要針對快速代碼補全與調試、大規模文檔處理以及輕量級智能體交互等場景進行了優化,適合需要高頻調用、低延遲反饋的開發工作流。相比那些更重、更慢的模型,Elephant 希望成為開發者日常使用中的“高響應主力模型”。

具體地,我們將同是 100B 級別的 NVIDIA Nemotron 3 Super、Qwen3.5-122B-A10B,以及 OpenAI 的 gpt-oss-120b 進行了直接對比。

在速度方面,Elephant 最快,平均響應時間約 1.27 秒;Qwen3.5-122B-A10B 最慢,平均約 31.38 秒。Elephant 在數據解析與提取平均響應時間只花了 979 毫秒,綜合項目也只用了 3.70 秒。

相比之下,Qwen3.5-122B-A10B 的表現是靠更高的推理投入換來的,比如編程項目平均響應時間高達 70.98 秒,綜合項目平均響應時間更是達到 107.79 秒,數據解析與提取這類任務也用了 16,558 推理 token。


而在 token 消耗方面,Qwen3.5-122B-A10B 是這組里最“燒 token”的模型,推理 token 遠高于另外三個;gpt-oss-120b 和 Nemotron-3 Super 120B 屬于中間檔;Elephant 基本不消耗。


在指令遵循上,Elephant 在穩定性上表現最突出。其一致性得分達到 9.6,說明它在重復運行中的結果波動最小,是這組模型里最穩定的一款。但 Qwen3.5-122B-A10B 在正確率和通過能力上依然領先,Nemotron-3 Super 120B A12B 表現較為均衡,而 gpt-oss-120b 則暴露出更明顯的波動性。


Elephant 的問題是綜合項目上只有 3.0,在數據解析與提取上是 6.5,側面說明其目前追求的是高頻、低成本、先求有結果再說的場景,而非復雜 agent 工作流或者關鍵判斷任務場景。

因此,如果將各個維度綜合起來打分的話,Qwen3.5-122B-A10B 綜合分 8.1,排第一,NVIDIA Nemotron-3 Super 120B A12B 6.7 分排第二,OpenAI gpt-oss-120b 第三,Elephant Alpha 第四。

與 Elephant Alpha 類似,Nemotron-3 Super 120B A12B 在綜合項目上拿到 10.0,在工具調用上也是 10.0,在數據解析與提取上同樣是 10.0。從結果看,它很適合那種流程清晰、任務邊界明確、強調執行鏈條和調用能力的場景。但它在領域專項上只有 2.9,在通用智能上是 3.8,在謎題求解上只有 3.5,說明一旦任務從“結構化執行”轉向“開放復雜推理”,其掉隊就很明顯。gpt-oss-120b 則在編程項目上只有 4.3,還出現了未遵循指令的問題。

可以看出,雖然同為 100B 級別模型,但大家的研發重點并不相同。

Qwen3.5-122B-A10B 代表了重推理、重完成度路線,有更高的分數和通過率,但需要付出更多延遲和更高推理開銷。而 Nemotron-3 Super 120B A12B 是工作流型路線,它不一定最適合復雜開放問題,但在結構化抽取、工具調用、執行鏈條這類任務上表現突出。新上榜的 Elephant 則代表了極致輕量路線,把“快”和“低成本”做成了核心賣點。

https://aibenchy.com/zh/compare/nvidia-nemotron-3-super-120b-a12b-medium/qwen-qwen3-5-122b-a10b-medium/openrouter-elephant-alpha-medium/openai-gpt-oss-120b-medium/

https://blog.kilo.ai/p/introducing-elephant-a-new-stealth

會議推薦

QCon 全球軟件開發大會·2026 北京站將于 4 月 16 日 -18 日正式舉辦。本屆大會以“Agentic AI 時代的軟件工程重塑”為主題,聚焦 100+ 重磅議題,匯聚來自阿里、騰訊、字節跳動、小米、百度等一線科技企業與創新團隊的技術專家,圍繞 AI 工程化、系統架構與研發模式演進展開深入探討。更多詳情可掃碼或聯系票務經理 18514549229 進行咨詢。

今日薦文

你也「在看」嗎?

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
政治局會議定調“超預期”之后,中國手里至少還握著三張大牌!

政治局會議定調“超預期”之后,中國手里至少還握著三張大牌!

識局Insight
2026-05-07 14:21:37
牡丹花下死!這次拼完四胎想五胎的杜星霖,沒給張紀中留半點體面

牡丹花下死!這次拼完四胎想五胎的杜星霖,沒給張紀中留半點體面

樂天閑聊
2026-03-22 02:42:04
43歲男子和富婆車震后,富婆還想要更多,2016年他將51歲富婆殺死

43歲男子和富婆車震后,富婆還想要更多,2016年他將51歲富婆殺死

漢史趣聞
2026-04-06 19:17:12
孩子脫臼復位只收100元,家長舉報亂收費!衛健委:應收110元,你還少給了!家長拒繳費后離開!

孩子脫臼復位只收100元,家長舉報亂收費!衛健委:應收110元,你還少給了!家長拒繳費后離開!

醫脈圈
2026-04-25 20:04:06
AI沒搶你的工作,它堵死了入口

AI沒搶你的工作,它堵死了入口

五觀不正
2026-05-07 14:28:56
高速免費大改賬:沒了節假日全免,換3000公里隨便跑,是賺是虧?

高速免費大改賬:沒了節假日全免,換3000公里隨便跑,是賺是虧?

娛樂圈的筆娛君
2026-05-06 05:47:30
城市更新大潮來了?中央明確:20年房齡老房子,2026年起或又吃香

城市更新大潮來了?中央明確:20年房齡老房子,2026年起或又吃香

云舟史策
2026-05-07 07:25:25
尷尬極了!母親天天穿緊身褲,女兒吐槽:都快50歲了,穿給誰看呢

尷尬極了!母親天天穿緊身褲,女兒吐槽:都快50歲了,穿給誰看呢

川渝視覺
2026-05-05 20:33:39
中紀委劃紅線:嚴查公務員出現這5種行為,觸碰將一律嚴肅處理

中紀委劃紅線:嚴查公務員出現這5種行為,觸碰將一律嚴肅處理

細說職場
2026-05-06 14:21:03
南韓148cm童顏網紅遭嗆「別再露奶了」 高級反虧:看來你很想看~

南韓148cm童顏網紅遭嗆「別再露奶了」 高級反虧:看來你很想看~

ETtoday星光云
2026-05-07 14:30:17
博主:據了解,若昂-卡洛斯非常想回到遼寧鐵人隊

博主:據了解,若昂-卡洛斯非常想回到遼寧鐵人隊

懂球帝
2026-05-07 10:33:05
醪糟再次被關注!醫生發現:高血脂患者喝醪糟,不用多久4大變化

醪糟再次被關注!醫生發現:高血脂患者喝醪糟,不用多久4大變化

芹姐說生活
2026-04-19 15:52:53
高潔主任:半夜易醒,睡眠淺?每天拍打這處50次,讓你一覺到天亮

高潔主任:半夜易醒,睡眠淺?每天拍打這處50次,讓你一覺到天亮

大明愛養生
2026-04-28 14:17:50
把瑜伽褲穿成日常的松弛感美女

把瑜伽褲穿成日常的松弛感美女

只要高興就好
2026-04-13 14:30:30
兩大史詩級臺球巨擘夸贊吳宜澤:他改寫了臺球歷史,新人應當學習

兩大史詩級臺球巨擘夸贊吳宜澤:他改寫了臺球歷史,新人應當學習

里芃芃體育
2026-05-07 10:54:13
高市早苗之下跪,不是東施效顰,是荒誕不經!

高市早苗之下跪,不是東施效顰,是荒誕不經!

新民周刊
2026-05-07 09:07:23
匿名投票!申京排名第一!斷層領先!

匿名投票!申京排名第一!斷層領先!

柚子說球
2026-05-07 10:29:55
突發!世界冠軍退出元老賽,前往中國撈金,后天首秀,迎75雙雄PK

突發!世界冠軍退出元老賽,前往中國撈金,后天首秀,迎75雙雄PK

劉姚堯的文字城堡
2026-05-07 07:44:55
杭州同學聚會吃了32萬,請客的人付完錢走后,剩下的人翻臉了

杭州同學聚會吃了32萬,請客的人付完錢走后,剩下的人翻臉了

紙鳶奇譚
2025-12-19 14:19:59
47年,一農民給解放軍帶路,問到家人時:我哥參軍18年,叫陳錫聯

47年,一農民給解放軍帶路,問到家人時:我哥參軍18年,叫陳錫聯

歷史龍元閣
2026-05-06 12:20:15
2026-05-07 15:03:00
AI前線 incentive-icons
AI前線
面向AI愛好者、開發者和科學家,提供AI領域技術資訊。
1476文章數 149關注度
往期回顧 全部

科技要聞

凌晨突發!馬斯克租22萬塊GPU給“死敵”

頭條要聞

美國博主自發抵制:不想收錢抹黑中國

頭條要聞

美國博主自發抵制:不想收錢抹黑中國

體育要聞

阿森納巴黎會師歐冠決賽!5月31日開戰

娛樂要聞

小S阿雅重返大S母校,翻看大S畢業照

財經要聞

特朗普:美伊“很有可能”達成協議

汽車要聞

理想為什么不做轎車,有了解釋……

態度原創

健康
房產
數碼
教育
游戲

干細胞治燒燙傷面臨這些“瓶頸”

房產要聞

五一海南樓市,太淡了!

數碼要聞

Q1全球平板排名:蘋果還是霸主,華為第三,小米第五

教育要聞

新傳考研名詞解釋:社會抗爭行為

《FGO》大天使貞德好不好用?《FGO》奏章4貞德養成攻略

無障礙瀏覽 進入關懷版