无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

小米MiMo大模型:榜單排名亮眼,但真實含金量到底有多少?

0
分享至

一直缺席大模型競爭的小米,在天才少女羅福莉的帶領下,終于正式發布了自研大模型 MiMo-V2 系列。

小米近日一口氣拿出 Pro 基座、Omni 全模態、TTS 語音三款模型,主打 Agent 智能體、長上下文與全模態理解。

在官方宣傳中,小米稱 MiMo-V2-Pro 參數規模與上下文長度都做到了當前第一梯隊水平,迅速登頂 OpenRounter 榜單,并拿下 Artificial Analysis 綜合智能排行榜第八。

但一邊是被米粉調侃的“傳奇耐黑王”,一邊是因為營銷宣傳引起幾次大的爭議的事實,小米本次大模型宣傳也引發了爭論。

作為普通用戶,確實很難評價大模型的性能表現。出于謹慎,我們研究了下小米此次重點宣傳的榜單排名,一起看看這些排名成績有多少含金量?

技術實力排名,還是市場運營成果?

小米官方在宣傳中,主要用兩套評價體系支撐 “國際先進” 的定位:一套是 Artificial Analysis 綜合榜單,另一套是 OpenRouter 平臺的調用量排名。

我們先看 Artificial Analysis 榜單。小米 MiMo-V2-Pro 在此榜單中取得全球第八、國內第二的成績,也是其 “國際一流” 說法的主要來源。



Artificial Analysis 榜單的評測方法簡潔明了,核心圍繞智能體能力、代碼、科學推理、通用智能四大維度,涵蓋 10 項高難度基準,采用 “客觀題 + 主觀題” 結合的方式:

客觀題(如代碼運行、數學推理、終端執行)由機器自動判分,確保準確性。

主觀題(如文案生成、邏輯表達、文檔質量)則由 AI 裁判(而非真人)進行盲測打分,采用 Elo 評級方式對比模型表現。

但Artificial Analysis的關鍵問題是,AI 裁判并非完全中立 —— 它有固定的偏好(如偏愛結構清晰、語氣正式的答案),廠商可針對性優化模型輸出,對齊 AI 裁判的打分習慣,從而提升主觀題得分。

不過Artificial Analysis官方也對此做了多項限制,比如采用多 AI 裁判交叉驗證、零樣本測試、高難度動態題庫,大幅降低了針對性優化的空間。

總體而言,這種針對性優化的問題雖不嚴重,不會導致成績完全失真,但肯定存在優化得當使得模型排名可能比其真實綜合實力略高的情況。

再看被廣泛傳播的 OpenRouter 調用量第一榜單。

小米創辦人,董事長兼CEO雷軍發文稱,OpenRounter 是全球最大的大模型API聚合平臺,AI應用開發者可以在這里調用自己想用的模型。這是對模型能力、速度和成本綜合實力考驗。調用量越高,一般意味著開發者的認可度越高。



但實際上,OpenRouter 排名核心指標僅為 Token 總消耗量,并不直接反映模型質量。

這種機制的人為影響因素非常明顯:新品上線常見的大額免費額度、低價補貼、內部測試流量、定向引流等,都能在短期內顯著拉升調用數據。

更關鍵的是,平臺并未區分真實用戶與模型方發起的調用,廠商完全可以通過自身賬號批量主動調用,直接抬高排名。

此次 小米MiMo 以 Hunter Alpha 匿名上線即快速登頂,同期多款國產模型在該平臺出現異常暴漲的調用曲線,可能也側面印證了這類操作的普遍性。

而且調用量只代表被使用的規模,無法體現用戶滿意度、任務完成率與實際效果,更無法等同于模型能力的強弱。

因此 OpenRouter 的排名本質更接近市場運營結果,而非技術實力的客觀證明。

MiMo缺席的榜單

值得注意的是,筆者發現小米MiMo至今并未出現在LMSYS Chatbot Arena的盲測排名中。

筆者曾在之前的文章《國外的模型更好用?我們做了一下專項研究》中,介紹過為什么這個盲測更能說明真實性能。

作為業內最貼近真實用戶體驗、最難被干預的評測體系,LMSYS依靠海量真人匿名雙盲對決形成ELO排名,公信力顯著更高。

小米MiMo未上榜,可能大概率是因為模型剛發布、尚未提交參評,或暫時未接入社區評測平臺,并不直接代表模型能力不足。但小米MiMo確實缺少了最具說服力、最難以造假的第三方口碑佐證。

綜合來看,小米MiMo所主打宣傳的兩套評價體系,的確帶有明顯的營銷傾向,成績中存在可優化、可運營的空間,不能完全等同于模型的絕對實力。

但考慮到大模型的技術難度以及所謂“優化榜單排名”的難度,即便剔除榜單水分,MiMo在架構設計、能力方向與實際表現上依然具備扎實基礎,足以躋身國內第一梯隊優秀大模型行列,并非虛有其表。

更關鍵的是,MiMo從底層設計就重點強化了Agent智能體能力,而小米本身擁有手機、汽車、智能家居等完整的硬件生態。模型擅長的工具調用、多步規劃、跨設備執行,恰好能與小米的全場景硬件深度結合。

并且,小米還有“超能力”,雷軍宣布,在AI領域,小米今年的研發和資本投入就將超過160億元。

榜單排名只是短期話題,模型與生態的協同落地,才是MiMo未來真正值得期待的長期價值。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
一碗隔夜米飯毒死7人?醫生警告:米飯盡量別這樣吃,比砒霜還毒

一碗隔夜米飯毒死7人?醫生警告:米飯盡量別這樣吃,比砒霜還毒

路醫生健康科普
2026-05-31 20:15:03
鎧俠超越豐田成為日本市值最高的公司

鎧俠超越豐田成為日本市值最高的公司

界面新聞
2026-06-12 14:34:31
舉報成風,正在毀掉中國教育的根基!

舉報成風,正在毀掉中國教育的根基!

霹靂炮
2026-06-09 22:40:49
馬科斯怎么都料不到!在仁愛礁坐灘27年的破船,卻意外助力中國了

馬科斯怎么都料不到!在仁愛礁坐灘27年的破船,卻意外助力中國了

共工之錨
2026-06-10 00:41:05
70%比賽在凌晨和上午,國內傳統啤酒巨頭均未與世界杯簽約,五糧液首次以“官方聯名產品合作伙伴”的身份入局

70%比賽在凌晨和上午,國內傳統啤酒巨頭均未與世界杯簽約,五糧液首次以“官方聯名產品合作伙伴”的身份入局

大風新聞
2026-06-12 15:44:23
人類戰爭史第一次!10架無人機自己開火打死俄軍,全程沒人下令

人類戰爭史第一次!10架無人機自己開火打死俄軍,全程沒人下令

戰域筆墨
2026-06-12 06:06:08
鵝腿阿姨十年間賺了多少錢!至少也有600萬了

鵝腿阿姨十年間賺了多少錢!至少也有600萬了

金牌娛樂
2026-06-11 09:56:47
高校女領導出軌人夫,近照曝光,細節不堪入目,校方最新回應來了

高校女領導出軌人夫,近照曝光,細節不堪入目,校方最新回應來了

知法而形
2026-06-11 19:39:41
我國破獲大型假冒“特供酒”案 七家電商將被罰

我國破獲大型假冒“特供酒”案 七家電商將被罰

新華社
2026-06-12 13:33:01
領先廣東?新疆內線引援曝光 NBA黑硬中鋒來襲 根治內線頑疾?

領先廣東?新疆內線引援曝光 NBA黑硬中鋒來襲 根治內線頑疾?

你看球呢
2026-06-11 19:32:56
上海金橋有輛車直接“飛”到了雕塑頂上 官方:不是意外!是當地鎮標“飛車”雕塑

上海金橋有輛車直接“飛”到了雕塑頂上 官方:不是意外!是當地鎮標“飛車”雕塑

閃電新聞
2026-06-12 21:52:57
炸了!伊朗上當了

炸了!伊朗上當了

新動察
2026-06-12 10:20:21
影子市場交易預示SpaceX股票漲幅超過35%

影子市場交易預示SpaceX股票漲幅超過35%

財聯社
2026-06-12 13:26:12
全員跑路!東方甄選初代主播全軍覆沒,離職潮根本剎不住

全員跑路!東方甄選初代主播全軍覆沒,離職潮根本剎不住

雷科技
2026-06-11 12:07:08
12秒64!平黃種人女子100米欄紀錄,江西女孩大幅超越吳艷妮

12秒64!平黃種人女子100米欄紀錄,江西女孩大幅超越吳艷妮

一枚野球君
2026-06-12 07:04:25
我試玩了《古墓麗影》新作,結果卡了一個小時

我試玩了《古墓麗影》新作,結果卡了一個小時

山月不知2
2026-06-11 21:07:56
張雪被坑慘!“生銹門”反轉,原來手里囤了幾百萬雅馬哈賣不動?

張雪被坑慘!“生銹門”反轉,原來手里囤了幾百萬雅馬哈賣不動?

情感的我
2026-06-12 11:44:59
一份擺在美國情報部門案頭的報告:中國到底在等什么

一份擺在美國情報部門案頭的報告:中國到底在等什么

民間胡扯老哥
2026-06-08 07:20:06
Here we go!羅馬諾:圣馬克西曼自由身加盟夏洛特,簽約三年

Here we go!羅馬諾:圣馬克西曼自由身加盟夏洛特,簽約三年

懂球帝
2026-06-12 15:13:15
NBA總決賽馬刺尼克斯G5開球時間確定,央視直播引球迷熱情

NBA總決賽馬刺尼克斯G5開球時間確定,央視直播引球迷熱情

阿嚼影視評論
2026-06-11 23:27:45
2026-06-13 00:03:00
科技浮世繪 incentive-icons
科技浮世繪
文字是假的,熱愛是真的
223文章數 8關注度
往期回顧 全部

數碼要聞

英特爾啟動“螢火蟲計劃” 用手機零部件重塑低價筆記本

頭條要聞

美加墨世界杯第二場比賽就現空座 英媒:尷尬

頭條要聞

美加墨世界杯第二場比賽就現空座 英媒:尷尬

體育要聞

歐洲恐韓?肉德維德?

娛樂要聞

一天4個瓜,肖戰熱巴最意外

財經要聞

萬億美元順差背后,透露這些信號

科技要聞

剛剛,人類歷史上首位萬億美元富豪誕生!

汽車要聞

標配激光雷達/雙動力可選 昊鉑S600限時售17.99萬起

態度原創

游戲
家居
本地
房產
公開課

《網球王子》新作大量情報官宣!任天堂主機端獨占

家居要聞

空間微調 移形換境

本地新聞

AK劉彰邂逅河北南大港濕地

房產要聞

海南最賺錢行業曝光!最快4年半,海口全款買三房!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版