![]()
作者 | 華衛(wèi)
今日,小米宣布永久性翻新整個(gè)模型定價(jià)體系。價(jià)格調(diào)整公告稱,MiMo-V2.5 系列 API 實(shí)施永久降價(jià),最高降幅達(dá) 99%,于北京時(shí)間 5 月 27 日 0:00 正式生效且全球同步。
![]()
繼 DeepSeek 之后,小米成為又一家宣布 API 永久降價(jià)的大模型廠商。然而,在大方地向全球開放模型訪問的同時(shí),小米剛剛發(fā)布的 2026 年 Q1 財(cái)報(bào)卻顯示利潤腰斬、營收下滑。
降價(jià)力度空前,不限上下文、
Token 額度翻至 8 倍
此次價(jià)格調(diào)整覆蓋 MiMo-V2.5 和 MiMo-V2.5 Pro 兩個(gè)版本,與原 API 定價(jià)相比,新定價(jià)最高可減少 99%,且不再根據(jù)輸入長度進(jìn)行區(qū)分。
具體來看,MiMo-V2.5 Pro 的輸入緩存命中價(jià)格降至 0.025 元 / 百萬 tokens,相較于原價(jià)≤256k 規(guī)格 1.40 元降幅達(dá) 98%,對(duì)比 256k-1M 規(guī)格 2.80 元降幅更是觸及 99%;輸入未命中緩存定價(jià) 3.000 元 / 百萬 tokens,較原價(jià) 7.00 元下降 57%,對(duì)比長窗口原價(jià) 14.00 元降幅 79%;輸出定價(jià) 6 元 / 百萬 tokens,相較原價(jià) 21 元、42 元分別下降 71% 與 86%。
MiMo-V2.5 的輸入緩存命中價(jià)格降至 0.02 元 / 百萬 tokens,較≤256k 原價(jià) 0.56 元降幅 96%,較 256k-1M 原價(jià) 1.12 元降幅 98%;輸入未命中緩存定價(jià) 1.000 元 / 百萬 tokens,相比原價(jià) 2.80 元降幅 64%,對(duì)比長窗口原價(jià) 5.60 元降幅 82%;輸出定價(jià) 2 元 / 百萬 tokens,較原價(jià) 14 元、28 元分別下滑 86% 與 93%。
除了 API 價(jià)格下調(diào)外,MiMo 的 Token Plan 計(jì)費(fèi)體系也同步迎來重大優(yōu)化:增加數(shù)量但不漲價(jià),使用量提升到原來的 5-8 倍。在公告中,小米列出了調(diào)整后的詳細(xì)計(jì)費(fèi)規(guī)則,如下:
![]()
此外,無論當(dāng)前使用情況如何,所有已訂閱代幣計(jì)劃且仍在有效期內(nèi)的用戶(包括參與 Quadrillion 代幣創(chuàng)建者激勵(lì)計(jì)劃并獲得代幣計(jì)劃的用戶,涵蓋 Apache 軟件基金會(huì)獨(dú)家福利的用戶)的積分配額于北京時(shí)間 5 月 27 日 0:00 完全重置,并根據(jù)新的計(jì)費(fèi)規(guī)則實(shí)施。對(duì)于代幣計(jì)劃已過期的歷史付費(fèi)用戶,小米準(zhǔn)備了驚喜禮物,將在下周內(nèi)公布。
值得注意的是,本次調(diào)價(jià)主要聚焦 MiMo-V2.5 核心系列,MiMo-V2.5-TTS 系列依舊保持限時(shí)免費(fèi)接入政策,而 MiMo-V2-Pro 與 MiMo-V2-Omni 兩款高階模型 API 價(jià)格維持原價(jià)不變,同時(shí)其 Token Plan 套餐也不再參與調(diào)整并即將下線,引導(dǎo)開發(fā)者向高性價(jià)比的 V2.5 系列遷移。
據(jù)了解,MiMo-V2.5 系列的迭代由曾任職 DeepSeek 的 95 后 AI 技術(shù)人才羅福莉負(fù)責(zé)。在整個(gè) MiMo 大模型產(chǎn)品矩陣中,MiMo-V2.5-Pro 主打高性能復(fù)雜推理,適配企業(yè)級(jí)智能體開發(fā)、深度業(yè)務(wù)分析等高階商用場景;MiMo-V2.5 聚焦輕量化通用需求,主打中小開發(fā)者日常調(diào)用與輕量化應(yīng)用落地;MiMo-V2.5-TTS 則瞄準(zhǔn)語音合成賽道,以免費(fèi)策略搶占音頻生態(tài)入口。
營收利潤都跌麻了
雷軍:AI 還得再投 600 億
對(duì)于此次價(jià)格調(diào)整的原因,小米稱,這背后是其技術(shù)團(tuán)隊(duì)對(duì)推理系統(tǒng)的持續(xù)優(yōu)化。“我們完全支持基于 SGLang HiCache 的 SWA(滑動(dòng)窗口注意力),將 KV 緩存在 GPU 內(nèi)存、CPU 內(nèi)存和 SSD 等多級(jí)存儲(chǔ)之間的數(shù)據(jù)傳輸量減少到優(yōu)化前的近 7 分之一,并將可緩存 token 數(shù)量提升到優(yōu)化前近 5 倍,顯著提升了緩存命中率和推理效率。同時(shí),我們通過優(yōu)化專家并行方案、輸入長度分桶策略等,進(jìn)一步提升了集群的輸入吞吐量容量,持續(xù)降低每枚 token 的服務(wù)成本,同時(shí)確保服務(wù)質(zhì)量。”
在公告中,小米還強(qiáng)調(diào),“技術(shù)的價(jià)值最終在于其廣泛的使用。讓更多人使用更好的模型,這是 MiMo 堅(jiān)定不移的使命。”
據(jù)了解,小米當(dāng)前在 AI 方面的底層研發(fā)投入數(shù)額已然十分龐大。北京時(shí)間 5 月 26 日晚,小米發(fā)布了 2026 年第一季度財(cái)報(bào)(截止 2026 年 3 月)。在技術(shù)創(chuàng)新領(lǐng)域,小米本季度研發(fā)支出達(dá) 90 億元,同比增長 33.4%,研發(fā)團(tuán)隊(duì)規(guī)模擴(kuò)大至 26048 人。不過相較從 2025 年第四季度 96 億元的研發(fā)開支,這季度已經(jīng)減少 6.7%,小米稱“主要是基于手機(jī) xAIoT 相關(guān)的研發(fā)項(xiàng)目進(jìn)度所致”。
![]()
然而,從整體財(cái)報(bào)數(shù)據(jù)來看,小米這季度的營收、毛利率、經(jīng)營利潤、經(jīng)調(diào)整利潤無論是同比還是環(huán)比都出現(xiàn)不同程度地下滑。一季度小米總收入錄得 991.4 億元,同比下跌 10.9%;經(jīng)調(diào)整凈利潤也從 106.8 億元回落至 60.7 億元,跌幅達(dá) 43.1%;毛利為 218.1 億元,同比下跌 14.2%。經(jīng)營利潤承壓更為嚴(yán)重,從去年同期的 131.3 億元大跌 59.5% 至 53.1 億元。
盡管如此,小米仍計(jì)劃持續(xù)加大 AI 領(lǐng)域的資金投入。就在昨日,小米創(chuàng)始人雷軍表示,“Xiaomi MiMo-V2.5-Pro 躋身 Artificial Analysis 榜單綜合智能指數(shù)、Agent 指數(shù)全球開源模型并列第一。小米今年 AI 投入至少 160 億元,未來三年在 AI 領(lǐng)域計(jì)劃投入 600 億元。”
國內(nèi)外 AI 定價(jià)分化,
海外網(wǎng)友:疑惑但“我選中國模型”
在小米宣布降價(jià)前不久,國內(nèi)另一頭部大模型公司 DeepSeek 已先一步開啟“永久降價(jià)”。該公司宣布,DeepSeek-V4-Pro 模型 API 價(jià)格在 5 月 31 日結(jié)束 2.5 折的限時(shí)優(yōu)惠后,永久調(diào)整為原定價(jià)的 1/4。調(diào)價(jià)后,這一模型的輸入緩存命中 0.025 元 / 百萬 tokens、未命中緩存 3 元 / 百萬 tokens、輸出 6 元 / 百萬 tokens,相較原價(jià)實(shí)現(xiàn) 75% 的降幅。
實(shí)際上,在 4 月 24 日上線并同步開源后,DeepSeek V4-Pro 模型的原價(jià)只維持了兩天。4 月 26 日,DeepSeek 就宣布限時(shí) 2.5 折優(yōu)惠,優(yōu)惠期截至 5 月 5 日。4 月 28 日,該公司又宣布將優(yōu)惠期延長至 5 月 31 日。現(xiàn)在,定價(jià)直接降至了原來的 1/4。如今,DeepSeek V4-Pro 的調(diào)用價(jià)格,已經(jīng)低得有些“離譜”了,比 GPT-5.5 便宜 34 倍。
有海外網(wǎng)友表示,“我已經(jīng)迫不及待想搭建一個(gè)大模型集群,用上百個(gè) DeepSeek 和 Mimo 模型協(xié)同運(yùn)行。如今真是技術(shù)狂飆的時(shí)代。”網(wǎng)友們表示,“在人工評(píng)測榜單上,小米 MiMo 僅比 Opus 低 3 分,價(jià)格便宜了百倍以上,性能差距卻微乎其微。即便只是 DeepSeek V4 Flash(還不是 Pro 版),調(diào)到高性能檔位后,能力基本比肩 Claude Opus 4.7,響應(yīng)速度極快,成本還極低。連續(xù)對(duì)話數(shù)小時(shí),花費(fèi)也才幾美分。”
還有人指出,“除了 Deepseek 和小米,現(xiàn)在很多 AI 實(shí)驗(yàn)室都會(huì)騙你緩存讀取。如果你為緩存讀取花了不少錢,實(shí)際上是在為幾秒鐘的顯存時(shí)間付出高昂的代價(jià)。自回歸語言建模的本質(zhì)在于,每一個(gè)輸出 token 都會(huì)‘讀取’緩存。所以原則上,緩存命中的價(jià)格下限是 1 個(gè)輸出 token 的固定成本。但實(shí)際上,情況可能不止于此,因?yàn)槟阌镁彺嬲加昧孙@存,迫使其他用戶退出。”
“所有美國公司(OpenAI、Anthropic、Google、MS Copilot)最近都漲價(jià)了,而中國公司則在降價(jià)。問題是,他們是怎么做到的?按理說,他們本應(yīng)因芯片制裁更吃力才對(duì)。其次,為什么是現(xiàn)在?原本美國公司也被認(rèn)為會(huì)通過補(bǔ)貼來維持競爭力,但現(xiàn)在他們已經(jīng)跟不上了。大家都在轉(zhuǎn)向按使用量計(jì)費(fèi)的模式,這對(duì)他們來說似乎不可持續(xù)。畢竟他們的資金也很充足。如果真的存在能夠降低算力需求的硬件突破,我相信這對(duì)全世界來說都是一件好事。“有海外網(wǎng)友發(fā)出疑問。
據(jù)了解,除小米與 DeepSeek 外,國內(nèi)的阿里云通義千問、字節(jié)跳動(dòng)豆包等通用型大模型相繼下調(diào) API 調(diào)用價(jià)格。
今年以來,全球在線 AI 托管平臺(tái) OpenRouter 上,中國大模型連續(xù)占據(jù)前列,包括小米 MiMo 、階躍星辰 Step 3.5 Flash、MiniMax、DeepSeek、Kimi 等。而 OpenRouter 的“霸榜”邏輯無非是,在 API 夠用的情況下,調(diào)用成本越低廉,調(diào)用總量排名就越高。
“借助中國模型,誰都能用上高性價(jià)比的 AI 服務(wù)。”有網(wǎng)友說道,“當(dāng)前美國 AI 公司幾乎沒有機(jī)會(huì)收回哪怕一小部分估值。”
聲明:本文為 AI 前線整理,不代表平臺(tái)觀點(diǎn),未經(jīng)許可禁止轉(zhuǎn)載。
會(huì)議推薦
但企業(yè)級(jí) Agent 落地,繞不開 4 個(gè)真實(shí)的工程問題。如何在 Agent 安全性和可用性之間找到平衡點(diǎn)?Agent 需要什么樣的記憶系統(tǒng)才能真正理解上下文?如何通過算法壓榨實(shí)現(xiàn)智力增量與成本控制的極致平衡?多 Agent 協(xié)作,如何做到可觀測、可治理、可控制?6 月 26-27 日,AICon 全球人工智能開發(fā)與應(yīng)用大會(huì)·上海站國內(nèi)頭部公司的 Agent 實(shí)踐,一次說透。
今日薦文
你也「在看」嗎?
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.