網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

利潤腰斬也要卷AI！小米模型永久降價(jià)99%，雷軍還要再砸600億

2026-05-27 13:21:42　來源: AI前線

北京舉報(bào)

分享至

作者 | 華衛(wèi)

今日，小米宣布永久性翻新整個(gè)模型定價(jià)體系。價(jià)格調(diào)整公告稱，MiMo-V2.5 系列 API 實(shí)施永久降價(jià)，最高降幅達(dá) 99%，于北京時(shí)間 5 月 27 日 0：00 正式生效且全球同步。

繼 DeepSeek 之后，小米成為又一家宣布 API 永久降價(jià)的大模型廠商。然而，在大方地向全球開放模型訪問的同時(shí)，小米剛剛發(fā)布的 2026 年 Q1 財(cái)報(bào)卻顯示利潤腰斬、營收下滑。

降價(jià)力度空前，不限上下文、

Token 額度翻至 8 倍

此次價(jià)格調(diào)整覆蓋 MiMo-V2.5 和 MiMo-V2.5 Pro 兩個(gè)版本，與原 API 定價(jià)相比，新定價(jià)最高可減少 99%，且不再根據(jù)輸入長度進(jìn)行區(qū)分。

具體來看，MiMo-V2.5 Pro 的輸入緩存命中價(jià)格降至 0.025 元 / 百萬 tokens，相較于原價(jià)≤256k 規(guī)格 1.40 元降幅達(dá) 98%，對(duì)比 256k-1M 規(guī)格 2.80 元降幅更是觸及 99%；輸入未命中緩存定價(jià) 3.000 元 / 百萬 tokens，較原價(jià) 7.00 元下降 57%，對(duì)比長窗口原價(jià) 14.00 元降幅 79%；輸出定價(jià) 6 元 / 百萬 tokens，相較原價(jià) 21 元、42 元分別下降 71% 與 86%。

MiMo-V2.5 的輸入緩存命中價(jià)格降至 0.02 元 / 百萬 tokens，較≤256k 原價(jià) 0.56 元降幅 96%，較 256k-1M 原價(jià) 1.12 元降幅 98%；輸入未命中緩存定價(jià) 1.000 元 / 百萬 tokens，相比原價(jià) 2.80 元降幅 64%，對(duì)比長窗口原價(jià) 5.60 元降幅 82%；輸出定價(jià) 2 元 / 百萬 tokens，較原價(jià) 14 元、28 元分別下滑 86% 與 93%。

除了 API 價(jià)格下調(diào)外，MiMo 的 Token Plan 計(jì)費(fèi)體系也同步迎來重大優(yōu)化：增加數(shù)量但不漲價(jià)，使用量提升到原來的 5-8 倍。在公告中，小米列出了調(diào)整后的詳細(xì)計(jì)費(fèi)規(guī)則，如下：

此外，無論當(dāng)前使用情況如何，所有已訂閱代幣計(jì)劃且仍在有效期內(nèi)的用戶（包括參與 Quadrillion 代幣創(chuàng)建者激勵(lì)計(jì)劃并獲得代幣計(jì)劃的用戶，涵蓋 Apache 軟件基金會(huì)獨(dú)家福利的用戶）的積分配額于北京時(shí)間 5 月 27 日 0：00 完全重置，并根據(jù)新的計(jì)費(fèi)規(guī)則實(shí)施。對(duì)于代幣計(jì)劃已過期的歷史付費(fèi)用戶，小米準(zhǔn)備了驚喜禮物，將在下周內(nèi)公布。

值得注意的是，本次調(diào)價(jià)主要聚焦 MiMo-V2.5 核心系列，MiMo-V2.5-TTS 系列依舊保持限時(shí)免費(fèi)接入政策，而 MiMo-V2-Pro 與 MiMo-V2-Omni 兩款高階模型 API 價(jià)格維持原價(jià)不變，同時(shí)其 Token Plan 套餐也不再參與調(diào)整并即將下線，引導(dǎo)開發(fā)者向高性價(jià)比的 V2.5 系列遷移。

據(jù)了解，MiMo-V2.5 系列的迭代由曾任職 DeepSeek 的 95 后 AI 技術(shù)人才羅福莉負(fù)責(zé)。在整個(gè) MiMo 大模型產(chǎn)品矩陣中，MiMo-V2.5-Pro 主打高性能復(fù)雜推理，適配企業(yè)級(jí)智能體開發(fā)、深度業(yè)務(wù)分析等高階商用場景；MiMo-V2.5 聚焦輕量化通用需求，主打中小開發(fā)者日常調(diào)用與輕量化應(yīng)用落地；MiMo-V2.5-TTS 則瞄準(zhǔn)語音合成賽道，以免費(fèi)策略搶占音頻生態(tài)入口。

營收利潤都跌麻了

雷軍：AI 還得再投 600 億

對(duì)于此次價(jià)格調(diào)整的原因，小米稱，這背后是其技術(shù)團(tuán)隊(duì)對(duì)推理系統(tǒng)的持續(xù)優(yōu)化。“我們完全支持基于 SGLang HiCache 的 SWA（滑動(dòng)窗口注意力），將 KV 緩存在 GPU 內(nèi)存、CPU 內(nèi)存和 SSD 等多級(jí)存儲(chǔ)之間的數(shù)據(jù)傳輸量減少到優(yōu)化前的近 7 分之一，并將可緩存 token 數(shù)量提升到優(yōu)化前近 5 倍，顯著提升了緩存命中率和推理效率。同時(shí)，我們通過優(yōu)化專家并行方案、輸入長度分桶策略等，進(jìn)一步提升了集群的輸入吞吐量容量，持續(xù)降低每枚 token 的服務(wù)成本，同時(shí)確保服務(wù)質(zhì)量。”

在公告中，小米還強(qiáng)調(diào)，“技術(shù)的價(jià)值最終在于其廣泛的使用。讓更多人使用更好的模型，這是 MiMo 堅(jiān)定不移的使命。”

據(jù)了解，小米當(dāng)前在 AI 方面的底層研發(fā)投入數(shù)額已然十分龐大。北京時(shí)間 5 月 26 日晚，小米發(fā)布了 2026 年第一季度財(cái)報(bào)（截止 2026 年 3 月）。在技術(shù)創(chuàng)新領(lǐng)域，小米本季度研發(fā)支出達(dá) 90 億元，同比增長 33.4%，研發(fā)團(tuán)隊(duì)規(guī)模擴(kuò)大至 26048 人。不過相較從 2025 年第四季度 96 億元的研發(fā)開支，這季度已經(jīng)減少 6.7%，小米稱“主要是基于手機(jī) xAIoT 相關(guān)的研發(fā)項(xiàng)目進(jìn)度所致”。

然而，從整體財(cái)報(bào)數(shù)據(jù)來看，小米這季度的營收、毛利率、經(jīng)營利潤、經(jīng)調(diào)整利潤無論是同比還是環(huán)比都出現(xiàn)不同程度地下滑。一季度小米總收入錄得 991.4 億元，同比下跌 10.9%；經(jīng)調(diào)整凈利潤也從 106.8 億元回落至 60.7 億元，跌幅達(dá) 43.1%；毛利為 218.1 億元，同比下跌 14.2%。經(jīng)營利潤承壓更為嚴(yán)重，從去年同期的 131.3 億元大跌 59.5% 至 53.1 億元。

盡管如此，小米仍計(jì)劃持續(xù)加大 AI 領(lǐng)域的資金投入。就在昨日，小米創(chuàng)始人雷軍表示，“Xiaomi MiMo-V2.5-Pro 躋身 Artificial Analysis 榜單綜合智能指數(shù)、Agent 指數(shù)全球開源模型并列第一。小米今年 AI 投入至少 160 億元，未來三年在 AI 領(lǐng)域計(jì)劃投入 600 億元。”

國內(nèi)外 AI 定價(jià)分化，

海外網(wǎng)友：疑惑但“我選中國模型”

在小米宣布降價(jià)前不久，國內(nèi)另一頭部大模型公司 DeepSeek 已先一步開啟“永久降價(jià)”。該公司宣布，DeepSeek-V4-Pro 模型 API 價(jià)格在 5 月 31 日結(jié)束 2.5 折的限時(shí)優(yōu)惠后，永久調(diào)整為原定價(jià)的 1/4。調(diào)價(jià)后，這一模型的輸入緩存命中 0.025 元 / 百萬 tokens、未命中緩存 3 元 / 百萬 tokens、輸出 6 元 / 百萬 tokens，相較原價(jià)實(shí)現(xiàn) 75% 的降幅。

實(shí)際上，在 4 月 24 日上線并同步開源后，DeepSeek V4-Pro 模型的原價(jià)只維持了兩天。4 月 26 日，DeepSeek 就宣布限時(shí) 2.5 折優(yōu)惠，優(yōu)惠期截至 5 月 5 日。4 月 28 日，該公司又宣布將優(yōu)惠期延長至 5 月 31 日。現(xiàn)在，定價(jià)直接降至了原來的 1/4。如今，DeepSeek V4-Pro 的調(diào)用價(jià)格，已經(jīng)低得有些“離譜”了，比 GPT-5.5 便宜 34 倍。

有海外網(wǎng)友表示，“我已經(jīng)迫不及待想搭建一個(gè)大模型集群，用上百個(gè) DeepSeek 和 Mimo 模型協(xié)同運(yùn)行。如今真是技術(shù)狂飆的時(shí)代。”網(wǎng)友們表示，“在人工評(píng)測榜單上，小米 MiMo 僅比 Opus 低 3 分，價(jià)格便宜了百倍以上，性能差距卻微乎其微。即便只是 DeepSeek V4 Flash（還不是 Pro 版），調(diào)到高性能檔位后，能力基本比肩 Claude Opus 4.7，響應(yīng)速度極快，成本還極低。連續(xù)對(duì)話數(shù)小時(shí)，花費(fèi)也才幾美分。”

還有人指出，“除了 Deepseek 和小米，現(xiàn)在很多 AI 實(shí)驗(yàn)室都會(huì)騙你緩存讀取。如果你為緩存讀取花了不少錢，實(shí)際上是在為幾秒鐘的顯存時(shí)間付出高昂的代價(jià)。自回歸語言建模的本質(zhì)在于，每一個(gè)輸出 token 都會(huì)‘讀取’緩存。所以原則上，緩存命中的價(jià)格下限是 1 個(gè)輸出 token 的固定成本。但實(shí)際上，情況可能不止于此，因?yàn)槟阌镁彺嬲加昧孙@存，迫使其他用戶退出。”

“所有美國公司（OpenAI、Anthropic、Google、MS Copilot）最近都漲價(jià)了，而中國公司則在降價(jià)。問題是，他們是怎么做到的？按理說，他們本應(yīng)因芯片制裁更吃力才對(duì)。其次，為什么是現(xiàn)在？原本美國公司也被認(rèn)為會(huì)通過補(bǔ)貼來維持競爭力，但現(xiàn)在他們已經(jīng)跟不上了。大家都在轉(zhuǎn)向按使用量計(jì)費(fèi)的模式，這對(duì)他們來說似乎不可持續(xù)。畢竟他們的資金也很充足。如果真的存在能夠降低算力需求的硬件突破，我相信這對(duì)全世界來說都是一件好事。“有海外網(wǎng)友發(fā)出疑問。

據(jù)了解，除小米與 DeepSeek 外，國內(nèi)的阿里云通義千問、字節(jié)跳動(dòng)豆包等通用型大模型相繼下調(diào) API 調(diào)用價(jià)格。

今年以來，全球在線 AI 托管平臺(tái) OpenRouter 上，中國大模型連續(xù)占據(jù)前列，包括小米 MiMo 、階躍星辰 Step 3.5 Flash、MiniMax、DeepSeek、Kimi 等。而 OpenRouter 的“霸榜”邏輯無非是，在 API 夠用的情況下，調(diào)用成本越低廉，調(diào)用總量排名就越高。

“借助中國模型，誰都能用上高性價(jià)比的 AI 服務(wù)。”有網(wǎng)友說道，“當(dāng)前美國 AI 公司幾乎沒有機(jī)會(huì)收回哪怕一小部分估值。”

聲明：本文為 AI 前線整理，不代表平臺(tái)觀點(diǎn)，未經(jīng)許可禁止轉(zhuǎn)載。

會(huì)議推薦

但企業(yè)級(jí) Agent 落地，繞不開 4 個(gè)真實(shí)的工程問題。如何在 Agent 安全性和可用性之間找到平衡點(diǎn)？Agent 需要什么樣的記憶系統(tǒng)才能真正理解上下文？如何通過算法壓榨實(shí)現(xiàn)智力增量與成本控制的極致平衡？多 Agent 協(xié)作，如何做到可觀測、可治理、可控制？6 月 26-27 日，AICon 全球人工智能開發(fā)與應(yīng)用大會(huì)·上海站國內(nèi)頭部公司的 Agent 實(shí)踐，一次說透。

今日薦文

你也「在看」嗎？

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.