網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

突發(fā)，小米降價(jià)99%，成價(jià)格屠夫！

2026-05-28 09:45:30　來(lái)源: 科技每日推送

廣東舉報(bào)

分享至

繼DeepSeek宣布永久降價(jià)后，又一家國(guó)產(chǎn)大模型宣布降價(jià)了。

5月27日凌晨，小米宣布MiMo-V2.5系列API永久降價(jià)，最高降幅達(dá)99%，且不再區(qū)分輸入長(zhǎng)度。

同時(shí)對(duì)Token Plan計(jì)費(fèi)體系進(jìn)行優(yōu)化，同樣的套餐價(jià)格，用量提升至原來(lái)的5-8倍。

所有已訂閱Token Plan且在有效期內(nèi)的用戶，從今天0點(diǎn)起全部重置按照新計(jì)費(fèi)規(guī)則執(zhí)行。

小米創(chuàng)始人雷軍，隨后在微博也轉(zhuǎn)發(fā)了這條降價(jià)消息。

國(guó)產(chǎn)模型降成白菜價(jià)

對(duì)比國(guó)外模型價(jià)格優(yōu)勢(shì)明顯

公告顯示，MiMo-V2.5-Pro調(diào)價(jià)后，輸入緩存命中價(jià)格降至0.025元/百萬(wàn)tokens，輸入未命中緩存3元/百萬(wàn)tokens，輸出6元/百萬(wàn)tokens。

它跟幾天前DeepSeek-V4-Pro宣布降價(jià)后的價(jià)格剛好一致。

自今年年以來(lái)，國(guó)內(nèi)頭部大模型廠商已掀起一輪持續(xù)、全面的降價(jià)潮，價(jià)格堪稱“白菜價(jià)”。

按照每百萬(wàn)tokens的單價(jià)，Kimi-k2.6緩存命中輸入價(jià)1.1元，緩存未命中輸入價(jià)6.5元，輸出價(jià)27元。

其他模型價(jià)格具體如下圖：

而對(duì)比海外主流模型，國(guó)產(chǎn)大模型的價(jià)格優(yōu)勢(shì)堪稱碾壓級(jí)。

MiMo-V2.5-Pro的輸入價(jià)格僅為Claude-opus-4.7的三十六分之一，輸出價(jià)格更是達(dá)到九十分之一。

在這樣巨大的價(jià)格差下，一些外國(guó)碼農(nóng)都受不了，反向代購(gòu)中國(guó)大模型。

硬件和云在暴漲，token在暴跌

利潤(rùn)到底從哪來(lái)？

極具反差的是，當(dāng)國(guó)內(nèi)模型token降價(jià)的同時(shí)，底層的硬件、云算力成本卻在持續(xù)暴漲。

全球AI算力、云服務(wù)、硬件設(shè)備全面進(jìn)入漲價(jià)周期，徹底終結(jié)了云計(jì)算二十年“只降不升”的行業(yè)慣例。

國(guó)內(nèi)阿里云、騰訊云、百度智能云三大頭部廠商，先后上調(diào)AI算力產(chǎn)品價(jià)格，漲幅區(qū)間5%-34%。

同時(shí)，高性能存儲(chǔ)、算力租賃、服務(wù)器整機(jī)價(jià)格同步上漲，英偉達(dá)H100 GPU年租賃價(jià)格漲幅近40%，部分騰訊云AI算力服務(wù)漲幅更是高達(dá)400%，海外AWS、谷歌云同步跟進(jìn)漲價(jià)，全球AI底層算力成本全面走高。

按理說(shuō)，上游成本上漲必然帶動(dòng)下游模型漲價(jià)，但國(guó)產(chǎn)大模型卻反向降價(jià)，它們的利潤(rùn)都從哪里來(lái)？

答案藏在推理效率里。

大模型API的成本結(jié)構(gòu)正在發(fā)生質(zhì)變。過(guò)去，成本大頭是模型訓(xùn)練和參數(shù)存儲(chǔ)；現(xiàn)在，隨著模型開(kāi)源、蒸餾技術(shù)成熟，訓(xùn)練成本被攤薄，真正的戰(zhàn)場(chǎng)轉(zhuǎn)移到了推理環(huán)節(jié)：如何讓每一次API調(diào)用的算力消耗更低、吞吐更高、延遲更短。

尤其是在長(zhǎng)上下文、Agent、多輪對(duì)話場(chǎng)景下，真正的吞金獸是KV Cache。

可以把它理解為模型推理時(shí)對(duì)上下文的“記憶”。上下文越長(zhǎng)，緩存就越龐大，吃掉的顯存也越恐怖。很多長(zhǎng)上下文模型定價(jià)高昂，本質(zhì)上不是因?yàn)椤案斆鳌保蔷彺娉杀揪痈卟幌隆?/p>

小米這次的技術(shù)攻堅(jiān)，正是沖著這個(gè)痛點(diǎn)去的。

DeepSeek V4系列之所以敢定價(jià)0.025元，也是因?yàn)樵谕评砜蚣堋⒕彺嫦到y(tǒng)和集群調(diào)度上做了深度優(yōu)化。

硬件貴了，但單位token消耗的算力下降得更快。

另外，薄利多銷的邏輯在這里依然有效。模型降價(jià)后，開(kāi)發(fā)者不再吝嗇調(diào)用量，Agent框架、多輪對(duì)話、長(zhǎng)文檔分析的消耗量會(huì)指數(shù)級(jí)增長(zhǎng)。

中美大模型之戰(zhàn)

誰(shuí)是贏家

于是到這里就會(huì)產(chǎn)生一個(gè)問(wèn)題：

當(dāng)中國(guó)大模型價(jià)格只是美國(guó)的頂尖模型十分之一，而功能卻能達(dá)到百分之八九十，那么這場(chǎng)模型大戰(zhàn)，中國(guó)憑什么輸？

過(guò)去兩年里，業(yè)界普遍有一種擔(dān)憂：中國(guó)在基礎(chǔ)模型能力上始終落后OpenAI和Anthropic半步，從GPT-4到Claude 3.5再到GPT-5.5，每次發(fā)布都在拉大差距。這種焦慮是真實(shí)的。

但價(jià)格帶來(lái)的強(qiáng)勁競(jìng)爭(zhēng)力，也是客觀的。

企業(yè)在采購(gòu)AI服務(wù)時(shí)，決策公式從來(lái)不是選最強(qiáng)的，而是選性價(jià)比最高的；當(dāng)token便宜到忽略不計(jì)時(shí)，開(kāi)發(fā)者不用再精打細(xì)算，可以大膽進(jìn)行設(shè)計(jì)，從而催生出獨(dú)有的應(yīng)用生態(tài)。

國(guó)產(chǎn)大模型廠商正在把大模型做成新時(shí)代的水電煤：便宜、穩(wěn)定、隨取隨用。

按照商業(yè)發(fā)展的規(guī)律，最后贏的，往往不是技術(shù)最強(qiáng)的那個(gè)，而是讓技術(shù)變得最便宜、最普及的那個(gè)。

中國(guó)大模型顯然已經(jīng)走在了這條路上。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.