繼DeepSeek宣布永久降價(jià)后,又一家國(guó)產(chǎn)大模型宣布降價(jià)了。
5月27日凌晨,小米宣布MiMo-V2.5系列API永久降價(jià),最高降幅達(dá)99%,且不再區(qū)分輸入長(zhǎng)度。
同時(shí)對(duì)Token Plan計(jì)費(fèi)體系進(jìn)行優(yōu)化,同樣的套餐價(jià)格,用量提升至原來(lái)的5-8倍。
所有已訂閱Token Plan且在有效期內(nèi)的用戶,從今天0點(diǎn)起全部重置按照新計(jì)費(fèi)規(guī)則執(zhí)行。
小米創(chuàng)始人雷軍,隨后在微博也轉(zhuǎn)發(fā)了這條降價(jià)消息。
![]()
![]()
國(guó)產(chǎn)模型降成白菜價(jià)
對(duì)比國(guó)外模型價(jià)格優(yōu)勢(shì)明顯
公告顯示,MiMo-V2.5-Pro調(diào)價(jià)后,輸入緩存命中價(jià)格降至0.025元/百萬(wàn)tokens,輸入未命中緩存3元/百萬(wàn)tokens,輸出6元/百萬(wàn)tokens。
![]()
它跟幾天前DeepSeek-V4-Pro宣布降價(jià)后的價(jià)格剛好一致。
自今年年以來(lái),國(guó)內(nèi)頭部大模型廠商已掀起一輪持續(xù)、全面的降價(jià)潮,價(jià)格堪稱“白菜價(jià)”。
按照每百萬(wàn)tokens的單價(jià),Kimi-k2.6緩存命中輸入價(jià)1.1元,緩存未命中輸入價(jià)6.5元,輸出價(jià)27元。
其他模型價(jià)格具體如下圖:
![]()
而對(duì)比海外主流模型,國(guó)產(chǎn)大模型的價(jià)格優(yōu)勢(shì)堪稱碾壓級(jí)。
MiMo-V2.5-Pro的輸入價(jià)格僅為Claude-opus-4.7的三十六分之一,輸出價(jià)格更是達(dá)到九十分之一。
在這樣巨大的價(jià)格差下,一些外國(guó)碼農(nóng)都受不了,反向代購(gòu)中國(guó)大模型。
![]()
硬件和云在暴漲,token在暴跌
利潤(rùn)到底從哪來(lái)?
極具反差的是,當(dāng)國(guó)內(nèi)模型token降價(jià)的同時(shí),底層的硬件、云算力成本卻在持續(xù)暴漲。
全球AI算力、云服務(wù)、硬件設(shè)備全面進(jìn)入漲價(jià)周期,徹底終結(jié)了云計(jì)算二十年“只降不升”的行業(yè)慣例。
國(guó)內(nèi)阿里云、騰訊云、百度智能云三大頭部廠商,先后上調(diào)AI算力產(chǎn)品價(jià)格,漲幅區(qū)間5%-34%。
同時(shí),高性能存儲(chǔ)、算力租賃、服務(wù)器整機(jī)價(jià)格同步上漲,英偉達(dá)H100 GPU年租賃價(jià)格漲幅近40%,部分騰訊云AI算力服務(wù)漲幅更是高達(dá)400%,海外AWS、谷歌云同步跟進(jìn)漲價(jià),全球AI底層算力成本全面走高。
按理說(shuō),上游成本上漲必然帶動(dòng)下游模型漲價(jià),但國(guó)產(chǎn)大模型卻反向降價(jià),它們的利潤(rùn)都從哪里來(lái)?
答案藏在推理效率里。
大模型API的成本結(jié)構(gòu)正在發(fā)生質(zhì)變。過(guò)去,成本大頭是模型訓(xùn)練和參數(shù)存儲(chǔ);現(xiàn)在,隨著模型開(kāi)源、蒸餾技術(shù)成熟,訓(xùn)練成本被攤薄,真正的戰(zhàn)場(chǎng)轉(zhuǎn)移到了推理環(huán)節(jié):如何讓每一次API調(diào)用的算力消耗更低、吞吐更高、延遲更短。
尤其是在長(zhǎng)上下文、Agent、多輪對(duì)話場(chǎng)景下,真正的吞金獸是KV Cache。
可以把它理解為模型推理時(shí)對(duì)上下文的“記憶”。上下文越長(zhǎng),緩存就越龐大,吃掉的顯存也越恐怖。很多長(zhǎng)上下文模型定價(jià)高昂,本質(zhì)上不是因?yàn)椤案斆鳌保蔷彺娉杀揪痈卟幌隆?/p>
小米這次的技術(shù)攻堅(jiān),正是沖著這個(gè)痛點(diǎn)去的。
DeepSeek V4系列之所以敢定價(jià)0.025元,也是因?yàn)樵谕评砜蚣堋⒕彺嫦到y(tǒng)和集群調(diào)度上做了深度優(yōu)化。
硬件貴了,但單位token消耗的算力下降得更快。
另外,薄利多銷的邏輯在這里依然有效。模型降價(jià)后,開(kāi)發(fā)者不再吝嗇調(diào)用量,Agent框架、多輪對(duì)話、長(zhǎng)文檔分析的消耗量會(huì)指數(shù)級(jí)增長(zhǎng)。
![]()
中美大模型之戰(zhàn)
誰(shuí)是贏家
于是到這里就會(huì)產(chǎn)生一個(gè)問(wèn)題:
當(dāng)中國(guó)大模型價(jià)格只是美國(guó)的頂尖模型十分之一,而功能卻能達(dá)到百分之八九十,那么這場(chǎng)模型大戰(zhàn),中國(guó)憑什么輸?
過(guò)去兩年里,業(yè)界普遍有一種擔(dān)憂:中國(guó)在基礎(chǔ)模型能力上始終落后OpenAI和Anthropic半步,從GPT-4到Claude 3.5再到GPT-5.5,每次發(fā)布都在拉大差距。這種焦慮是真實(shí)的。
但價(jià)格帶來(lái)的強(qiáng)勁競(jìng)爭(zhēng)力,也是客觀的。
企業(yè)在采購(gòu)AI服務(wù)時(shí),決策公式從來(lái)不是選最強(qiáng)的,而是選性價(jià)比最高的;當(dāng)token便宜到忽略不計(jì)時(shí),開(kāi)發(fā)者不用再精打細(xì)算,可以大膽進(jìn)行設(shè)計(jì),從而催生出獨(dú)有的應(yīng)用生態(tài)。
國(guó)產(chǎn)大模型廠商正在把大模型做成新時(shí)代的水電煤:便宜、穩(wěn)定、隨取隨用。
按照商業(yè)發(fā)展的規(guī)律,最后贏的,往往不是技術(shù)最強(qiáng)的那個(gè),而是讓技術(shù)變得最便宜、最普及的那個(gè)。
中國(guó)大模型顯然已經(jīng)走在了這條路上。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.