5月27日一早,雷軍在微博宣布,小米MiMo-V2.5系列做了一次大幅度的價格調(diào)整,最高降幅達到99%,不再區(qū)分上下文窗口。
![]()
![]()
小米:MiMo-V2.5系列API永久降價
對價格體系進行永久性翻新
@小米技術(shù)表示,過往幾個月,通過MiMo Orbit、百萬億Token創(chuàng)造者激勵計劃等活動,讓更多人有機會體驗MiMo,并解決真實的問題——這是MiMo在規(guī)模化應用道路上的第一步。而現(xiàn)在,隨著底層技術(shù)的不斷精進,終于可以做一件更徹底的事——對整個模型價格體系進行一次永久性翻新。
MiMo-V2.5系列API永久降價
相比原始API定價,新定價最高降幅可達99%,且不再區(qū)分上下文窗口長度。
![]()
本次調(diào)價于北京時間5月27日0:00正式生效,全球同步調(diào)整。
Token Plan計費體系優(yōu)化
加量不加價,用量提升至原5-8倍,解鎖更充沛的生產(chǎn)力。示例:在Agent或Code場景下,可用Token數(shù)量為:![]()
計費規(guī)則調(diào)整,更加清晰易懂,所見即所得。
![]()
此外,無論當前套餐用量如何,所有已訂閱Token Plan且當前仍在有效期的用戶(包括參與百萬億Token創(chuàng)造者激勵計劃并獲得Token Plan的用戶,涵蓋Apache軟件基金會專屬福利用戶)的Credits額度將于北京時間5月27日0點全量重置,并按新計費規(guī)則執(zhí)行。
小米技術(shù)表示,本次價格調(diào)整背后,離不開團隊在推理系統(tǒng)上的持續(xù)優(yōu)化。基于SGLang HiCache完整支持SWA(Sliding Window Attention),將KV Cache在GPU顯存、CPU內(nèi)存、SSD等多級存儲之間的數(shù)據(jù)搬運量降低至優(yōu)化前的近1/7,并將可緩存token數(shù)量提升至優(yōu)化前的近5倍,顯著提升了緩存命中率和推理效率。
同時,通過優(yōu)化專家并行方案、輸入長度分桶策略等,進一步提升了集群輸入吞吐能力,從而在保障服務質(zhì)量的前提下持續(xù)降低單位 token 服務成本。后續(xù)將發(fā)布更加詳細的推理優(yōu)化技術(shù)Blog。
![]()
雷軍:未來三年
在AI領(lǐng)域投入600億元
值得注意的是,就在5月26日晚,雷軍在微博公布了小米集團一季度業(yè)績:
![]()
營收991億元,經(jīng)調(diào)整凈利潤61億元,全球月活超7.46億,AIoT平臺連接設備數(shù)超11億。智能電動汽車及AI等創(chuàng)新業(yè)務收入199億元,當季新車交付80856臺,490家汽車銷售門店。
研發(fā)投入90億元,同比增長33.4%,研發(fā)人員總數(shù)26048人,預計全年研發(fā)投入超400億。
Xiaomi MiMo-V2.5-Pro躋身Artificial Analysis榜單綜合智能指數(shù)、Agent指數(shù)全球開源模型并列第一,未來三年在AI領(lǐng)域投入600億元。
(免責聲明:文章內(nèi)容和數(shù)據(jù)僅供參考,不構(gòu)成投資建議。投資者據(jù)此操作,風險自擔。)
編輯|段煉 杜波
校對|程鵬
封面圖片:@雷軍
每日經(jīng)濟新聞綜合自@雷軍、@小米技術(shù)
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.