亚洲中文字幕乱码亚洲-蜜桃成熟视频在线观看-免费中文字幕视频在线-中国五十路熟妇洗澡视频-亚洲av伊人啪啪c-国产精品成人一区二区-国产自拍视频一区在线观看-成人一区不卡二区三区四区-亚洲情精品中文字幕99在线

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

小米不想“賤賣”token

0
分享至

小米MiMo大模型推出最高659元/月的訂閱套餐,直接對(duì)標(biāo)Anthropic Claude,并宣布日調(diào)用量破萬(wàn)億。不同于行業(yè)通用的“無(wú)限制訂閱”,MiMo采用“Token配額制”以解決Agent濫用導(dǎo)致的成本倒掛,明確拒絕“賤賣Token”。這標(biāo)志著小米正試圖打破手機(jī)廠商僅將AI作為生態(tài)附庸的慣例,走上一條更為激進(jìn)的獨(dú)立基座模型運(yùn)營(yíng)之路。

———— / BEGIN / ————

最近,小米宣布MiMo大模型面向全球開(kāi)發(fā)者推出Token Plan訂閱套餐,雷軍親自發(fā)微博官宣:Max檔659元/月,面向國(guó)際開(kāi)發(fā)者定價(jià)100美元/月,與Anthropic Claude Max 5x相同。同一天,雷軍發(fā)文稱MiMo大模型前一日調(diào)用量突破1萬(wàn)億Token。

作為一家從手機(jī)做到汽車,制造業(yè)基因極強(qiáng)的公司,如今把大模型訂閱套餐價(jià)格直接錨定全球AI第一梯隊(duì),這在行業(yè)里還是唯一一家,也引起了不少的爭(zhēng)議。仔細(xì)看,Mimo Token Plan的訂閱制,和大模型行業(yè)慣用的訂閱制還有一些根本上的不同。

羅福莉的發(fā)聲,不踩Anthropic踩過(guò)的坑?

MiMo Token Plan發(fā)布三天后,Anthropic宣布禁止Claude Pro和Max訂閱用戶通過(guò)OpenClaw等第三方Agent框架調(diào)用。

MiMo大模型負(fù)責(zé)人羅福莉隨即在社交平臺(tái)發(fā)布長(zhǎng)文,詳細(xì)分析了這件事。

她首先解釋了Anthropic的困境。Claude的訂閱制(Pro 20美元/月,Max 100-200美元/月)原本是為個(gè)人用戶的正常使用強(qiáng)度設(shè)計(jì)的,但OpenClaw等Agent框架的調(diào)用模式完全不同:在單個(gè)用戶查詢中,框架會(huì)以獨(dú)立API請(qǐng)求的形式發(fā)出多輪低價(jià)值的工具調(diào)用,每個(gè)請(qǐng)求都包含超過(guò)10萬(wàn)Token的上下文窗口,即使命中緩存,這也是一種浪費(fèi),在極端情況下還會(huì)拉低其他查詢的緩存命中率。

她表示:“實(shí)際每次查詢的請(qǐng)求數(shù)比Claude Code自身的框架高出數(shù)倍。換算成API定價(jià),實(shí)際成本可能是訂閱價(jià)格的幾十倍。這可不是小差距,而是天壤之別?!?/p>

換句話說(shuō),Claude訂閱制的本質(zhì)問(wèn)題是:固定月費(fèi)無(wú)法覆蓋Agent場(chǎng)景下的實(shí)際算力消耗。用戶付200美元,卻用掉了幾千美元的計(jì)算資源。

羅福莉由此引出MiMo Token Plan的設(shè)計(jì)邏輯。她說(shuō),Token Plan支持第三方框架接入,但按Token配額計(jì)費(fèi),“與Claude新推出的額外使用套餐的邏輯相同”。這意味著用戶用多少付多少,不會(huì)出現(xiàn)訂閱制下“薅羊毛式”的成本倒掛。“我們的目標(biāo)是長(zhǎng)期穩(wěn)定地交付高質(zhì)量的模型和服務(wù),而不是讓你沖動(dòng)付費(fèi)后就棄用?!?/p>

她也扮演了一次行業(yè)定價(jià)的“吹哨人”角色:“我建議LLM公司在弄清楚如何在不造成資金流失的情況下為Coding方案定價(jià)之前,不要盲目地競(jìng)相壓低價(jià)格。以極低的價(jià)格出售Token,同時(shí)對(duì)第三方敞開(kāi)大門,這看起來(lái)對(duì)用戶很有吸引力,但這卻是一個(gè)陷阱——Anthropic剛剛擺脫的那個(gè)陷阱?!?/p>

這篇帖子瀏覽量超過(guò)71萬(wàn),引發(fā)了大量討論。有開(kāi)發(fā)者認(rèn)同她對(duì)OpenClaw上下文管理低效的判斷,有人指出Anthropic此舉本質(zhì)上是在保護(hù)自家Claude Code的護(hù)城河,也有人對(duì)MiMo Token Plan本身的Credit換算機(jī)制提出質(zhì)疑。


現(xiàn)實(shí)的挑戰(zhàn)

100美元的定價(jià)有一定的合理性。MiMo-V2-Pro的API價(jià)格(輸入1美元/百萬(wàn)Token,輸出3美元)約為Claude同級(jí)模型的五分之一,在性價(jià)比上確實(shí)有競(jìng)爭(zhēng)力。兩周免費(fèi)推廣期間,MiMo-V2-Pro在OpenRouter上單周Token消耗量突破4萬(wàn)億,日榜、周榜、月榜均排名第一,編程領(lǐng)域市占率一度超過(guò)30%。

但挑戰(zhàn)來(lái)得很快。

免費(fèi)期結(jié)束后,MiMo-V2-Pro在OpenRouter上的周調(diào)用量從高峰下滑。OpenRouter上的規(guī)律比較直接,在達(dá)到一定性能閾值后,誰(shuí)便宜或免費(fèi),誰(shuí)就有可能沖到榜一。它的排名證明了模型能力和可用性,但是同時(shí),調(diào)用量受是否免費(fèi)的影響巨大。

MiMo Token Plan四檔方案從39元/月到659元/月,Max檔國(guó)際定價(jià)100美元/月。按Credit換算,MiMo-V2-Pro消耗1 Token等于2 Credits,Max檔1600M Credits約等于800M Token的Pro模型調(diào)用量。

這個(gè)價(jià)格對(duì)標(biāo)的是Anthropic Claude Max 5x套餐(100美元/月),后者提供Pro版5倍的使用額度。MiMo Token Plan沒(méi)有行業(yè)普遍存在的5小時(shí)使用限額,支持集中消耗Token。

開(kāi)發(fā)者社區(qū)的爭(zhēng)議也不少。有用戶在社交網(wǎng)絡(luò)上拆解了小米Token Plan的實(shí)際消耗:由于Credit倍率機(jī)制(Pro模型1 Token消耗2 Credits,超過(guò)256K上下文則消耗4 Credits),加上Agent框架大量使用緩存Token,入門套餐的實(shí)際可用量遠(yuǎn)低于字面數(shù)字。

也有開(kāi)發(fā)者反饋MiMo-V2-Pro在復(fù)雜推理上偶爾出現(xiàn)“無(wú)限循環(huán)”,以及內(nèi)容審核系統(tǒng)誤攔截正常API調(diào)用的問(wèn)題。

騰訊科技向小米官方求證, Credits到底如何折算為不同模型、不同上下文長(zhǎng)度下的真實(shí) token使用量,是否有完整公開(kāi)的計(jì)算邏輯?但截至發(fā)稿,未得到官方的回應(yīng)。

但是從羅福莉的公開(kāi)發(fā)聲來(lái)看,對(duì)“大模型訂閱制”算不清賬的問(wèn)題已經(jīng)提出了質(zhì)疑,不“賤賣Token”,希望用健康的現(xiàn)金流來(lái)?yè)Q取模型能力的穩(wěn)定迭代、用戶的持續(xù)使用,是基本態(tài)度。


圖:免費(fèi)期結(jié)束后,MiMo-V2-Pro在OpenRouter上的周調(diào)用量從高峰下滑

理想很豐滿。但是,從免費(fèi)到付費(fèi)的轉(zhuǎn)換率,是所有大模型公司面臨的共同難題。從免費(fèi)到付費(fèi)切換的過(guò)程,也往往會(huì)面臨最大的爭(zhēng)議,MiMo能否在付費(fèi)的前提下保持用戶黏性,是接下來(lái)幾周最值得觀察的數(shù)據(jù)點(diǎn)。

唯一還在做基座大模型的手機(jī)廠商?

在小米高調(diào)推自己的大模型的同時(shí),也引出了一個(gè)疑問(wèn),大模型業(yè)務(wù)之于小米,到底意味著什么?

回到更早的時(shí)間線。2023年,雷軍推動(dòng)成立大模型Core團(tuán)隊(duì)。同年5月,根據(jù)媒體的公開(kāi)報(bào)道,小米曾公開(kāi)表示“小米不會(huì)做ChatGPT,不搞AI的軍備競(jìng)賽”。

但小米的態(tài)度在悄悄發(fā)生轉(zhuǎn)變。

2025年4月,MiMo-7B開(kāi)源;11月,前DeepSeek研究員羅福莉加入,出任大模型負(fù)責(zé)人;12月發(fā)布MiMo-V2-Flash。2026年3月19日凌晨,三款模型同步發(fā)布:萬(wàn)億參數(shù)的MiMo-V2-Pro、全模態(tài)的Omni和語(yǔ)音合成TTS。發(fā)布前,Pro的早期版本以“Hunter Alpha”代號(hào)匿名上線OpenRouter,七天突破1萬(wàn)億Token調(diào)用量,一度被社區(qū)猜測(cè)為“DeepSeek V4”。不到一年,小米的大模型從7B參數(shù)走到了萬(wàn)億參數(shù)。

據(jù)接近小米的人士透露,小米內(nèi)部開(kāi)始認(rèn)為“大模型是未來(lái)科技公司必須要有的能力。小米未來(lái)所有產(chǎn)品端的能力,需要有一個(gè)主模型去控制、去培養(yǎng)、去指導(dǎo)。這個(gè)主模型必須是自己的。因?yàn)橹挥凶约簱碛?,才能決定你的用戶習(xí)慣、你的輸入數(shù)據(jù)不交給第三方?!?/p>

手機(jī)、汽車、IoT設(shè)備產(chǎn)生的海量用戶數(shù)據(jù)是最核心的資產(chǎn),如果基座模型依賴第三方,數(shù)據(jù)主權(quán)和產(chǎn)品迭代節(jié)奏都將受制于人。

從組織架構(gòu)看,大模型Core團(tuán)隊(duì)歸屬小米集團(tuán)技術(shù)委員會(huì),不隸屬于手機(jī)部或汽車部。據(jù)了解,小米副總裁曲恒負(fù)責(zé)管理這條線,但羅福莉擁有很高的獨(dú)立性,她加入后按照自己的想法組建了團(tuán)隊(duì),核心成員平均年齡25歲,清北畢業(yè)生占比超六成。團(tuán)隊(duì)運(yùn)作有較高的自主性。

從財(cái)報(bào)及管理層對(duì)外發(fā)聲也可以看出,研發(fā)投入規(guī)模也在快速攀升。小米2025年全年研發(fā)開(kāi)支331億元,同比增長(zhǎng)37.8%,接近全年經(jīng)調(diào)整凈利潤(rùn)392億元。據(jù)小米總裁盧偉冰在業(yè)績(jī)會(huì)上的表述,AI投入約占研發(fā)總額的四分之一。

雷軍在MiMo-V2-Pro發(fā)布當(dāng)天宣布,2026年小米在AI領(lǐng)域的研發(fā)和資本投入將超過(guò)160億元,未來(lái)三年至少600億元。資本開(kāi)支方面,2025年前三季度累計(jì)約130億元,同比增長(zhǎng)86.7%,盧偉冰明確表示增量主要來(lái)自汽車和AI。算力上,小米采取自建萬(wàn)卡GPU集群加金山云合作的混合模式。

從行業(yè)橫向?qū)Ρ葋?lái)看,小米的選擇是孤獨(dú)的。華為盤(pán)古大模型主要通過(guò)鴻蒙系統(tǒng)實(shí)現(xiàn)端云協(xié)同,vivo藍(lán)心大模型服務(wù)于OriginOS的AI助手,OPPO安第斯大模型升級(jí)了小布助手,榮耀走AI終端生態(tài)路線。這些廠商的大模型都是“AI服務(wù)于手機(jī)”,沒(méi)有一家獨(dú)立運(yùn)營(yíng)API平臺(tái)或?qū)ν馐圪u模型訂閱。包括蘋(píng)果、三星在內(nèi)的全球手機(jī)巨頭,也沒(méi)有對(duì)外直接提供服務(wù)的基座大模型。

vivo副總裁周圍的公開(kāi)表態(tài)也許可以代表了多數(shù)廠商的態(tài)度:未來(lái)手機(jī)可能進(jìn)化為“智能體”,但實(shí)現(xiàn)路徑不一定需要自研基座模型,接入第三方大模型同樣可以。

大模型成為又一個(gè)主線業(yè)務(wù)?

從種種公開(kāi)信息來(lái)看,大模型之于小米集團(tuán),正在發(fā)生一些微妙但關(guān)鍵的變化:它不只是一個(gè)服務(wù)于手機(jī)和IoT的底層能力,開(kāi)始具備向一條獨(dú)立業(yè)務(wù)線演進(jìn)的結(jié)構(gòu)性條件。最直觀的信號(hào),是產(chǎn)品形態(tài)的變化。

小米已經(jīng)推出了面向開(kāi)發(fā)者的API平臺(tái),并配套提供分層的Token訂閱方案。無(wú)論規(guī)模大小,這一步本身,就已經(jīng)越過(guò)了傳統(tǒng)“技術(shù)中臺(tái)”的邊界。

雷軍曾在公開(kāi)場(chǎng)合明確提出,小米計(jì)劃在2026年實(shí)現(xiàn)一次關(guān)鍵性的技術(shù)整合:在一款終端產(chǎn)品中,讓自研芯片、操作系統(tǒng)與AI大模型完成協(xié)同落地。

至今為止,能同時(shí)覆蓋這三層能力的公司并不多。華為通過(guò)麒麟芯片、鴻蒙系統(tǒng)與盤(pán)古模型,已經(jīng)形成過(guò)相對(duì)完整的技術(shù)閉環(huán);蘋(píng)果公司則長(zhǎng)期在芯片與操作系統(tǒng)上建立深度一體化,并正在強(qiáng)化其端側(cè)AI能力。

小米如果完成這一組合,也許能進(jìn)入一個(gè)截然不同的競(jìng)爭(zhēng)維度。

但如果把視角拉回財(cái)報(bào),情況又顯得克制得多。

根據(jù)披露,小米將AI相關(guān)業(yè)務(wù)與智能電動(dòng)汽車一同歸入“創(chuàng)新業(yè)務(wù)”板塊。2025年,該板塊收入為1061億元,其中汽車貢獻(xiàn)了約1033億元,AI相關(guān)收入尚未被單獨(dú)披露。產(chǎn)品和形態(tài)已經(jīng)在向獨(dú)立業(yè)務(wù)靠攏,但公開(kāi)財(cái)務(wù)信息上還未完成驗(yàn)證。

當(dāng)小米將高階訂閱方案定在與Claude相近的區(qū)間,并開(kāi)始質(zhì)疑行業(yè)普遍推行的訂閱制的時(shí)候,目的可能未必在于“價(jià)格競(jìng)爭(zhēng)”。通過(guò)錨定頭部模型,主動(dòng)進(jìn)入同一層級(jí)的市場(chǎng)敘事,證明“上桌的能力”可能更為重要。

本文來(lái)自公眾號(hào):騰訊科技 作者:曉靜 編輯:徐青陽(yáng)

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
特朗普剛下令封鎖海峽,美軍發(fā)現(xiàn)情況不妙,越來(lái)越多士兵逃離軍隊(duì)

特朗普剛下令封鎖海峽,美軍發(fā)現(xiàn)情況不妙,越來(lái)越多士兵逃離軍隊(duì)

影孖看世界
2026-04-15 22:24:58
每月工資能夠達(dá)到“這個(gè)數(shù)”,你已經(jīng)超過(guò)90%的人了,別再拼了!

每月工資能夠達(dá)到“這個(gè)數(shù)”,你已經(jīng)超過(guò)90%的人了,別再拼了!

CG說(shuō)科技
2026-04-15 18:43:23
A股:剛剛,大消息傳來(lái),要做好準(zhǔn)備,明天將迎來(lái)更大級(jí)別的變盤(pán)

A股:剛剛,大消息傳來(lái),要做好準(zhǔn)備,明天將迎來(lái)更大級(jí)別的變盤(pán)

另子維愛(ài)讀史
2026-04-15 17:02:23
剛剛,湛江市人大常委會(huì)原黨組副書(shū)記、副主任陳云被查

剛剛,湛江市人大常委會(huì)原黨組副書(shū)記、副主任陳云被查

湛江朋友
2026-04-15 20:29:26
全紅嬋不再隱瞞!坦言身材發(fā)胖原因,原來(lái)高敏4年內(nèi)提醒過(guò)2次

全紅嬋不再隱瞞!坦言身材發(fā)胖原因,原來(lái)高敏4年內(nèi)提醒過(guò)2次

青橘罐頭
2026-04-01 17:09:37
3名領(lǐng)導(dǎo)干部因破壞營(yíng)商環(huán)境被查處通報(bào)

3名領(lǐng)導(dǎo)干部因破壞營(yíng)商環(huán)境被查處通報(bào)

吉刻新聞
2026-04-15 12:16:25
開(kāi)拓者附加賽擊敗太陽(yáng)后,撞上NBA歷史級(jí)魔咒!

開(kāi)拓者附加賽擊敗太陽(yáng)后,撞上NBA歷史級(jí)魔咒!

夜白侃球
2026-04-15 14:29:03
特朗普帶這個(gè)兒子訪華,比起女兒伊萬(wàn)卡,背后信號(hào)更不簡(jiǎn)單!

特朗普帶這個(gè)兒子訪華,比起女兒伊萬(wàn)卡,背后信號(hào)更不簡(jiǎn)單!

菁菁子衿
2026-04-15 20:13:36
男人坐牢20年出獄,去派出所重新辦身份證,結(jié)果警察看到他淚目了

男人坐牢20年出獄,去派出所重新辦身份證,結(jié)果警察看到他淚目了

白云故事
2025-04-12 17:55:08
藍(lán)莓再次成為關(guān)注對(duì)象!醫(yī)生發(fā)現(xiàn):吃藍(lán)莓時(shí),千萬(wàn)多留意這幾點(diǎn)!

藍(lán)莓再次成為關(guān)注對(duì)象!醫(yī)生發(fā)現(xiàn):吃藍(lán)莓時(shí),千萬(wàn)多留意這幾點(diǎn)!

芹姐說(shuō)生活
2026-04-15 18:43:08
憤怒的李想和遭到圍攻的理想汽車

憤怒的李想和遭到圍攻的理想汽車

界面新聞
2026-04-13 10:01:09
逐玉慶功宴曝咖位!張凌赫靠邊站,業(yè)內(nèi)大佬都到場(chǎng),全給她讓C位

逐玉慶功宴曝咖位!張凌赫靠邊站,業(yè)內(nèi)大佬都到場(chǎng),全給她讓C位

橙星文娛
2026-04-14 16:32:10
他發(fā)明一道菜在美國(guó)一年賣52163噸,年入203億,卻稱絕不進(jìn)入中國(guó)

他發(fā)明一道菜在美國(guó)一年賣52163噸,年入203億,卻稱絕不進(jìn)入中國(guó)

杰絲聊古今
2026-04-09 23:44:51
骨科醫(yī)生警告:最傷膝蓋的不是爬樓,是老人天天做的 5 件事

骨科醫(yī)生警告:最傷膝蓋的不是爬樓,是老人天天做的 5 件事

高中醫(yī)健康說(shuō)
2026-04-15 14:20:03
研究表明:男性嫖娼率6.4%,女性出軌率15%,且越有錢越開(kāi)放!

研究表明:男性嫖娼率6.4%,女性出軌率15%,且越有錢越開(kāi)放!

黯泉
2026-04-01 17:28:39
2026北京車展丨新車前瞻

2026北京車展丨新車前瞻

新浪財(cái)經(jīng)
2026-04-15 11:12:01
羅永浩怒懟:120W竟是充電器商標(biāo)!這流氓操作怎么通過(guò)的?

羅永浩怒懟:120W竟是充電器商標(biāo)!這流氓操作怎么通過(guò)的?

品牌新
2026-04-13 08:52:33
《八千里路云和月》17-18集預(yù)告:玉嬌被扔大街,太爺怒打日本人

《八千里路云和月》17-18集預(yù)告:玉嬌被扔大街,太爺怒打日本人

情感大頭說(shuō)說(shuō)
2026-04-15 19:15:25
上市6年沒(méi)一個(gè)漲停!有股民滿倉(cāng)深套虧近8萬(wàn),太扎心

上市6年沒(méi)一個(gè)漲停!有股民滿倉(cāng)深套虧近8萬(wàn),太扎心

財(cái)經(jīng)智多星
2026-04-15 12:13:25
男子持長(zhǎng)矛殺鄰居后自首,一審被判死刑立即執(zhí)行!法院:犯罪情節(jié)惡劣,罪行極其嚴(yán)重,不足以從輕處罰

男子持長(zhǎng)矛殺鄰居后自首,一審被判死刑立即執(zhí)行!法院:犯罪情節(jié)惡劣,罪行極其嚴(yán)重,不足以從輕處罰

大風(fēng)新聞
2026-04-15 13:43:07
2026-04-15 23:04:49
人人都是產(chǎn)品經(jīng)理社區(qū) incentive-icons
人人都是產(chǎn)品經(jīng)理社區(qū)
想要成為大牛先從學(xué)做產(chǎn)品開(kāi)始
64631文章數(shù) 311586關(guān)注度
往期回顧 全部

科技要聞

ChatGPT十億用戶又怎樣?Anthropic直接貼臉

頭條要聞

豫劇團(tuán)下鄉(xiāng)演出臺(tái)下觀眾痛哭流涕:觀眾超千人一半落淚

頭條要聞

豫劇團(tuán)下鄉(xiāng)演出臺(tái)下觀眾痛哭流涕:觀眾超千人一半落淚

體育要聞

三球準(zhǔn)絕殺戴大金鏈:轟30+10自我救贖

娛樂(lè)要聞

謝娜現(xiàn)身環(huán)球影城,牽手女兒溫馨有愛(ài)

財(cái)經(jīng)要聞

業(yè)績(jī)失速的Lululemon:"健康"人設(shè)崩塌?

汽車要聞

空間絲毫不用妥協(xié) 小鵬GX首發(fā)評(píng)測(cè)

態(tài)度原創(chuàng)

手機(jī)
本地
家居
藝術(shù)
公開(kāi)課

手機(jī)要聞

消息稱年底多家旗艦機(jī)只有Pro Max級(jí)別機(jī)型才能用上滿血SoC

本地新聞

12噸巧克力有難,全網(wǎng)化身超級(jí)偵探添亂

家居要聞

簡(jiǎn)而不減 暖居之道

藝術(shù)要聞

這山水,蕩滌胸中塵埃

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版