亚洲中文字幕乱码亚洲-蜜桃成熟视频在线观看-免费中文字幕视频在线-中国五十路熟妇洗澡视频-亚洲av伊人啪啪c-国产精品成人一区二区-国产自拍视频一区在线观看-成人一区不卡二区三区四区-亚洲情精品中文字幕99在线

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

大模型廠商,是時(shí)候告別Token狂歡了

0
分享至

文 | 伯虎財(cái)經(jīng)(bohuFN),作者 | 楷楷

“低價(jià)賣Token并對(duì)第三方開(kāi)放,看起來(lái)很友好,但那是一個(gè)陷阱?!?/p>

近日,小米集團(tuán)MiMo負(fù)責(zé)人羅福莉在X平臺(tái)發(fā)文,將Token價(jià)格戰(zhàn)比喻為“陷阱”,提醒大模型公司不應(yīng)該盲目參與價(jià)格戰(zhàn)。

幾天之前,Anthropic突然宣布切斷第三方工具對(duì)Claude訂閱的訪問(wèn)權(quán)限,這也是羅福莉發(fā)文討論Token定價(jià)邏輯的契機(jī)。

在這場(chǎng)全民“養(yǎng)龍蝦”的Token狂歡中,羅福莉的公開(kāi)信和Anthropic的“封殺令”,成為行業(yè)中罕見(jiàn)的“不同聲音”,給這股熱潮潑下了冷水。

但問(wèn)題是,大模型廠商當(dāng)真算不清這筆成本賬?還是說(shuō),這只是行業(yè)一場(chǎng)心照不宣的博弈,用狂燒的Token換取一張通往未來(lái)的入場(chǎng)券,賭的是AGI的未來(lái)。

如果是這樣的話,誰(shuí)還能叫醒一個(gè)正在裝睡的人。

01 Anthropic撐不住了

幾天前,Anthropic向所有用戶發(fā)送郵件,宣布自當(dāng)?shù)貢r(shí)間4月4日下午3點(diǎn)起,Claude Pro和Max訂閱將不再覆蓋OpenClaw等第三方工具的使用。


事出突然,Anthropic給用戶送了一筆一次性補(bǔ)貼,金額剛好等于一個(gè)月訂閱費(fèi)。但相較于從前花200美元月費(fèi)就能無(wú)限量調(diào)用Claude的好日子,這筆補(bǔ)貼顯然只是杯水車薪。

消息一出,社交媒體瞬間炸鍋,用戶們破口大罵,鋪天蓋地都是“過(guò)河拆橋”的論調(diào),因?yàn)镺penClaw創(chuàng)始人彼得·斯坦伯格跟Anthropic的恩怨早已有之。

OpenClaw最初上線時(shí)命名為Clawdbot,由于名字跟Anthropic旗下的Claude高度相似,被Anthropic一份律師函要求改名,梁子算是結(jié)下了。

更重要的是,在OpenClaw驗(yàn)證了市場(chǎng)對(duì)開(kāi)源智能體的需求后,Anthropic隨即推出了Claude Cowork,除了安全考量之外,這也被認(rèn)為是想用自家產(chǎn)品取代OpenClaw。

但這些都不足以解釋“封殺令”的全部,真正讓Anthropic下決心動(dòng)刀的,是成本問(wèn)題。

Anthropic在用戶信中提到,“第三方工具對(duì)系統(tǒng)造成了過(guò)大的壓力,我們必須優(yōu)先保障使用我們核心產(chǎn)品的用戶體驗(yàn)?!?/p>

外媒稱明星獨(dú)角獸Cursor曾在去年進(jìn)行估算,發(fā)現(xiàn)每月200美元的Claude Code訂閱可能消耗高達(dá)2000美元的計(jì)算資源,說(shuō)明Anthropic一直在進(jìn)行巨額補(bǔ)貼;也有其他分析師指出,Anthropic訂閱制實(shí)際消耗的算力成本或高達(dá)5000美元。

這意味著,大模型曾經(jīng)的訂閱收費(fèi)模式,在Agent時(shí)代恐怕難以跑通。

一方面,在Agent模式下,Token使用量正以幾何級(jí)增長(zhǎng)速度膨脹。

當(dāng)大模型還停留在對(duì)話層面時(shí),單輪對(duì)話大約消耗1000-3000個(gè)Token,平臺(tái)只要統(tǒng)計(jì)出一個(gè)代表大部分用戶的用量均值,就可以跑通訂閱制。

但在Agent場(chǎng)景中,一個(gè)用戶背后可能同時(shí)跑著10個(gè)甚至100個(gè)Agent,每個(gè)Agent都在

7×24小時(shí)地執(zhí)行任務(wù),每次任務(wù)都會(huì)觸發(fā)多次模型推理,隨著交互次數(shù)不斷增多,就形成了“滾雪球式”的Token消耗,靠“少用”補(bǔ)貼“多用”的訂閱制也就失去了平衡。

作為參考,一個(gè)普通ChatGPT用戶即使天天聊天,月消耗也不過(guò)百萬(wàn)級(jí);而一個(gè)重度“養(yǎng)蝦”用戶,日均消耗Token則在3000萬(wàn)-1億之間。

但另一方面,大模型企業(yè)的成本并沒(méi)有隨著用量暴增而自然下降,反而越走越高。

斯坦福大學(xué)的《2025年人工智能指數(shù)報(bào)告》指出,在高效小模型的驅(qū)動(dòng)下,GPT-3.5 級(jí)別的模型推理成本已在過(guò)去兩年間下降到了原來(lái)的1/280,硬件成本每年下降 30%。

只是,推理成本雖然下降了,但訓(xùn)練成本卻依然驚人。更重要的是,全球算力依然處于緊缺階段,越多用戶扎堆使用Agent,越推高了企業(yè)的運(yùn)營(yíng)成本。

以O(shè)penAI為例,其對(duì)投資者表示,預(yù)計(jì)到2028年算力支出將達(dá)到1210億美元,屆時(shí)虧損可能會(huì)達(dá)到850億美元,或?qū)⒊揭延猩鲜泄镜奶潛p記錄。

雖然Anthropic的訓(xùn)練成本沒(méi)那么高,約為OpenAI的40%左右,但當(dāng)下也依然處于燒錢狀態(tài),其自然不想再被第三方工具白薅羊毛。


(圖:OpenAI與Anthropic訓(xùn)練成本對(duì)比)

02 卷Token價(jià)格是陷阱

Anthropic撐不住了,國(guó)產(chǎn)大模型企業(yè)又如何呢?

羅福莉可能是最能共鳴Anthropic的同行,她在社交平臺(tái)發(fā)文,稱 Claude Code大概率不賺錢,甚至可能在虧損,因?yàn)镃laude Code的定價(jià)邏輯要成立,前提是用戶必須用 Anthropic 自己的框架,否則就會(huì)出問(wèn)題。

她以O(shè)penClaw作為案例,指出接入第三方框架可能帶來(lái)的問(wèn)題:

“我觀察過(guò)OpenClaw的上下文管理,很糟糕。在單次用戶查詢里,它會(huì)觸發(fā)多輪低價(jià)值工具調(diào)用,每次都是攜帶長(zhǎng)上下文的獨(dú)立API請(qǐng)求,往往超過(guò)10萬(wàn)Token。”


簡(jiǎn)單來(lái)說(shuō),同一件事,OpenClaw會(huì)比Claude Code原生框架多跑幾遍,實(shí)際成本會(huì)達(dá)到訂閱價(jià)格的數(shù)十倍。在成本結(jié)構(gòu)上,即便是使用OpenClaw的輕度用戶,也等同于重度用戶。

因此,低價(jià)售賣Token并對(duì)第三方開(kāi)放看似對(duì)用戶友好,實(shí)則是陷阱。企業(yè)為了控制成本,只能降低算力或用更便宜的低智模型;用戶在低智模型上反復(fù)碰壁,使用體驗(yàn)也并不好。

可是,羅福莉這番發(fā)言卻是國(guó)內(nèi)大模型行業(yè)中“少數(shù)的聲音”。至少在當(dāng)下,大部分大廠及大模型企業(yè)還是將Token吞吐量視為衡量實(shí)力的重要指標(biāo)。

全球大模型聚合路由平臺(tái)OpenRouter數(shù)據(jù)顯示,中國(guó)大模型的單周調(diào)用量已連續(xù)一個(gè)月超過(guò)海外模型,調(diào)用量位于前列的都是國(guó)產(chǎn)模型,比如小米、階躍星辰、Minimax等。


全球科技大廠也在推波助瀾,比如鼓勵(lì)員工多使用AI工具,Meta甚至列出了Token 消耗量排行榜,這已成為科技大廠的隱性KPI。


因此,Token之所以貴,不僅僅在于居高不下的成本,更因?yàn)檫@是一場(chǎng)暫時(shí)還看不到盡頭的消耗戰(zhàn),當(dāng)所有人都在拼命消耗更多Token,算力便永遠(yuǎn)追不上被制造出來(lái)的需求。

況且,比起Token消耗到底是不是虛假繁榮這個(gè)問(wèn)題,大模型企業(yè),更難抵御的是真金白銀的誘惑——在短短3個(gè)月里,Anthropic的年化收入便從90億美元飆升至300 億美元。


卷Token價(jià)格或許是“陷阱”,但在全球大模型廠商“你追我趕”之際,誰(shuí)都不愿意先踩下“剎車”。

對(duì)于阿里、字節(jié)、騰訊等一線科技公司而言,大家圍繞AI超級(jí)入口爭(zhēng)奪已久,但還是無(wú)法擺脫“燒錢換流量”的互聯(lián)網(wǎng)打法,發(fā)紅包、增投流能激活DAU,可一旦沒(méi)有了“鈔能力”,用戶也會(huì)快速流失。

“龍蝦”則成為了新的契機(jī)。用戶完成部署后,就相當(dāng)于將自己的“智能體助手”嵌入了某個(gè)云平臺(tái),不僅會(huì)產(chǎn)生源源不斷的Token消耗,個(gè)人數(shù)據(jù)也會(huì)沉淀在生態(tài)體系內(nèi),遷移成本將變得越來(lái)越高,大廠自然不會(huì)放過(guò)這個(gè)新的“生態(tài)入口”。

對(duì)于Kimi、智譜等二線廠商而言,“龍蝦”的出現(xiàn)帶動(dòng)了算力需求,讓它們的模型能夠被調(diào)用起來(lái),API增長(zhǎng)也有故事可講,這足以驅(qū)動(dòng)它們更賣力地銷售API。

從邏輯上來(lái)講,羅福莉?qū)τ赥oken的評(píng)價(jià)是對(duì)的,“價(jià)格內(nèi)卷”不可能一直持續(xù)。但對(duì)于因?yàn)椤褒埼r”而跑通增長(zhǎng)敘事的大模型廠商而言,大家或許還想再“裝睡”一會(huì)兒。

03 效率比價(jià)格更重要

誰(shuí)也無(wú)法叫醒一個(gè)裝睡的人,但現(xiàn)實(shí)或許可以——越來(lái)越高的Token消耗量并沒(méi)有帶來(lái)相應(yīng)的利潤(rùn)增長(zhǎng),這也是大模型企業(yè)無(wú)法回避的問(wèn)題。

以全面對(duì)標(biāo)Anthropic的智譜為例,其在2025年交出了一份“高增長(zhǎng)、高虧損”的成績(jī)單:全年總收入7.24億元,同比大增131.9%;全年虧損47.18億元,同比擴(kuò)大59.5%。

智譜創(chuàng)始人張鵬曾表示,智譜要成為Anthropic的平替,甚至開(kāi)玩笑稱Anthropic賣200美元,我們就賣200元人民幣。今年3月,智譜發(fā)布了一鍵安裝的AutoClaw,個(gè)人版39元/月/3500萬(wàn)Tokens,99元/月/1億Tokens,門檻確實(shí)不高。


但背后的賬單也非常沉重。2025年,智譜的研發(fā)開(kāi)支為31.8億元,同比增長(zhǎng)44.9%;沒(méi)有基礎(chǔ)設(shè)施的智譜,還需要給第三方算力供應(yīng)商支付高額的采購(gòu)費(fèi),從2022 年的1463萬(wàn)元飆升至2025 年上半年的 11.45億元。

面對(duì)無(wú)法繞開(kāi)兩大剛性支出——研發(fā)投入與算力成本,進(jìn)入2026年以來(lái),國(guó)內(nèi)外云廠商陸續(xù)對(duì)AI算力、存儲(chǔ)等相關(guān)產(chǎn)品進(jìn)行調(diào)價(jià),但國(guó)內(nèi)模型相較于海外模型而言,依然便宜。

根據(jù)民銀證券2025年12月發(fā)布的研報(bào),國(guó)內(nèi)大模型API平均價(jià)格約為 3.88 元/百萬(wàn) Tokens,而海外模型約為20.46 元/百萬(wàn) Tokens,是國(guó)內(nèi)模型 API 價(jià)格的5倍以上。

價(jià)格優(yōu)勢(shì)帶來(lái)了規(guī)模需求,在這一背景下,國(guó)內(nèi)大模型廠商恐怕暫時(shí)還不會(huì)擺脫價(jià)格戰(zhàn)。但在Token消耗大于供給的當(dāng)下,逐漸收緊免費(fèi)額度和補(bǔ)貼也是大勢(shì)所趨。

羅福莉提到,大模型行業(yè)的出路不是更便宜的Token,而是“更高token效率的Agent框架”疊加“更強(qiáng)大高效的模型”,Agent時(shí)代不屬于燒算力最多的人,而是用算力最聰明的人。

這將推動(dòng)大模型廠商往兩個(gè)方向發(fā)展:

一方面,從“算力規(guī)?!鞭D(zhuǎn)向“工程效率”的競(jìng)爭(zhēng),單純賣API的企業(yè)將面臨越來(lái)越近的天花板,要將模型層跟智能硬件、應(yīng)用產(chǎn)品等深度結(jié)合起來(lái),才能為商業(yè)模式注入更多可能性。

另一方面,推動(dòng)Token收費(fèi)的分層定價(jià)。當(dāng)下,主流大模型的計(jì)費(fèi)方式基本上涵蓋了訂閱制、按量計(jì)費(fèi)以及Token Plan套餐,即超額后再按量付費(fèi)。

長(zhǎng)遠(yuǎn)來(lái)看,Token定價(jià)除了簡(jiǎn)單地“按量分層”,還可以按推理能力、任務(wù)數(shù)量等維度推出更精細(xì)化的付費(fèi)體系,既能讓平臺(tái)緩解算力峰值的壓力,也能進(jìn)一步增加收入。

比如DeepSeek悄悄上線了“快速模式”和“專家模式”兩個(gè)入口,被認(rèn)為是分成模式的一種全新探索;火山引擎譚待表示,未來(lái)可能會(huì)孵化出垂直領(lǐng)域的智能體,按回答問(wèn)題的數(shù)量收費(fèi)。


當(dāng)下,Token狂歡或許還會(huì)持續(xù)一段時(shí)間,但對(duì)整個(gè)大模型來(lái)說(shuō),Token成本已經(jīng)成為每一個(gè)企業(yè)和用戶都無(wú)法忽視的成本因素。

說(shuō)到底,大模型從來(lái)不是一門純粹的技術(shù)生意,而是一場(chǎng)關(guān)于效率與價(jià)值的博弈。大模型企業(yè)想做長(zhǎng)久的生意,自然也要學(xué)會(huì)算賬,只有腳踏實(shí)地,才能更好仰望星空。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
今天才知道,為啥鵝蛋很少有人吃?為啥賣鵝蛋的人很少?漲知識(shí)

今天才知道,為啥鵝蛋很少有人吃?為啥賣鵝蛋的人很少?漲知識(shí)

阿龍美食記
2026-04-12 15:01:18
皮爾斯:全明星前我都不知道阿夫迪亞是誰(shuí),現(xiàn)在他打出了名聲

皮爾斯:全明星前我都不知道阿夫迪亞是誰(shuí),現(xiàn)在他打出了名聲

懂球帝
2026-04-15 22:52:39
金融圈突發(fā)!涉嫌嚴(yán)重違紀(jì)違法,姚玉平被查

金融圈突發(fā)!涉嫌嚴(yán)重違紀(jì)違法,姚玉平被查

中國(guó)基金報(bào)
2026-04-14 19:05:24
何潔自曝養(yǎng)家艱難,40歲斷崖式衰老?明明一手好牌,為何被打爛

何潔自曝養(yǎng)家艱難,40歲斷崖式衰老?明明一手好牌,為何被打爛

扒點(diǎn)半吃瓜
2026-03-10 07:00:13
潛伏在中國(guó)高層的大間諜,遍布軍界政界,簡(jiǎn)直令人唏噓

潛伏在中國(guó)高層的大間諜,遍布軍界政界,簡(jiǎn)直令人唏噓

咸説歷史
2026-04-14 14:21:44
全網(wǎng)都在尋這輛滬牌車!原以為它是出車禍,開(kāi)近才發(fā)現(xiàn)是真英雄

全網(wǎng)都在尋這輛滬牌車!原以為它是出車禍,開(kāi)近才發(fā)現(xiàn)是真英雄

上觀新聞
2026-04-15 13:34:04
斯諾克正賽名單誕生!趙心童、丁俊暉迎來(lái)新幫手,江俊輸球砸球臺(tái)

斯諾克正賽名單誕生!趙心童、丁俊暉迎來(lái)新幫手,江俊輸球砸球臺(tái)

曹說(shuō)體育
2026-04-15 11:01:08
荷蘭砸200億挽留無(wú)效!光刻機(jī)巨頭ASML為何執(zhí)意要走?真相太扎心

荷蘭砸200億挽留無(wú)效!光刻機(jī)巨頭ASML為何執(zhí)意要走?真相太扎心

大衛(wèi)聊科技
2026-04-15 13:29:37
離開(kāi)曼聯(lián),啥也不是!巴薩出局,拉什福德被狂噴:活該沒(méi)冠軍

離開(kāi)曼聯(lián),啥也不是!巴薩出局,拉什福德被狂噴:活該沒(méi)冠軍

卡靈頓分析師
2026-04-15 18:46:19
勇士出局,大局已定!庫(kù)里時(shí)代翻篇了

勇士出局,大局已定!庫(kù)里時(shí)代翻篇了

毒舌NBA
2026-04-15 10:27:56
迪拜富豪來(lái)中國(guó)旅游一個(gè)月,回國(guó)感嘆:中東與中國(guó)差距真的太大了

迪拜富豪來(lái)中國(guó)旅游一個(gè)月,回國(guó)感嘆:中東與中國(guó)差距真的太大了

千秋文化
2026-04-11 20:15:45
八千里路云和月大結(jié)局:田家泰認(rèn)張汝賢為干爹,張?jiān)瓶㈨n小月

八千里路云和月大結(jié)局:田家泰認(rèn)張汝賢為干爹,張?jiān)瓶㈨n小月

慢半拍sir
2026-04-15 20:38:42
CBA季后賽定10席!山西勝?gòu)V廈提前晉級(jí),北控超廣州奪主動(dòng)權(quán)

CBA季后賽定10席!山西勝?gòu)V廈提前晉級(jí),北控超廣州奪主動(dòng)權(quán)

燒體壇
2026-04-15 22:13:07
英軍上將警告:若臺(tái)海開(kāi)戰(zhàn),英軍將同時(shí)打擊中俄,重點(diǎn)對(duì)付中!

英軍上將警告:若臺(tái)海開(kāi)戰(zhàn),英軍將同時(shí)打擊中俄,重點(diǎn)對(duì)付中!

別吵吵
2026-04-15 09:49:16
CBA新賽季第一小外援風(fēng)采!史密斯單場(chǎng)9記三分狂轟45+15+14

CBA新賽季第一小外援風(fēng)采!史密斯單場(chǎng)9記三分狂轟45+15+14

狼叔評(píng)論
2026-04-15 22:52:09
蘋果憋了10年的折疊屏,靠一瓶膠水干掉了折痕

蘋果憋了10年的折疊屏,靠一瓶膠水干掉了折痕

碳基打工人
2026-04-14 08:48:22
汪峰真是不懂珍惜,這么高級(jí)的美人不應(yīng)該拱手讓出去。

汪峰真是不懂珍惜,這么高級(jí)的美人不應(yīng)該拱手讓出去。

科學(xué)發(fā)掘
2026-04-15 13:28:04
一線記者傳回中東戰(zhàn)報(bào),伊朗國(guó)內(nèi)的慘烈程度,遠(yuǎn)比想象中大得多

一線記者傳回中東戰(zhàn)報(bào),伊朗國(guó)內(nèi)的慘烈程度,遠(yuǎn)比想象中大得多

阿器談史
2026-04-13 12:08:12
遼寧103-95擊敗同曦 球員評(píng)價(jià):4人優(yōu)秀,2人及格,5人低迷

遼寧103-95擊敗同曦 球員評(píng)價(jià):4人優(yōu)秀,2人及格,5人低迷

籃球資訊達(dá)人
2026-04-15 21:34:52
河南一景區(qū)推“虎景房”,隔著雙層防彈玻璃與老虎“同眠”,一晚168元;揭秘走紅背后:從“黑色煤?!弊兩沓蓜?dòng)物園砸了3.8億

河南一景區(qū)推“虎景房”,隔著雙層防彈玻璃與老虎“同眠”,一晚168元;揭秘走紅背后:從“黑色煤海”變身成動(dòng)物園砸了3.8億

極目新聞
2026-04-15 17:05:43
2026-04-15 23:20:49
鈦媒體APP incentive-icons
鈦媒體APP
獨(dú)立財(cái)經(jīng)科技媒體
132286文章數(shù) 862097關(guān)注度
往期回顧 全部

科技要聞

ChatGPT十億用戶又怎樣?Anthropic直接貼臉

頭條要聞

豫劇團(tuán)下鄉(xiāng)演出臺(tái)下觀眾痛哭流涕:觀眾超千人一半落淚

頭條要聞

豫劇團(tuán)下鄉(xiāng)演出臺(tái)下觀眾痛哭流涕:觀眾超千人一半落淚

體育要聞

三球準(zhǔn)絕殺戴大金鏈:轟30+10自我救贖

娛樂(lè)要聞

謝娜現(xiàn)身環(huán)球影城,牽手女兒溫馨有愛(ài)

財(cái)經(jīng)要聞

業(yè)績(jī)失速的Lululemon:"健康"人設(shè)崩塌?

汽車要聞

空間絲毫不用妥協(xié) 小鵬GX首發(fā)評(píng)測(cè)

態(tài)度原創(chuàng)

時(shí)尚
健康
本地
藝術(shù)
軍事航空

赫本愛(ài)穿的傘裙,好優(yōu)雅!

干細(xì)胞抗衰4大誤區(qū),90%的人都中招

本地新聞

12噸巧克力有難,全網(wǎng)化身超級(jí)偵探添亂

藝術(shù)要聞

這山水,蕩滌胸中塵埃

軍事要聞

萬(wàn)斯:對(duì)當(dāng)前美伊局勢(shì)進(jìn)展“感到樂(lè)觀”

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版