无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

大模型廠商,是時候告別Token狂歡了

0
分享至



來源 | 伯虎財經(bohuFN)

作者 | 楷楷

“低價賣Token并對第三方開放,看起來很友好,但那是一個陷阱。”

近日,小米集團MiMo負責人羅福莉在X平臺發文,將Token價格戰比喻為“陷阱”,提醒大模型公司不應該盲目參與價格戰。

幾天之前,Anthropic突然宣布切斷第三方工具對Claude訂閱的訪問權限,這也是羅福莉發文討論Token定價邏輯的契機。

在這場全民“養龍蝦”的Token狂歡中,羅福莉的公開信和Anthropic的“封殺令”,成為行業中罕見的“不同聲音”,給這股熱潮潑下了冷水。

但問題是,大模型廠商當真算不清這筆成本賬?還是說,這只是行業一場心照不宣的博弈,用狂燒的Token換取一張通往未來的入場券,賭的是AGI的未來。

如果是這樣的話,誰還能叫醒一個正在裝睡的人。

01 Anthropic撐不住了

幾天前,Anthropic向所有用戶發送郵件,宣布自當地時間4月4日下午3點起,Claude Pro和Max訂閱將不再覆蓋OpenClaw等第三方工具的使用。



事出突然,Anthropic給用戶送了一筆一次性補貼,金額剛好等于一個月訂閱費。但相較于從前花200美元月費就能無限量調用Claude的好日子,這筆補貼顯然只是杯水車薪。

消息一出,社交媒體瞬間炸鍋,用戶們破口大罵,鋪天蓋地都是“過河拆橋”的論調,因為OpenClaw創始人彼得·斯坦伯格跟Anthropic的恩怨早已有之。

OpenClaw最初上線時命名為Clawdbot,由于名字跟Anthropic旗下的Claude高度相似,被Anthropic一份律師函要求改名,梁子算是結下了。

更重要的是,在OpenClaw驗證了市場對開源智能體的需求后,Anthropic隨即推出了Claude Cowork,除了安全考量之外,這也被認為是想用自家產品取代OpenClaw。

但這些都不足以解釋“封殺令”的全部,真正讓Anthropic下決心動刀的,是成本問題。

Anthropic在用戶信中提到,“第三方工具對系統造成了過大的壓力,我們必須優先保障使用我們核心產品的用戶體驗。”

外媒稱明星獨角獸Cursor曾在去年進行估算,發現每月200美元的Claude Code訂閱可能消耗高達2000美元的計算資源,說明Anthropic一直在進行巨額補貼;也有其他分析師指出,Anthropic訂閱制實際消耗的算力成本或高達5000美元。

這意味著,大模型曾經的訂閱收費模式,在Agent時代恐怕難以跑通。

一方面,在Agent模式下,Token使用量正以幾何級增長速度膨脹。

當大模型還停留在對話層面時,單輪對話大約消耗1000-3000個Token,平臺只要統計出一個代表大部分用戶的用量均值,就可以跑通訂閱制。

但在Agent場景中,一個用戶背后可能同時跑著10個甚至100個Agent,每個Agent都在

7×24小時地執行任務,每次任務都會觸發多次模型推理,隨著交互次數不斷增多,就形成了“滾雪球式”的Token消耗,靠“少用”補貼“多用”的訂閱制也就失去了平衡。

作為參考,一個普通ChatGPT用戶即使天天聊天,月消耗也不過百萬級;而一個重度“養蝦”用戶,日均消耗Token則在3000萬-1億之間。

但另一方面,大模型企業的成本并沒有隨著用量暴增而自然下降,反而越走越高。

斯坦福大學的《2025年人工智能指數報告》指出,在高效小模型的驅動下,GPT-3.5 級別的模型推理成本已在過去兩年間下降到了原來的1/280,硬件成本每年下降30%。

只是,推理成本雖然下降了,但訓練成本卻依然驚人。更重要的是,全球算力依然處于緊缺階段,越多用戶扎堆使用Agent,越推高了企業的運營成本。

以OpenAI為例,其對投資者表示,預計到2028年算力支出將達到1210億美元,屆時虧損可能會達到850億美元,或將超越已有上市公司的虧損記錄。

雖然Anthropic的訓練成本沒那么高,約為OpenAI的40%左右,但當下也依然處于燒錢狀態,其自然不想再被第三方工具白薅羊毛。



(圖:OpenAI與Anthropic訓練成本對比)

02 卷Token價格是陷阱

Anthropic撐不住了,國產大模型企業又如何呢?

羅福莉可能是最能共鳴Anthropic的同行,她在社交平臺發文,稱Claude Code大概率不賺錢,甚至可能在虧損,因為Claude Code的定價邏輯要成立,前提是用戶必須用 Anthropic 自己的框架,否則就會出問題。

她以OpenClaw作為案例,指出接入第三方框架可能帶來的問題:

“我觀察過OpenClaw的上下文管理,很糟糕。在單次用戶查詢里,它會觸發多輪低價值工具調用,每次都是攜帶長上下文的獨立API請求,往往超過10萬Token?!?/p>



簡單來說,同一件事,OpenClaw會比Claude Code原生框架多跑幾遍,實際成本會達到訂閱價格的數十倍。在成本結構上,即便是使用OpenClaw的輕度用戶,也等同于重度用戶。

因此,低價售賣Token并對第三方開放看似對用戶友好,實則是陷阱。企業為了控制成本,只能降低算力或用更便宜的低智模型;用戶在低智模型上反復碰壁,使用體驗也并不好。

可是,羅福莉這番發言卻是國內大模型行業中“少數的聲音”。至少在當下,大部分大廠及大模型企業還是將Token吞吐量視為衡量實力的重要指標。

全球大模型聚合路由平臺OpenRouter數據顯示,中國大模型的單周調用量已連續一個月超過海外模型,調用量位于前列的都是國產模型,比如小米、階躍星辰、Minimax等。



全球科技大廠也在推波助瀾,比如鼓勵員工多使用AI工具,Meta甚至列出了Token 消耗量排行榜,這已成為科技大廠的隱性KPI。



因此,Token之所以貴,不僅僅在于居高不下的成本,更因為這是一場暫時還看不到盡頭的消耗戰,當所有人都在拼命消耗更多Token,算力便永遠追不上被制造出來的需求。

況且,比起Token消耗到底是不是虛假繁榮這個問題,大模型企業,更難抵御的是真金白銀的誘惑——在短短3個月里,Anthropic的年化收入便從90億美元飆升至300 億美元。



卷Token價格或許是“陷阱”,但在全球大模型廠商“你追我趕”之際,誰都不愿意先踩下“剎車”。

對于阿里、字節、騰訊等一線科技公司而言,大家圍繞AI超級入口爭奪已久,但還是無法擺脫“燒錢換流量”的互聯網打法,發紅包、增投流能激活DAU,可一旦沒有了“鈔能力”,用戶也會快速流失。

“龍蝦”則成為了新的契機。用戶完成部署后,就相當于將自己的“智能體助手”嵌入了某個云平臺,不僅會產生源源不斷的Token消耗,個人數據也會沉淀在生態體系內,遷移成本將變得越來越高,大廠自然不會放過這個新的“生態入口”。

對于Kimi、智譜等二線廠商而言,“龍蝦”的出現帶動了算力需求,讓它們的模型能夠被調用起來,API增長也有故事可講,這足以驅動它們更賣力地銷售API。

從邏輯上來講,羅福莉對于Token的評價是對的,“價格內卷”不可能一直持續。但對于因為“龍蝦”而跑通增長敘事的大模型廠商而言,大家或許還想再“裝睡”一會兒。

03 效率比價格更重要

誰也無法叫醒一個裝睡的人,但現實或許可以——越來越高的Token消耗量并沒有帶來相應的利潤增長,這也是大模型企業無法回避的問題。

以全面對標Anthropic的智譜為例,其在2025年交出了一份“高增長、高虧損”的成績單:全年總收入7.24億元,同比大增131.9%;全年虧損47.18億元,同比擴大59.5%。

智譜創始人張鵬曾表示,智譜要成為Anthropic的平替,甚至開玩笑稱Anthropic賣200美元,我們就賣200元人民幣。今年3月,智譜發布了一鍵安裝的AutoClaw,個人版39元/月/3500萬Tokens,99元/月/1億Tokens,門檻確實不高。



但背后的賬單也非常沉重。2025年,智譜的研發開支為31.8億元,同比增長44.9%;沒有基礎設施的智譜,還需要給第三方算力供應商支付高額的采購費,從2022 年的1463萬元飆升至2025 年上半年的 11.45億元。

面對無法繞開兩大剛性支出——研發投入與算力成本,進入2026年以來,國內外云廠商陸續對AI算力、存儲等相關產品進行調價,但國內模型相較于海外模型而言,依然便宜。

根據民銀證券2025年12月發布的研報,國內大模型API平均價格約為 3.88 元/百萬 Tokens,而海外模型約為20.46 元/百萬 Tokens,是國內模型API 價格的5倍以上。

價格優勢帶來了規模需求,在這一背景下,國內大模型廠商恐怕暫時還不會擺脫價格戰。但在Token消耗大于供給的當下,逐漸收緊免費額度和補貼也是大勢所趨。

羅福莉提到,大模型行業的出路不是更便宜的Token,而是“更高token效率的Agent框架”疊加“更強大高效的模型”,Agent時代不屬于燒算力最多的人,而是用算力最聰明的人。

這將推動大模型廠商往兩個方向發展:

一方面,從“算力規模”轉向“工程效率”的競爭,單純賣API的企業將面臨越來越近的天花板,要將模型層跟智能硬件、應用產品等深度結合起來,才能為商業模式注入更多可能性。

另一方面,推動Token收費的分層定價。當下,主流大模型的計費方式基本上涵蓋了訂閱制、按量計費以及Token Plan套餐,即超額后再按量付費。

長遠來看,Token定價除了簡單地“按量分層”,還可以按推理能力、任務數量等維度推出更精細化的付費體系,既能讓平臺緩解算力峰值的壓力,也能進一步增加收入。

比如DeepSeek悄悄上線了“快速模式”和“專家模式”兩個入口,被認為是分成模式的一種全新探索;火山引擎譚待表示,未來可能會孵化出垂直領域的智能體,按回答問題的數量收費。



當下,Token狂歡或許還會持續一段時間,但對整個大模型來說,Token成本已經成為每一個企業和用戶都無法忽視的成本因素。

說到底,大模型從來不是一門純粹的技術生意,而是一場關于效率與價值的博弈。大模型企業想做長久的生意,自然也要學會算賬,只有腳踏實地,才能更好仰望星空。

文章封面首圖及配圖,版權歸版權所有人所有。若版權者認為其作品不宜供大家瀏覽或不應無償使用,請及時聯系我們,本平臺將立即更正。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
1990年,90歲張學良爆料于鳳至不堪隱私,因三個兒子之死痛恨發妻

1990年,90歲張學良爆料于鳳至不堪隱私,因三個兒子之死痛恨發妻

銅臭的歷史味
2026-06-13 05:46:20
情侶越變態越長久??總結了12種戀愛類型,看看你是哪一種

情侶越變態越長久??總結了12種戀愛類型,看看你是哪一種

畢導
2026-06-23 18:05:00
笑死!我們是長大了不是瞎了,同一角色對比,才知什么叫審美倒退

笑死!我們是長大了不是瞎了,同一角色對比,才知什么叫審美倒退

喜歡歷史的阿繁
2026-06-24 06:38:33
荷蘭男籃主帥:這次杭州之行是荷蘭隊外出參賽體驗最好的一次

荷蘭男籃主帥:這次杭州之行是荷蘭隊外出參賽體驗最好的一次

懂球帝
2026-06-23 22:55:07
國臺辦:民進黨當局是地區和平穩定的“麻煩制造者”

國臺辦:民進黨當局是地區和平穩定的“麻煩制造者”

界面新聞
2026-06-24 10:30:05
朝鮮偷偷轉播世界杯,國際足聯裝瞎,天價版權遇到鐵板

朝鮮偷偷轉播世界杯,國際足聯裝瞎,天價版權遇到鐵板

胡一舸南游y
2026-06-24 17:27:31
印度和美國媒體集體認為:中國在伊朗戰爭中的策略堪稱全球表率

印度和美國媒體集體認為:中國在伊朗戰爭中的策略堪稱全球表率

青桅
2026-06-23 17:32:59
49歲夏奇拉世界杯隨便一拍就是大片,骨相抗老,粉絲夸她滿49減20

49歲夏奇拉世界杯隨便一拍就是大片,骨相抗老,粉絲夸她滿49減20

新金牌娛樂觀察家
2026-06-23 13:08:27
突發!韓國股市,又跳水了

突發!韓國股市,又跳水了

證券時報
2026-06-24 11:46:21
長友佑都:現在的狀態是1000%,希望決賽碰法國

長友佑都:現在的狀態是1000%,希望決賽碰法國

懂球帝
2026-06-23 20:18:11
普京:若西方打擊俄羅斯,必遭報復

普京:若西方打擊俄羅斯,必遭報復

澎湃新聞
2026-06-24 16:02:47
巴媒:巴西賽前全隊合影的習慣將保持至世界杯結束

巴媒:巴西賽前全隊合影的習慣將保持至世界杯結束

懂球帝
2026-06-24 11:39:30
1天4個瓜!國外生子、緊急送醫、自曝懷雙胎、關曉彤最讓人意外

1天4個瓜!國外生子、緊急送醫、自曝懷雙胎、關曉彤最讓人意外

翰飛觀事
2026-06-24 19:28:40
全場“劃船”他不動:挪威球迷拒絕應援動作當“反骨仔”,但全心全意支持國家隊

全場“劃船”他不動:挪威球迷拒絕應援動作當“反骨仔”,但全心全意支持國家隊

紅星新聞
2026-06-24 11:33:35
陳坤周迅在北京聚餐!陳坤穿垂襠褲顯隨意,周迅披著外衣裝扮逗趣

陳坤周迅在北京聚餐!陳坤穿垂襠褲顯隨意,周迅披著外衣裝扮逗趣

一盅情懷
2026-06-24 14:35:38
難以置信!成績未出,已收到復旦大學短信,上海一家長爆料引熱議

難以置信!成績未出,已收到復旦大學短信,上海一家長爆料引熱議

火山詩話
2026-06-24 08:52:00
韓國總理:回到母校清華園,心中滿是欣喜

韓國總理:回到母校清華園,心中滿是欣喜

新京報政事兒
2026-06-24 17:18:51
河南一景區玻璃觀景臺被男童用傘扎裂,游客緊急疏散!景區:目前整體承重和安全沒問題

河南一景區玻璃觀景臺被男童用傘扎裂,游客緊急疏散!景區:目前整體承重和安全沒問題

齊魯壹點
2026-06-23 23:09:25
A股:今天突破漲到4110了,提前做好準備,明天周四可能這樣走了

A股:今天突破漲到4110了,提前做好準備,明天周四可能這樣走了

明心
2026-06-24 15:18:13
12名印度工人上流水線,蘇州汽配工廠被查,老板要出來解釋清楚了

12名印度工人上流水線,蘇州汽配工廠被查,老板要出來解釋清楚了

小虎新車推薦員
2026-06-23 15:53:40
2026-06-24 20:20:49
伯虎財經 incentive-icons
伯虎財經
伯虎團隊聚焦頭部企業,以深度原創為特色,為你發掘精彩的商業價值。
1547文章數 3133關注度
往期回顧 全部

科技要聞

豆包專業版上線:定價68-500元每月

頭條要聞

外媒:又一名美四星上將在美防長迫使下提前離職

頭條要聞

外媒:又一名美四星上將在美防長迫使下提前離職

體育要聞

字母哥,會把凱爾特人拆了嗎?

娛樂要聞

向佐向佑兄弟合體直播!母子終于和解

財經要聞

爆料人:如果我錯了,賠償坐牢都接受

汽車要聞

施鵬澤:為什么奧迪E7X強調座艙氣味安全?

態度原創

本地
數碼
藝術
公開課
軍事航空

本地新聞

2026世界杯全勤太難?這份保姆級攻略請收好

數碼要聞

華碩天選7X游戲主機體驗:酷睿Ultra 9與5060Ti的360W狂暴釋放

藝術要聞

日本發現顏真卿三件失傳草書,字跡歪歪扭扭,真實水平卻令人嘆為觀止!

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

伊朗代表:霍爾木茲海峽已免費開放

無障礙瀏覽 進入關懷版