![]()
新智元報道
![]()
【新智元導讀】Epoch AI最新測算揭開一個殘酷現實:把全球所有Blackwell芯片拉滿,也喂不飽Token洪流。
前沿大模型的漲價游戲,還能玩多久?
今年1月至今,GPU租賃價格上漲超過兩倍。
![]()
根據Counterpoint 2月發布的《內存價格追蹤報告》,2026年第一季度至今,內存價格環比上漲80%-90%,創下前所未有的大幅飆升。
![]()
這種價格上漲,自然傳遞到了下游。
Epoch AI剛剛發布的《梯度更新》報告,做了一件簡單粗暴的事:把全球所有Blackwell芯片能處理的Token數量算出來,再和實際需求一比。
結論只有一個字——不夠。
Token洪流吞沒一切
先看供給側。
Epoch AI的模型以Kimi K2.6為基準——萬億參數、320億活躍參數的MoE架構。
![]()
在8000:1000的輸入輸出比下,全球Blackwell集群的理論極限是每秒約200億輸出Token。
聽起來很多?換算一下:夠地球上每個人每月用700萬Token。
![]()
但這是理想情況。一旦上下文窗口拉長到128k,吞吐量直接暴跌50倍,降到每秒約5億Token。
再看需求側。
Google剛剛披露,自家每秒處理約12億Token(輸入+輸出)。
按8k:1k請求比例換算,每秒輸出Token約1.3億。Exponential View估算,Google大約占全球Token需求的25%。
![]()
這意味著當前全球Token需求,用Blackwell全產能、全給昂貴的萬億參數模型去跑,勉強能撐住。
但需求在以什么速度增長?
每年10倍。
自2024年以來,Google處理的Token量年增10倍,其他供應商的增速也差不多。
而供給側呢?全球AI算力年增3.4倍,芯片內存帶寬年增4.1倍。
![]()
供給3.4倍 vs 需求10倍。差距每年都在撕裂。
Meta員工一天燒100萬Token
算力緊缺不是抽象數字。
看看企業內部在發生什么。
The Information報道,Meta的8.5萬名員工每月消耗60萬億Token。
![]()
換算下來,每位員工每天燒掉約100萬輸出Token。
![]()
Apple更猛。
部分工程團隊被允許每天在Token上花費300美元——按Kimi K2.6的價格算,夠一個人一天生成2500萬輸出Token。
![]()
這還只是兩家公司。
全球約有1400萬軟件工程師每天在用AI。
如果他們的使用強度達到Meta或Apple員工的水平,全球Token吞吐需求將飆升至每秒2億到40億Token。
40億。
而Blackwell長上下文的極限是5億。差了整整一個數量級。
Claude Code讓開發者慢了19%
更尷尬的事情也在發生。
METR的最新研究顯示,Claude Code在實測中讓資深開發者的完成速度慢了19%。
VS Code相關插件的安裝增速自年初以來明顯趨平。
![]()
編碼工具的增長放緩,背后可能是兩個原因疊加:一是算力資源本身在吃緊,二是很多企業已經燒完了全年的AI預算。
![]()
與此形成鮮明對比的是,前沿模型還在漲價。
ChatGPT Pro訂閱價格上調,Claude的API價格水漲船高,Gemini的漲幅最兇——部分場景下價格暴漲3倍。GPT-5.5的定價更是直接翻倍。
![]()
用得更多,花得更貴,效果卻未必更好。
企業的算盤很快就打清楚了。
逃向DeepSeek
一條逃跑路線已經成型。
DeepSeek V3的訓練成本僅為前沿模型的1/10到1/20,API價格低至同類的1/16。
![]()
性能呢?直逼GPT-5。
Hacker News上一個帖子火了:一套11個月ROI模型,手把手教企業算清楚——從GPT-5.5切到DeepSeek,每年能省多少錢。
![]()
評論區的共識很簡單:前沿模型的定價權正在崩塌。
當一個開源模型能用1/16的價格跑出90%的效果,漲價就不再是信心的體現,而是客戶流失的加速器。
Tokenmaxxing——企業瘋狂堆Token用量來榨取AI價值——本來是前沿模型的增長敘事。
但現在,The Information的報道顯示,這種策略正在反噬AI公司自身的利潤邊際。
用戶越多,虧得越多。漲價止血,用戶就跑。
經典的死亡螺旋。
![]()
算力懸崖前的決賽格局
把視角拉遠一點。
前沿實驗室——OpenAI、Anthropic、Google DeepMind——僅占全球AI算力的20%-30%。
剩下的70%-80%在企業自用、云服務商、推理服務商手里。
這意味著,即便是最頂尖的實驗室,也無法靠自建算力解決供需缺口。它們和所有人一樣,在搶同一批芯片。
算力每年增3.4倍,需求每年增10倍。這個剪刀差不會自動消失。
更小的模型確實在替代部分需求——蒸餾層的崛起證明了這一點。但能力提升又在不斷制造新需求。
AI行業正站在一個懸崖邊上。
不是技術的懸崖,模型還在變強。是經濟的懸崖,算不過來賬了。
當GPU租金翻倍、API價格暴漲、開源替代品性能逼近、編碼工具的ROI被質疑,一個核心問題浮出水面:
前沿模型的護城河,到底是智能,還是算力?
如果答案是算力,那么誰控制芯片,誰就控制AI的未來。如果答案是智能,那么DeepSeek用1/16的價格逼近同等效果,已經在動搖這個答案。
參考資料:
https://counterpointresearch.com/en/insights/Memory-Prices-Surge-Up-to-90-From-Q4-2025
https://www.signalbloom.ai/posts/outsourcing-plus-localai-will-soon-become-more-economical-vs-frontier-labs/https://news.ycombinator.com/item?id=48278610
編輯:大衛
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.