一張Token指數圖,點燃了AI增長和賬單失控的焦慮。
這張圖是Silicon Data統計的LLM Token支出指數。6月11日,它已連跌7天,創下今年1月以來最長連跌紀錄;過去12天里,有11天是下跌的。
這個指數衡量的是全市場每使用100萬枚Token平均支付多少錢——可以理解為市場愿意為AI“付多少錢”的晴雨表。它自去年12月以來翻了一番以上,并在2026年5月前持續攀升,但近期急轉直下。
它觸動的不是一個小指標,而是整條AI交易鏈:如果企業開始控制Token賬單,GPU、DRAM、數據中心和云廠商的資本開支預期,會不會被重新定價?
美國宏觀策略師Andreas Steno Larsen在6月9日直接把這張圖稱為“當前全市場最應關注的一張圖”,并警告:如果Token定價持續走弱,本輪周期中從內存到更廣泛的硬件及數據中心交易可能宣告結束。
這句話戳到了投資者最敏感的神經。但華爾街的看法更為復雜和多面,Token定價走弱可能并非單純的AI需求見頂。
![]()
指數下跌是不是需求見頂?這張圖到底表達了什么
這張圖不能簡單讀成“AI沒人用了”。
它不是Token總需求指數,也不是Token總支出金額。它量的是每百萬Token的加權平均價格——也就是說,它反映的是用戶在用什么價位的模型。
算一筆簡單的賬就清楚了:假設前沿模型10美元/百萬Token,便宜模型1美元。某個月100單位用量全跑在前沿模型上,指數是10。下個月需求翻倍到200,但新增的全是便宜模型跑的批量任務,指數直接掉到5.5。
需求翻倍,指數腰斬。
這意味著,指數下跌有兩種完全不同的解釋:一是需求真的在萎縮;二是用量在爆炸,但用戶在主動向低價模型遷移。
這正是當前爭論的核心:指數下跌,到底是需求見頂,還是用量結構下沉?
Citadel證券發布《Tokenomics》報告認為,AI落地的核心約束已從"模型能力"轉向"成本與算力稀缺",用戶正加速向廉價模型遷移。
“采用趨勢越來越不取決于前沿模型的功能,而更多取決于價格……Token指數的近期下跌可能反映了這種向更便宜模型轉變的部分跡象。”
摩根大通TMT分析師Mark Schilsky則在6月11日把近期市場討論概括為:“AI賬單失控了。”同時,該行認為當前的Token支出亂象只是“通往更高支出的最小減速帶”。
![]()
Citadel的判斷:AI的“性價比與稀缺性”變得更重要了
Citadel證券在其最新發布的《Tokenomics》報告中,給出了一個明確的方向性判斷。
核心論點是:AI落地的核心約束,已經從"模型能力"轉向了"成本與稀缺性"。
Citadel的表述是:“技術落地的核心不再是前沿模型理論上能做什么,而是規模化實現AI運行所需的投入品的價格與稀缺性。算力、電力、冷卻、內存帶寬和推理預算,都是真實存在且具有約束力的限制條件。”
報告援引經濟學基本原理:價格有三大功能——傳遞稀缺信號、催生替代動力、將資源配置到價值最高的用途。這三條在AI領域正在同時發生。
結論是:未來最好的回報,不會來自那些構建最強模型的公司,而是來自那些降低AI成本、提升效率的公司。
同時,推理密集型前沿AI不會消失,但會越來越集中在少數有能力承擔成本的大型企業手中。對整個經濟體而言,在物理約束緩解之前,更簡單的模型可能是更具生產力的路徑。
![]()
低價模型正在改變賬單結構
高盛One-Delta部門負責人Rich Privorotsky曾提到,DeepSeek下調75%的定價,小米MiMo接近99%的降價幅度,基礎設施瓶頸緩解正在觸發價格戰。
Coinbase首席執行官Brian Armstrong預測,未來12至18個月,80%的AI工作負載會遷移到成本低99%的模型上,只有20%需要極致智能的任務會繼續留在前沿模型上。
Hugging Face首席執行官Clement Delangue援引斯坦福大學數據稱,本地模型在真實世界查詢中的準確率已升至71.3%,且成本極低。
這與Citadel的判斷相接近:前沿AI不會消失,但可能集中在少數能承受算力成本、具備研究深度、且能把高難度問題轉化為規模化收益的企業手中。
對更廣泛的經濟體而言,在物理約束緩解前,更簡單的模型可能是更便宜的生產力工具。
也就是說,AI使用可能走向分層。
高價值、復雜任務繼續使用前沿模型。日常任務、批量任務、低回報實驗,則轉向便宜模型或本地模型。
摩根大通:優化賬單,不等于AI需求見頂
摩根大通的判斷則是:現在的賬單焦慮,可能只是AI需求早期階段的小減速帶;一年后Token支出可能明顯更高。
如果每百萬Token平均成本下降,但美國公司AI付費滲透率仍在上升,總Token用量在算術上就必須大幅增加。也就是說,“單位價格下降”和“總使用量爆發”可以同時發生。
企業內部的情況也類似。已經大量使用AI的公司會優化Token預算,減少浪費;還沒完全上車的公司,會因為模型更便宜、更容易部署而開始使用。
智能體AI還會放大Token消耗。一個任務過去只需一次調用,現在可能被拆成多步執行、反復規劃、調用工具、讀取上下文,單任務Token消耗會明顯增加。素材中提到,有中小企業案例顯示,業務agent化后,每個任務的Token消耗變成原來的3.5倍。
所以,市場爭論的關鍵不是“Token會不會繼續增長”,而是“增長的單位經濟模型是否健康”。
![]()
當下,企業已經開始管賬單
企業端最先暴露的問題,不是AI沒人用,而是用得太隨意。
Axios援引一位AI顧問的消息稱,其一家企業客戶近期單月在Claude上花費5億美元,原因只是沒有對員工使用量設置上限。
在企業內部,把AI使用量當作考核指標,也開始產生副作用。
此前美國部分公司內部把AI使用量當成排名或考核指標,結果誘發了“Tokenmaxxing”:員工為了刷高使用量,讓AI執行低價值任務。
亞馬遜旗下開發者平臺Kiro曾設有內部排行榜“Kirorank”。亞馬遜高級副總裁Dave Treadwell承認,員工為了刷榜讓AI做無意義任務,推高運營成本。他隨后要求員工“不要為了用AI而用AI”,相關測試版儀表盤被下線。
亞馬遜后續改用“歸一化部署”指標,追蹤AI生成代碼的實際價值,而不是單純追蹤Token消耗。Meta內部也出現過類似拉高Token消耗量以占據排名優勢的情況。
這類調整的含義很明確:企業不是停用AI,而是開始區分“有效Token”和“無效Token”。
摩根大通提到,Cloudflare推出AI Gateway這類產品,目的就是幫助企業控制Token預算。OpenRouter等工具也長期存在,本質都是在不同模型之間做路由和成本管理。
定價端也在變化。
6月1日,GitHub Copilot正式從按請求收費切換為按Token用量計費。Reddit社區有用戶表示,其月度費用預計將從不到45美元升至超過847美元。
GitHub首席產品官Mario Rodriguez此前稱,隨著智能體AI興起,舊有定價模式已不可持續。
Gartner分析師Arun Chandrasekaran在接受Business Insider采訪時稱,隨著高級推理模型推高算力消耗,更多企業將轉向按用量計費。
這意味著,過去靠固定訂閱或補貼隱藏的成本,正在被擺到企業財務表面。
多空分歧:硬件交易的邏輯還成立嗎?
這場爭論的終極問題,是AI基礎設施的投資邏輯是否還成立。
多頭的依據是:高盛的Jim Schneider測算,到2030年,代理式AI將推動Token消耗量增長24倍,云服務商毛利率將在短期內轉正。Mark Schilsky也認為,Token支出的短期亂象不會改變長期趨勢。
空頭的依據是:高盛半導體分析師Jim Covello認為,當前產業鏈繁榮是以犧牲上游消耗為代價的,幾乎所有價值都流向了半導體公司,這種狀況不可持續。投資人Tommy Shaughnessy警告,AI大廠利潤率深度為負,一旦企業直面按量計費的真實價格,支撐GPU采購和模型訓練的資本流動將面臨逆轉。
近日接受采訪時,Anthropic CEO Dario Amodei、博通總裁Hock Tan、《大空頭》原型Steve Eisman等也都談到類似問題:企業目前對AI工具存在過度支出,也就是“Token最大化”現象;隨著成本意識增強和計費模式轉向按Token收費,未來更需要看實際投資回報率。
社交媒體上,也有聲音直接質疑這張圖的敘事框架。有用戶指出,"六天連跌去年在采用高峰期發生過四次","更便宜的模型反而會加速部署,因為成本門檻降低了"。
![]()
也有人反駁:"不管多便宜,每次新模型發布都會指數級消耗更多Token。"
![]()
目前,這場爭論沒有定論。但有一點是確定的:Token支出的邊際變化,通過GPU算力、DRAM內存及數據中心需求的傳導鏈條,直接影響英偉達、存儲芯片廠商及云服務商的資本開支預期。這張圖,投資者不得不盯著看。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.