![]()
新智元報道
![]()
【新智元導讀】Token單價暴跌到不足1美元,總賬單卻在爆炸——這是AI經濟學里最反直覺的一幕。
每百萬Token只花0.99美元。
這是SemiAnalysis——硅谷最硬核的半導體研究機構——自己賬單上的真實成本。
但更炸裂的是這個數字:內部大模型Token支出,已經占到員工總薪資的30%。
聽起來不少——但反過來算,這筆錢買到的產出,過去得靠好幾倍的人力成本才能覆蓋。人均每月吞掉近50億個Token,是Meta人均水平的5倍以上,核心貢獻者月消耗更突破1000億。
原本需要初級分析師花幾個小時搞定的Excel模型轉換、財報圖表制作,如今幾分鐘內完成,只需要幾美元。
![]()
SemiAnalysis自己的評價一針見血:這不是10%的效率提升,而是專業服務業的單元經濟正在被重寫。
研究公司、對沖基金、律所——所有靠人腦吃飯的行業,Token支出占到薪資的兩三成,只是時間早晚的問題。
英偉達CEO黃仁勛比誰都急。
今年GTC大會上他直接放話:一個年薪50萬美元的工程師,年底Token消費不到25萬美元?
「我會徹底抓狂。」
![]()
他打算給英偉達每個工程師發相當于半年工資的Token預算,還要讓7.5萬名員工搭配750萬個AI智能體一起干活。
不用AI?老黃說,這跟芯片設計師堅持用紙和鉛筆沒區別。
Token已經不是工具了,它正在變成新時代的「生產資料」。
但硅谷的另一半,正在為AI賬單抓狂
有意思的是,就在SemiAnalysis用Token省下真金白銀的同時,硅谷的巨頭們正因為AI賬單焦頭爛額。
Uber是最經典的案例。
去年底公司向5000名工程師推廣Claude Code,還搞了排行榜——用得越多,排名越高,內部競爭直接拉滿。
結果太成功了:2月工程師使用率32%,3月就飆到84%,到了4月,95%的工程師每月都在用AI,70%的提交代碼來自AI生成,而全年預算——已經花完了。
CTO說「要從頭重做預算」。后來更狠——Bloomberg曝出,Uber給每位員工設了每月1500美元的Token上限,超了要特批。
但COO Andrew Macdonald在播客里說了句大實話:AI使用量確實在漲,但它跟消費者功能創新之間的聯系……目前還看不到。
![]()
微軟的情況更魔幻。上個月《The Verge》曝出,微軟正在取消大部分Claude Code許可證,轉向自家的GitHub Copilot CLI。
原因很簡單:花錢的速度比產出的速度還快。
英偉達應用深度學習副總裁Bryan Catanzaro在今年4月說得更直接:「對我的團隊來說,計算成本遠遠超過了員工的成本。」
MIT 2024年的研究:在以視覺為主要工作內容的崗位中,只有23%的場景下AI自動化在經濟上劃算。
剩下77%的情況下,雇人比用AI便宜。
甚至還有工程師吐槽AI智能體在使用中「毀掉了他的數據庫和網絡」——他稱之為「過度使用」的代價。
天價預算、使用失控、翻車不斷——硅谷正處在AI經濟學最撕裂的階段。
一邊是技術帶來前所未有的生產力,一邊是賬單以同樣前所未有的速度膨脹。
成本塌縮才剛剛開始
但SemiAnalysis的核心論點是:別盯著今天的價格看,成本塌縮才剛開始。
先看軟件端。
在B300上運行DeepSeek R1,通過wideEP、disagg與MTP三層純軟件優化,單GPU吞吐量能從baseline的1000 tokens/秒飆升至14000 tokens/秒——14倍提升,純靠代碼。
![]()
再看硬件端。
最優化配置的GB300 NVL72吞吐量是H100的17倍,切到FP4精度直接拉到32倍。
![]()
Opus 4.7的標價是輸入5美元/百萬、輸出25美元/百萬,看起來不便宜。
但由于智能體工作負載的輸入輸出比高達300:1,加上90%以上的緩存命中率,實際混合成本被壓到了0.99美元。
連標價的五分之一都不到。
把軟件和硬件疊在一起,一個結論很難回避:大模型的毛利率擴張,不是一次性的定價巧合,而是結構性的趨勢。
Anthropic今年的ARR從90億美元沖到了440億以上,毛利率從38%飆到了70%以上——Token變便宜了,但賣Token的人反而更賺錢了。
Gartner今年3月的報告佐證了這一點:到2030年,萬億參數大模型的推理成本將比2025年下降超過90%。
SemiAnalysis的判斷很明確:如果你想預估2027年Token價格,答案就一個字——降。
錢花了,然后呢?
這正是當下AI最撕裂的地方:全球科技公司今年AI資本開支已宣布7400億美元,比去年暴增69%;同一時間,科技業裁員速度已超去年全年。
錢在狂燒,人在被裁,但Goldman Sachs首席經濟學家說了句大實話——AI對經濟的實際影響,到目前為止基本為零。
這不是AI不行,而是每一輪基礎設施革命都要經歷的陣痛:先燒錢建管道,再等水流過來。
電網如此,互聯網如此,AI也不例外。
差別只在于,這一次管道鋪設的速度,和水流過來的速度,都是上一代人沒見過的量級。
SemiAnalysis已經站在水流過來的那一邊了——30%的薪資換來了數倍的產出杠桿,而成本曲線還在急劇下降。
至于其他公司:是現在蹚水過河,還是等對岸的人已經建好了城再追。
參考資料:
https://x.com/SemiAnalysis_/status/2070915305858007345
編輯:所羅門
![]()
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.