![]()
作者 | 青和
最近,越來越多公司發現:還沒等到 AI 真正改造業務,Token 賬單先把自己給改造了。原來 AI 轉型里最貴的坑,就是把 Token 的使用量當成了員工的 KPI。
某公司的老板大手一揮,給全員開通 Claude 授權,卻忘了設上限。一個月燒掉 5 億美元,折合人民幣 30 多億。等財務反應過來,上億美元的賬單已經在路上。
![]()
5 億美元究竟是怎么燒的?扒開細節,發現其中有相當一大塊,都是某些員工跑任務時,反復撞上報錯,一遍遍手動點"重試"點出來的。
如果只是一家公司手滑,那叫倒霉。問題是,類似的“事故”一抓一大把。
Meta 內部有人做了一個叫 Claudeonomics (Claude 經濟學)的榜單,統計誰用 AI 用得最猛。30 天里,全公司燒掉超過 60 萬億個 Token,光“榜一大哥”一人就占了 2810 億 Token,將近 50 萬美金 / 月。
![]()
Uber 最早給 5000 名工程師配齊 Claude Code,使用率幾個月內猛沖,結果一季度剛過,CTO 就叫苦不迭:2026 全年的 AI 編程預算已提前燒光。
國內也不遑多讓。在阿里云峰會上,米哈游技術負責人就提到,有員工為了做一個項目,搭了幾十個 Agent 協作,一晚上燒掉 200 萬人民幣的 Token。
Token賬單為何會如此失控?
高盛今年 5 月的報告《Decoding the Agentic Economy》點破了真相:在 Agentic 模式下,模型由于需要不斷進行“思考 - 檢索 - 調用工具 - 重新讀取完整上下文”的循環,其 Token 消耗量達到了普通問答模式的 1000 倍。
![]()
你以為它在思考,其實它也在燒錢。而模型公司、云廠商、芯片公司,更是心照不宣地把“多用 AI、多燒 Token”包裝成了先進生產力的進步。
這時再看 Anthropic 單季度超百億、估值破萬億美元的造富狂飆,老黃贏麻了的增長曲線,是不是就不難理解了?下游“事故性”燒掉的錢,轉身就成了模型公司財報上實打實的進賬。同一筆錢,兩個視角:一個叫增長,一個叫事故。
亞馬遜先動手了
燒掉幾億美元或許是個極端案例,但為了燒錢而燒錢的現象,早就成了科技大廠的通病。
直到亞馬遜實在看不下去,第一個動了刀。
亞馬遜內部曾有一個叫 KiroRank 的榜單,掛在自家的 Kiro 開發者平臺上,按工程師消耗的 Token 量排名。
加上公司此前下了硬指標,要求八成以上員工每周必須用 AI,榜單一出,員工紛紛開始 Tokenmaxxing:派 Agent 去干根本沒必要的活,把 Token 燒成排名,再把排名內化成職場安全感。
![]()
最后,亞馬遜高級副總裁 Dave Treadwell 終于坐不住了,在內部大會上呼吁強調:不要為了用 AI 而用 AI。
榜單隨即被下線,新指標也換成了“normalised deployments(標準化部署量)”,衡量工程師到底有沒有用 AI 交付出真正有用的代碼,而不是單純數你燒了多少 Token。
作為云計算霸主,亞馬遜當然信 AI,但它也親自證明了一件事:AI 使用量這個指標,太容易被污染。
你統計 Token,員工就會刷 Token;你統計 Prompt 數,員工就會編 Prompt;你暗示“不用 AI 就落后”,員工就會想辦法證明自己沒落后。
經濟學里有個古德哈特定律:當一個指標變成目標,它就不再是一個好指標。
到了 AI 時代,這句話可以換一個說法:當 Token 成了 KPI,它就不再是生產力指標,而是一張會自動膨脹的云賬單。以前卷工時,現在卷 Token;以前 KPI 注水,現在云賬單注水。技術進步了,職場的底色一直沒變。
亞馬遜并不是唯一踩剎車的人。
Shopify已經把 Token 排行榜改成更中性的使用儀表盤,加上熔斷機制。Duolingo曾經想把 AI 使用情況納入績效考核,后來撤回;微軟也開始收縮部分外部 AI 編程工具授權。
你的成本:老黃的資產
那些已經燒掉的錢,并不會憑空消失。一家公司的失控,往往是另一家公司的報表。
看 Anthropic,一季度收入 48 億美元,預計二季度翻倍至 109 億美元。這條曲線靠什么撐起來?不是普通用戶閑聊,而是企業 API、Claude Code 以及無數公司內部那套“全員 AI”“Agent 先跑起來再說”的組織沖動。
![]()
再看賣鏟子的英偉達,最新季度收入 816 億美元,這不只是 AI 信仰,還是實打實的現金流。
現在你再看黃仁勛那句話,味道就變了。昨天他才在 GTC Taipei 上說,從產業角度看,Token 已經成為資產和營收單位。這句話聰明之處就在于,它悄悄偷換了主語。
![]()
Token 的消耗,在普通企業的賬本上,明明是成本,是要被財務追著問“這錢花得值不值”的支出。
只有站在上游廠商的賬本上,Token 才確實是資產:Token 越多,推理越多;推理越多,老黃的 GPU、網絡、液冷都得跟著賣。站在 Anthropic 的賬本上也是資產:企業每多跑一輪 Agent,最后都會變成它的營收和利潤率。
但站在下游企業的賬本上,Token 首先是成本。 成本不是不能花,但只有換回更短流程、更少返工、更強交付,才有資格叫資產。如果 token 只是為了排行榜和先進性的證明來燒錢,那不過是更貴的形式主義。
AI 提效的戰場,并不在 Token 榜單
當然,這并不是要回到保守主義,否則投資 AI 的價值。問題是,很多公司把 AI 落地理解得太淺了。
他們以為給員工開賬號就是 AI 轉型,以為使用率上去了就是組織進步,以為 Token 燒得多就是 AI 用得深。
率先投身這場“轉型”的 Uber COO,分享了激進之后的醒悟:我們的代碼確實多交付了一些,但很難把它和“給用戶做出了更有用的功能”劃上等號。
這并非個例,代碼分析公司 GitClear 扒了 2.2 億行代碼,發現用 AI 輔助后,寫完兩周內就得返工的代碼,翻了 9 倍;復制粘貼的重復代碼翻了 8 倍。很多時候,企業只是把人類低效的地方,換成了模型以更貴的方式低效一遍。
![]()
真正的 AI 組織提效,并不在 Token 榜單上,而發生在業務深處。企業 AI 落地最難的地方,不是給員工開賬號,而是讓模型穿透工作流。
這也是為什么現在 OpenAI、Anthropic 都在重金招募Forward-Deployed Engineer(前向部署工程師),深入客戶內部去拆流程、理權限、做集成—— 因為他們也已經意識到,光是 API 層面的交付,根本落不了地。
![]()
上游公司當然會繼續講 Token 的故事,但那畢竟是別人的增長故事。普通企業如果不先把自己的業務問題、流程結構想清楚,就急著把別人的故事搬進自己的 KPI,最后只會淪為別人財報里的配角。
你這一頭的事故,就是那一頭的營收。會燒 Token 并不算本事,能說清楚“這筆錢到底讓組織哪里變好了”才算。
聲明:本文為 AI 前線原創,不代表平臺觀點,未經許可禁止轉載。
會議推薦
企業級 Agent 落地,繞不開 4 個真實的工程問題!如何在 Agent 安全性和可用性之間找到平衡點?Agent 需要什么樣的記憶系統才能真正理解上下文?如何通過算法壓榨實現智力增量與成本控制的極致平衡?多 Agent 協作,如何做到可觀測、可治理、可控制?6.26-27 AICon 上海站,國內頭部公司的 Agent 實踐,一次說透。
今日薦文
你也「在看」嗎?
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.