
聽著像游戲段位。員工也確實把它當游戲打了。
《The Information》獨家報道顯示,Meta員工30天內消耗了60.2萬億個token。按Anthropic的API公開價格算,這筆賬單約9億美元。 即使大客戶有折扣,保守估計也在1億美元以上。
一位Meta工程師私下說,大量開發者在跑一種類似OpenClaw的內部智能體,瘋狂燒token,產出幾乎為零。他還提到,一些線上事故的根因被追溯到AI生成的代碼。寫代碼的人似乎更關心堆出大量代碼,而不是代碼能不能跑。
排行榜頂端那些人,產出的東西基本都是"一次性垃圾"。 他的原話。
被媒體曝光后第二天,Meta悄悄下線了這個排行榜。
微軟從今年1月就開始搞內部token排行榜。這個榜有個耐人尋味的特點:排名靠前的很多是VP級別和杰出工程師級別的人。平時開會多、寫代碼少,但token用量遙遙領先。
一位微軟工程師承認自己在"tokenmaxxing"。不是因為想上榜,而是怕被看到token用得太少。他說:
"我們有內部儀表盤,追蹤AI使用量、token消耗、AI寫的代碼占比。我不想被貼上'AI用得少'的標簽。為了抬高數據,我會拿文檔里已經有的問題去問AI,讓AI把文檔處理一遍再回答我,比直接查文檔慢10倍,但能燒很多token。我還會讓AI去原型化一些我根本不打算做的功能,提示幾次之后把代碼全刪了。"
這位工程師入職不久,擔心的是工作安全。邏輯很簡單:寧可多燒錢,也別在數據上顯得不夠"AI原生"。 今年5月,微軟因token賬單失控,被迫收回大部分Claude Code授權,把員工推回更便宜的Copilot。
Salesforce更直白。
公司做了一個Mac桌面小工具,每15分鐘刷新你的token花費,同時顯示一個"最低預期支出"。上周的標準:Claude Code每月至少100美元,Cursor每月至少70美元。沒達標,就被標記。
還有一個工具可以查看任何同事的token支出。員工用來互相比較,精準找到那個"略高于平均"的刻度,然后把自己的花費控制在那里。
一位Salesforce工程師說,有些同事的做法是讓AI"幫我做X",而這個X跟手頭工作毫無關系,純粹為了燒token,做完也不會上線。直到上周,部分團隊干脆取消月度上限,理由是"消除開發流程中的摩擦"。
Uber的故事在時間線上最有戲劇性。
去年12月,Uber給約5000名工程師配了Claude Code。今年2月使用率32%;3月到4月之間飆到84%到95%。70%的代碼提交是AI生成的,11%的后端更新完全不需要人工干預。
聽著很厲害。
然后Uber在4月就把全年AI預算燒光了。 每個工程師每月的API成本在500到2000美元之間。
Uber的COO安德魯·麥克唐納(Andrew Macdonald)最近在一檔播客里說得很坦誠:"當我們討論AI使用量時,那些標題數字會讓你腦子炸掉。但你要問的是:生產力提升到底有多少?哪些產品是AI驅動的?這兩者之間的聯系,還沒建立起來。"
公平地說,預算燒光也可能意味著AI的真實需求比預期更高。關鍵看多出來的花費換來了什么。但Uber的COO自己也承認,產出和花費之間的聯系還沒建立起來。
他還補了一句:"目前還沒有什么真正起飛的東西。"
二、賬本不會說謊
把上面的故事串起來,一個共同的問題浮出來了:AI到底替公司省了錢,還是多花了錢?
先看英偉達。英偉達深度學習研究副總裁布萊恩·卡坦扎羅(Bryan Catanzaro)今年4月接受Axios采訪時說了一句大白話:在他自己的團隊里,AI計算成本已經遠遠超過員工工資總和。GPU和推理的支出,比人工成本還高。
注意,說這話的人是英偉達的人。英偉達是賣GPU的。連他們自己都說,重度使用AI的團隊面臨計算成本遠高于人力成本的現實。
再看行業數據。多份2026年的追蹤報告顯示,Claude Code和Copilot宣傳每月10到200美元的訂閱費,但在重度智能體模式下,每個工程師每月的實際API成本跑到500到2000美元。 加上代碼審查、技術債務、調試這些隱藏成本,一個AI輔助團隊的總擁有成本比純人類團隊高出12%以上。
不只是編碼輔助。更復雜的AI智能體項目成本更高。
Gartner預測,到2027年,40%的AI智能體項目會因成本超支被砍掉。德勤2026年的報告發現,只有11%的公司真正把AI智能體部署到了生產環境。超過80%的項目因成本爆表而暫停或取消。 一個AI智能體的開發和運行總成本,往往從預期的5萬美元飆到38萬美元以上。
表面效率很高,實際上token消耗和持續維護很快就把預算撐破了。
這里引出一個170年前的經濟學概念:杰文斯悖論。
經濟學家杰文斯發現:蒸汽機效率提高后,煤炭消耗不但沒減少,反而大幅增加。因為效率高了,使用門檻低了,用的人多了,總消耗反而更大。
AI token的情況一模一樣。單價在持續下降,但人均使用量的增長遠遠跑贏降價速度。尤其是AI智能體完成一個任務需要的token是普通問答的1000倍。OpenClaw的創始人彼得·斯坦伯格(Peter Steinberger)透露,他的團隊一個月的token成本超過130萬美元。
效率提升→使用量暴增→總成本不降反升。杰文斯悖論在AI時代的精確復現。
但當前大廠面對的問題比杰文斯悖論更糟。不只是總量在漲,漲出來的部分有大量是純浪費。
一位IBM背景的技術觀察者在X上評論:"'AI取代你的工作'這個敘事撞上了一堵墻。微軟發現AI比人力更貴。Uber四個月燒完全年預算。如果AI比雇你更貴……之前的恐慌是不是過頭了?"

tokenmaxxing導致的浪費是一筆賬,AI本身的成本結構是另一筆賬。前者可以通過改變激勵方式解決;后者需要等技術降本。但當兩筆賬疊在一起,大廠看到的就是一個讓CFO頭疼的數字。
三、Shopify的不同解法
是不是所有人都在踩同一個坑?不是。
也有團隊用AI真正提了效。前提是它們從來沒把"用量"當KPI。
Shopify是去年最早做token排行榜的公司,但路徑跟前面幾家不一樣。工程負責人法漢·塔瓦爾(Farhan Thawar)說,他們后來把"排行榜"改名叫"使用儀表盤"。"原因很明顯,我們不想鼓勵'競爭'上榜。"

他們還做了三件事。
一,裝了"斷路器"。某個人的token花費一天內異常飆升,系統自動切斷訪問。塔瓦爾說這個斷路器不只幫他們發現了失控智能體,還順帶揪出了一些基礎設施的bug。
二,對高消費的人做人工跟進。不是表揚,而是問:你為什么花這么多?使用場景是什么?如果有人為了燒token而燒token,到這一步會很難看。
三,關注了一個更刁鉆的指標:不看"誰花的總token最多",而看"誰的token最貴"。他們發現,token單價最高的開發者,往往在做最有深度的活。 因為他們在用AI啃硬骨頭,而不是刷簡單任務。
Shopify的經驗說明一件事:問題不在于用不用AI,而在于你盯著什么指標。盯著消耗量,得到的是浪費。盯著產出質量,得到的是效率。
有中文科技博主評論:"真正的高手用AI是去解決痛點、省掉低價值勞動,不是為了刷token而刷token。大廠現在集體進入AI的'moment of truth'。Uber燒穿預算,亞馬遜踩剎車,下一步可能就是更重視真實ROI,而不是表面的活躍度數據。"

四、同一個坑,換了個名字
X上一位開發者評論:"扭曲的激勵,必然滋生經濟上的低效。微軟、Meta、亞馬遜僵化的AI采用指標,正在反噬成一場巨大的成本危機。"

回頭看這場"tokenmaxxing"鬧劇,有一種強烈的既視感:這不就是當年"代碼行數"考核的翻版嗎?
曾經有一段時間,很多公司用程序員每天寫多少行代碼來衡量產出。后來大家發現這事蠢透了。寫一萬行樣板代碼,不如寫十行解決核心問題的邏輯。最優秀的開發者往往不是寫得最多的人,而是能最快最穩解決難題的人。
token數也一樣。容易被操縱,一旦列入考核就一定會被操縱。區別在于:操縱代碼行數的代價最多是浪費幾張紙,操縱token數的代價是真金白銀的AI賬單。
Pragmatic Engineer播客主持人杰爾吉·奧羅茲(Gergely Orosz)追蹤多家大廠后下了判斷:tokenmaxxing對AI廠商是好事,對其他所有人都是壞事。
為什么對AI廠商好?因為每一筆被浪費的token,都會變成AI公司的收入。
這也是為什么黃仁勛會在今年3月的英偉達開發者大會上對猶豫用AI的經理說"你瘋了嗎",為什么他鼓勵工程師每年消耗至少相當于自己半年薪水的token。
立場不同,賬的算法就不同。
五、比"貴不貴"更重要的問題
把整件事拉遠一點看。
亞馬遜、Meta、微軟、Salesforce、Uber,都在做同一件事:用排行榜、最低消費、KPI綁定,變著法子推員工"多用AI"。
背后的假設很簡單:AI能替代人的一部分工作,多用就等于多省人力成本。
這個假設正在被現實打臉。
AI確實能做很多事。但它目前的成本結構,遠沒有達到"比人便宜"的拐點。強迫員工多用的結果,不是效率線性提升,而是大量"為了用而用"的浪費。就像亞馬遜那位VP說的:"別為了用AI而用AI。"
Uber的COO說得更直白:token消耗和實際產出之間,"聯系還沒建立起來"。
這不是說AI沒用。而是說,衡量方式一開始就錯了的話,越用力推,離目標越遠。
排行榜上燒token最猛的人,恰恰是產出最低效的人。為了達標讓AI跑無用任務的團隊,恰恰是消耗資源最多的團隊。
問題的核心不在于AI技術夠不夠好,也不在于token夠不夠便宜。而在于:當一家公司把"AI使用率"本身當成目標,它得到的一定是漂亮的數據和糟糕的賬本。
token價格還在持續下降。今天不劃算的事,明年可能就劃算了。但至少今天,大廠需要面對的現實是:AI還沒便宜到可以隨便燒。
目前的答案:當你想用AI替代人的時候,你可能要多付一筆錢。而且付了這筆錢之后,你得到的不是省下來的人力,而是一群忙著燒token、做無用功、互相攀比數據的人。
最后在干活和浪費的,還是人。
正如那位技術觀察者的反問:如果AI比雇你還貴,之前的恐慌是不是過頭了?
亞馬遜、Meta悄悄關掉排行榜,也就不難理解了。大廠正在集體進入一輪"AI大清算"。
賬算不過來的時候,數據再好看也沒用。
真正用好AI的團隊,從來不是盯著token數干活。他們想的是怎么用AI省掉低價值勞動,而不是怎么讓儀表盤上的數字更漂亮。
這個區別,決定了AI到底是工具,還是一張越來越貴的賬單。