網易首頁 > 網易號 > 正文 申請入駐

Token消耗暴增千倍,云廠商開始慌了

0
分享至



作者:趙元,編輯:何玥陽

2026年的春天,北美云計算巨頭的財報季變成了一場集體“受難日”。

微軟智能云部門季度營收首破500億美元,Azure同比增長39%,財報發出后股價卻暴跌近10%;亞馬遜AWS收入創下13個季度以來最快增速,次日股價重挫11%;谷歌云營收暴漲48%,股價依然在盤后由漲轉跌。

原因只有一個字:錢?;蛘哒f,正在失控的AI賬單。

翻開巨頭們的財報會發現,微軟單季資本支出375億美元,同比增長66%,雖未給出全年指引,但有分析稱,若按照單季資本支出趨勢,全年支出將超越千億美元量級;亞馬遜宣布2026年支出2000億美元;谷歌計劃投入1750-1850億美元,幾乎是2025年的兩倍。

三家巨頭合計支出突破5000億美元,相當于挪威2024全年GDP。

資本市場在焦慮什么?是云業務增長不夠好?顯然不是。大客戶用得越多,云廠商的賬單反而越容易“爆雷”。一場圍繞“怎么收錢”的暗戰,正在硅谷悄悄上演。輸贏將重塑整個AI產業鏈的價值分配。

一、Token模式開始懲罰深度用戶?

一個不容忽視的事實是,Token計費模式,成為AI普及的最大功臣之一。

2024年初,中國日均詞元(Token)調用量為1000億;至2025年底,躍升至100萬億;今年3月,已突破140萬億,兩年增長超千倍。

同時,隨著“小龍蝦”爆火,AI從“玩具”變成了“生產工具”,Token模式的弊端開始顯現。

以AI智能體為例,一個傳統的聊天機器人,回答一個問題消耗幾百到幾千個Token。但一個能獨立完成任務的AI智能體,每次執行需要多輪推理、反復調用工具、讀取大量上下文。業內人士測算,智能體的Token消耗動輒放大數十倍,復雜任務甚至是普通對話的百倍、千倍。

OpenAI在2026年3月關停了視頻生成工具Sora,其原因之一就是入不敷出。新京報援引分析機構SemiAnalysis的測算稱,Sora日均運營成本接近1500萬美元,年度成本高達54億美元。

OpenAI項目負責人曾直言:“目前的經濟模式完全不可持續。”視頻生成的算力消耗遠高于文字、圖像生成,一次視頻生成的GPU資源,足夠ChatGPT回答數十個問題,嚴重擠壓核心業務資源。

Token模式下,用AI越多,賬單越失控。英偉達CEO黃仁勛甚至說,未來英偉達工程師都會有自己的“年度Token預算”,如果一個高薪工程師一年下來沒消耗多少Token,反倒顯得奇怪。

一個行業走到“用量越大越恐懼”這一步,說明收費模式出了根本問題。

你用得越多,我賺得越多,聽起來很不錯。但大客戶面對上下大幅浮動的AI賬單,CFO根本不敢批準規模化預算。Token模式正在懲罰它最應該挽留的人:那些用量最大、場景最深的頭部客戶。這與云廠商做大蛋糕的長期利益背道而馳。

在此背景下,北美云廠商先后祭出的新武器叫PTU:預配吞吐量單位。

簡單說,客戶預先購買一定數量的算力容量,按月、按季或按年付固定費用,與實際Token消耗量無關。Token模式是“吃多少付多少”,PTU是“包月自助餐”??蛻臬@得成本確定性,云廠商獲得客戶關系鎖定。

這背后的博弈邏輯就完全變了。

Token模式下,雙方是“零和博弈”,客戶省錢等于云廠少賺,客戶多花等于云廠多賺。但大客戶因恐懼成本失控而壓縮用量,導致云廠收入增長不及預期。

PTU模式下,博弈變成了“正和”,客戶鎖定預算后敢于擴大AI用量,云廠的收入增長更可持續。本質是將風險從客戶側轉移到云廠商側,換取客戶關系的深度綁定。

國信證券將中國移動互聯網資費變遷做了一個類比。

2G時代,流量按KB計費,0.01元/KB,用戶用流量像在滴血。3G時代,資費轉向MB,150元包3GB,用戶開始放開手腳。4G時代,“提速降費”推動無限流量套餐全面爆發,像2016年騰訊“大王卡”19元包月、騰訊系APP免流,用戶徹底從“購買流量”轉向“購買服務”。5G時代,計費進一步演變為“按速率分級”,流量多少不再是定價核心。

每一次計費模式變革,都是一次產業鏈話語權的重新分配。運營商放棄“按KB收費”的暴利模式,換來的是用戶月均流量從30M暴漲至10GB以上,蛋糕總量擴大了數百倍。

今天云廠商的選擇,與當年運營商如出一轍。他們寧愿犧牲短期毛利率,也要換取長期合約的確定性。國信證券研報指出,PTU轉型將使云業務毛利率結構從“高彈性波動”向“高韌性”轉變,即短期承壓,長期更健康、更穩定。

二、三巨頭打法差異化的陽謀

微軟、AWS、谷歌三家巨頭,表面上都在推PTU,骨子里的打法卻截然不同。

微軟靠的是生態捆綁。 微軟的武器是Windows、Office 365、GitHub構成的龐大生態系統。它推出“Azure AI承諾計劃”,鼓勵企業客戶簽訂1-3年消費承諾合同。本季度,微軟商業剩余履約義務飆升至6250億美元,同比增長一倍以上。其中45%來自OpenAI的2500億美元新協議。

微軟的算盤很精,最高級的定價權,是讓客戶無法單獨核算AI成本。當AI變成Word里的一個按鈕,預算自然并入軟件訂閱費中。但過度依賴單一客戶也引發市場擔憂,一旦OpenAI經營承壓,連鎖反應將直擊微軟。

AWS靠的是成本優勢。 AWS的底氣是自研Trainium和Inferentia芯片,以及全球最大的云基礎設施規模。它大力推廣“AI/ML節省計劃”,為客戶提供比按需付費顯著優惠的價格。

亞馬遜CEO安迪·賈西在財報會上的表態極為強硬:“在年化營收1420億美元基礎上實現24%同比增長,與競爭對手在明顯更小基數上實現更高百分比增長,是截然不同的?!?/p>

AWS用極致供應鏈效率構建護城河,它不怕價格戰,因為單位算力成本已是行業最低。在財報會上,高管多次強調“新增算力能快速變現”。言下之意是,它賭的是規模效應最終碾壓一切。

而谷歌則是靠性能溢價。 谷歌在AI技術積累上底蘊最深,自研TPU已迭代至第七代,Gemini模型月活用戶達7.5億。第四季度谷歌云營收增長48%,增速遠超競爭對手。

谷歌將“承諾使用折扣”擴展至AI平臺,吸引對性能有極致要求的客戶。它走的是技術奢侈品路線,不求客戶最多,但求最賺錢的高端客戶離不開它。

與蘋果的合作更是關鍵一步:谷歌已成為蘋果首選云服務商,兩家公司正合作開發基礎模型,這將確保谷歌AI技術通過蘋果設備觸達全球用戶。

三種策略代表三種不同的經濟護城河:微軟靠轉換成本,AWS靠規模效應,谷歌靠技術領先。要判斷哪家將從PTU轉型中獲益最多,核心是評估其護城河類型能否在長期合同鎖定期內持續有效。

不過,PTU轉型的影響不會止步于云廠商與大客戶之間,它將沿產業鏈向上游芯片商、下游應用商傳導。

上游芯片商最先受益。Token模式下,云廠商算力采購是“脈沖式”的——流量暴增時緊急加單,低谷時資源閑置。PTU模式下,長期合同讓云廠商敢于向上游下達更平滑、更可預測的訂單。

微軟計劃2026年內將AI算力提升超80%,未來兩年數據中心規模翻倍。英偉達等芯片商的產能規劃將更從容,供應鏈效率顯著提升。

下游AI應用商則加速洗牌,PTU模式下,大客戶鎖定資源后,中小客戶的資源池可能被擠壓。AI應用創業門檻正在抬高,過去靠Token按需付費就能啟動的項目,未來可能面臨更高起步成本。與此同時,能幫客戶優化PTU利用率的工具層公司——AI負載調度、成本管理SaaS——將迎來結構性機會。

國信證券研報指出,定價模式變革正處于拐點期,預計未來一年內變革影響消化完畢后,訂單長協化趨勢將帶來收入與利潤增長的確定性顯著提升。

三、結語

從Token到PTU的轉變,標志著AI產業從“野蠻生長”的試驗階段進入“精耕細作”的商業化成熟階段。

回望移動互聯網從按KB計費到無限流量的歷程,正是資費模式的成熟,才催生了短視頻、直播、云游戲等萬億級市場。今天AI計費的陣痛,是在為下一個“抖音級”AI原生應用鋪路。

當然,PTU不會是終點。隨著模型即服務(MaaS)的興起,AI計費可能進一步向“按業務結果付費”演進。定價權的博弈,始終是觀察AI產業演進的核心線索。

在這個過程中,真正的贏家將是那些把“鎖定客戶”做成“服務客戶”的玩家,當定價權從零和博弈走向正和共贏,AI商業化的成人禮才算真正完成。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
不當總統了?馬克龍將卸任,臨走前通告全球:中美俄都在針對我們

不當總統了?馬克龍將卸任,臨走前通告全球:中美俄都在針對我們

共工之錨
2026-04-28 00:08:09
12人落馬5輪徹查,張軍失聯第18天,64歲蔡振華成正面教材

12人落馬5輪徹查,張軍失聯第18天,64歲蔡振華成正面教材

林子說事
2026-04-28 00:43:18
槍擊案發生時,特朗普旁邊的華裔女記者原來是她!那個曾讓“懂王”憤然離場的人……

槍擊案發生時,特朗普旁邊的華裔女記者原來是她!那個曾讓“懂王”憤然離場的人……

新民周刊
2026-04-27 16:14:29
開源模型橫掃21個科學任務!寬德Will聯手斯坦福清北,試錯變武器

開源模型橫掃21個科學任務!寬德Will聯手斯坦福清北,試錯變武器

機器之心Pro
2026-04-26 13:19:19
山西澤州發生重大刑事案件,33歲嫌犯潛逃,警方發布協查通報

山西澤州發生重大刑事案件,33歲嫌犯潛逃,警方發布協查通報

極目新聞
2026-04-27 17:56:03
奕境X9,華為合作的又一款旗艦大六座

奕境X9,華為合作的又一款旗艦大六座

汽車商業評論
2026-04-27 11:12:51
大五座SUV市場都在演戲!嵐圖泰山X8,撕碎所有偽大五座

大五座SUV市場都在演戲!嵐圖泰山X8,撕碎所有偽大五座

科技每日推送
2026-04-23 18:25:22
雷克薩斯全新一代ES:依然ES,超「躍」ES

雷克薩斯全新一代ES:依然ES,超「躍」ES

汽車公社
2026-04-27 08:33:46
炸裂!北京車展惡性事件!尚界展車慘遭人為損毀,法務部硬核發聲

炸裂!北京車展惡性事件!尚界展車慘遭人為損毀,法務部硬核發聲

天天熱點見聞
2026-04-27 06:27:09
千里科技AI戰略發布:L4智駕、原生智駕基座模型,翻開行業新篇章

千里科技AI戰略發布:L4智駕、原生智駕基座模型,翻開行業新篇章

科技每日推送
2026-04-23 18:44:48
22個省級政府主要負責人擔任省級責任人!這一名單對外公布

22個省級政府主要負責人擔任省級責任人!這一名單對外公布

知知貴陽
2026-04-26 18:02:26
副部級王中和被判有期徒刑17年!受賄超6674萬元、行賄200萬元,結交政治騙子、搞權色交易

副部級王中和被判有期徒刑17年!受賄超6674萬元、行賄200萬元,結交政治騙子、搞權色交易

揚子晚報
2026-04-27 17:19:01
快訊!巴拿馬海關新消息!

快訊!巴拿馬海關新消息!

故事終將光明磊落
2026-04-27 18:31:24
來真的了?外媒發現:055當著日本航母的面,發射了鷹擊20!

來真的了?外媒發現:055當著日本航母的面,發射了鷹擊20!

小莜讀史
2026-04-26 23:23:12
被發改委叫停外資收購的Manus,到底是一家什么公司?

被發改委叫停外資收購的Manus,到底是一家什么公司?

新浪財經
2026-04-27 20:16:16
機器人馬拉松超越人類之后:本體走到盡頭,智能成為下半場

機器人馬拉松超越人類之后:本體走到盡頭,智能成為下半場

機器之心Pro
2026-04-24 17:21:01
吉林伊通驚現200萬豪華住宅式墓地,獨門獨戶地上地下兩層

吉林伊通驚現200萬豪華住宅式墓地,獨門獨戶地上地下兩層

大象新聞
2026-04-27 13:41:32
5月1日營業執照新規落地!公章徹底取消,所有個體戶老板速看

5月1日營業執照新規落地!公章徹底取消,所有個體戶老板速看

混沌錄
2026-04-27 19:31:17
斯諾克世錦賽:吳宜澤13-11塞爾比晉級8強,等待特魯姆普和瓦菲的勝者

斯諾克世錦賽:吳宜澤13-11塞爾比晉級8強,等待特魯姆普和瓦菲的勝者

懂球帝
2026-04-28 00:19:06
一大批高校,將搬遷!

一大批高校,將搬遷!

吉刻新聞
2026-04-27 16:08:43
2026-04-28 04:24:49
市值榜
市值榜
資本與商業研究
683文章數 1638關注度
往期回顧 全部

科技要聞

DeepSeek V4上線三天,第一批實測出來了

頭條要聞

坐在特朗普身邊親歷槍擊案的女記者 身份非常不一般

頭條要聞

坐在特朗普身邊親歷槍擊案的女記者 身份非常不一般

體育要聞

人類馬拉松"破二"新紀元,一場跑鞋軍備競賽

娛樂要聞

黃楊鈿甜為“耳環風波”出鏡道歉:謠言已澄清

財經要聞

Meta 140億收購Manus遭中國發改委否決

汽車要聞

不那么小眾也可以 smart的路會越走越寬

態度原創

家居
時尚
健康
教育
數碼

家居要聞

江景風格 流動的秩序

絲巾的10種系法,愛美的女人必看

干細胞如何讓燒燙傷皮膚"再生"?

教育要聞

你不說這是計算障礙,我真以為我是智障呢

數碼要聞

6K/3K雙模切換!三星這款顯示器什么水平?

無障礙瀏覽 進入關懷版