網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

平民玩家，開始玩不起AI了

2026-04-23 20:06:20　來源: 非凡油條

北京舉報

分享至

2026年4月12日，智譜Coding Plan（海外版）月付價格幾乎翻倍。

第二天，阿里云宣布取消百煉平臺基礎(chǔ)套餐的續(xù)費入口。

其他廠商并沒有在漲價上落后，4月9日，騰訊云AI算力全線上調(diào)5%。

這場漲價潮，代表著AI產(chǎn)業(yè)正從"流量獲客"的互聯(lián)網(wǎng)時代，迅速滑向"算力通貨緊縮"的重工業(yè)時代。

之前為了吸引用戶，大模型大打價格戰(zhàn)。現(xiàn)在token使用量猛增，從大模型到云廠商，都看到了賣token能夠跑通的盈利模式，也該提價收回此前的成本了。

在洶涌增長的token需求面前，算力供應(yīng)極度吃緊，漲價就順著產(chǎn)業(yè)鏈不斷向下游傳導(dǎo)，承受成本的終端就是中小型開發(fā)者和普通用戶。

智能體撞開了算力閘門

我國日均token調(diào)用量，今年三月已經(jīng)超過了140萬億，相比2024年初的1000億增長了1000多倍，比起2025年底的100萬億，三個月內(nèi)也增長了40%。

最近三個月的猛漲，主要得益于以O(shè)penClaw為代表的智能體，讓它們自動工作要消耗大量token，以至于有相當一批人體驗了OpenClaw后，大呼token消耗太厲害，快沒錢燒了，只好卸載了事。

token消耗量猛增，意味著算力大幅消耗，傳導(dǎo)到上游就是AI芯片遭到哄搶。

根據(jù)SemiAnalysis，英偉達H100的一年期租賃合同價格從2025年10月的1.70美元/小時/GPU飆升至2026年3月的2.35美元，漲幅近40%。

上漲的可不只有GPU價格，就連AI服務(wù)器調(diào)度與推理核心的CPU也在被搶購，2026年3月下旬，英特爾與AMD相繼通知客戶上調(diào)處理器價格，這兩家今年服務(wù)器CPU產(chǎn)能已基本售罄。

成本壓力沿著"芯片-云廠商-模型廠商-應(yīng)用廠商-企業(yè)客戶"的鏈條層層下傳。

Cursor是全球最大的獨立AI代碼生成平臺，2026年2月年化收入突破20億美元，看似風(fēng)光，實則2025年虧損至少1.5億美元。

其幾乎所有收入都被用于調(diào)用Anthropic和OpenAI的模型，毛利率被壓縮至令人窒息的水平。

傳統(tǒng)SaaS軟件公司毛利率中位數(shù)高達77%，現(xiàn)在AI大模型和應(yīng)用卷死了傳統(tǒng)軟件公司，可AI應(yīng)用的平均毛利率僅為25%至60%。

所以大模型只能漲價，把成本繼續(xù)往下游傳導(dǎo)，此前價格戰(zhàn)給的福利要收回，這一風(fēng)氣也不是國內(nèi)先開始的。

2026年4月初，全球領(lǐng)先的大模型廠商，已經(jīng)估值數(shù)百億美元的AI巨頭Anthropic，突然切斷訂閱用戶通過OpenClaw等第三方工具接入Claude API的許可。

官方解釋直白赤裸，部分重度用戶每月僅支付200美元訂閱費，卻消耗了價值5000美元的算力資源。

一個OpenClaw代理運行一天，背后的算力成本在1000至5000美元之間，用戶還是趁早別白嫖自家服務(wù)，該去切換至按用量付費的API模式，不然連Anthropic都頂不住。

token浪費觸目驚心

大模型漲價，用戶肉疼之余也在疑惑，這token就非得燒這么多嗎？

今年3月，就有一位名為shelvenzhou的開發(fā)者在GitHub上進行了一項基準測試，記錄自己使用OpenClaw處理日常工作的Token消耗軌跡。

第一輪對話成本0.0050美元，很是省錢。

第五輪飆升至0.0665美元，不大對勁。

第十輪達到0.13美元，是個人意識到了，燒的錢根本不是一點點增長，而是指數(shù)級爆炸。

像癌細胞一樣，每一輪分裂都在加速吞噬算力資源。

為什么token消耗會隨著對話次數(shù)增多而指數(shù)爆炸呢？

了解OpenClaw等智能體的工作原理，就能理解token消耗量指數(shù)增長，是因為“上下文的無序膨脹”。

隨著對話輪次增長，歷史文件、對話記錄不斷累積，智能體為了尋找相關(guān)信息，往往只能采取"寧可錯殺一千"的策略，把所有文件都讀一遍。

用戶每次輸入后，Agent甚至可能需要重新計算完整的對話記錄和文件數(shù)據(jù)。這導(dǎo)致智能體成本指數(shù)級增長，正如shelvenzhou測試的那樣，第10輪對話的成本已是第1輪的26倍。

聰明的你自然會想到，這么多消耗的token里有相當一部分是浪費掉了。

《財經(jīng)》統(tǒng)計，今年一季度，GitHub上有關(guān)“Token Waste”（token浪費）的問題，數(shù)量沖到了超過4000多個，比起上個季度增長了快五倍。

☉數(shù)據(jù)來源：財經(jīng)

天下苦token浪費久矣。

讓人人都能用得起智能體

想要用token少花錢，一個辦法是多提供芯片，把芯片成本降下來。

然而國產(chǎn)AI芯片產(chǎn)能仍然被卡脖子，3月底華為昇騰服務(wù)器系列也漲價了，910C（A3）1TB內(nèi)存版本單臺大概上漲16萬至32萬元，2TB版本漲幅在32萬至48萬元之間。

還有一個辦法，就是優(yōu)化智能體，讓它不要再浪費那么多token了。

目前有個成熟做法是“KV Cache”（鍵值緩存）技術(shù)。

這項技術(shù)原理也簡單，模型對已計算上下文的結(jié)果進行緩存，以免下次調(diào)用重復(fù)計算消耗token。

還有一個辦法，就是做好模型分工，token用在刀刃上。

復(fù)雜規(guī)劃用旗艦?zāi)Ｐ捅ＷC準確，簡單的高頻執(zhí)行交給輕量模型即可。

OpenAI的Codex升級已經(jīng)體現(xiàn)了這種分層邏輯：GPT-5.4負責規(guī)劃、協(xié)調(diào)與最終判斷，而GPT-5.4 Mini子智能體則并行處理代碼庫檢索、大文件審閱等細粒度任務(wù)。

不管哪種方法，都說明目前的智能體仍然處于起步階段，還很不成熟，就像一批天不怕地不怕的小馬駒，雖然最終能跑到終點，但過程中會到處亂跑消耗體力。

所以最近harness在AI圈子里火了。

Harness原意是馬具，放在這里就是指約束智能體，讓它更省力地跑到終點，這涉及到給模型調(diào)用什么工具、如何做分層的上下文工程、如何管理長記憶、如何設(shè)計工作流。

從這個意義上說，在智能體從"能跑"進化到"越跑越穩(wěn)"的harness時代，能做的工作還有很多。誰能用更少的token完成同樣的任務(wù)，誰就能在AI產(chǎn)業(yè)的殘酷洗牌中存活。

token經(jīng)濟的正向循環(huán)不會自動形成，想要用戶用得起，還是得減少浪費，讓大家都玩起來。

否則，2026年智能體普及年的狂歡，將在算力不足，擠出普通用戶的過程中落幕。

AI漲價潮：智譜海外版“直逼”Claude，阿里云取消基礎(chǔ)套餐，四年前的H100也賣光了 https://mp.weixin.qq.com/s/VJzaTh9rHAawssltU3FaFQ

阿里、騰訊、百度集體調(diào)價，Token第一股年內(nèi)狂飆547%，算力漲價潮來了 https://mp.weixin.qq.com/s/s6LoLAD3WvhN1-QdNi_hDg

從“龍蝦”到“愛馬仕”，Agent越能干Token越費錢 https://mp.weixin.qq.com/s/40lUY9JWuxq6EryEkImK-Q

Elephant走紅：AI開始為“Token浪費”算細賬 https://mp.weixin.qq.com/s/7e0WXmZl2Ar25vd-RiNHbg

今天，50%的Token正在被浪費 https://mp.weixin.qq.com/s/r7LMwCArMtDfejJbrPJC5w

我國日均Token的調(diào)用量三個月增長超40% 目前已超140萬億_媒體聚焦_數(shù)字中國建設(shè)峰會 https://www.digitalchina.gov.cn/2026/xwzx/mtjj/202603/t20260325_5300141.htm

聲明：個人原創(chuàng)，僅供參考

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦

熱點推薦

AI時代，別再提“人人都是程序員”了

虎嗅APP 2026-06-14 02:46:07
132 跟貼 132
2026年玩AI必備技能：不是提示詞，是循環(huán)工程

機器之心Pro 2026-06-15 21:25:30
0 跟貼 0

物理世界：AI Agent 的下一個戰(zhàn)場

鈦媒體APP 2026-06-15 15:13:51
0 跟貼 0

碼農(nóng)連任務(wù)都不寫了？Codex開始自己給自己派活

新智元 2026-06-16 00:12:50
0 跟貼 0
豆包會做任務(wù)了，成功幫我薅了瑞幸的羊毛

智東西 2026-06-15 22:28:19
2 跟貼 2

一文讀懂Loop Engineering：6大板塊和三個大坑

智東西 2026-06-15 18:46:43
2 跟貼 2

微軟CEO長文：以后的兩種資本

機器之心Pro 2026-06-15 11:42:33
0 跟貼 0
90%的人都用錯了！實測這個AI一鍵生成PPT，徹底解放雙手

雷科技 2026-06-15 18:25:54
0 跟貼 0

納德拉最新播客：AGI并非終點，要避免無腦燒錢

智東西 2026-06-15 22:49:41
0 跟貼 0
“AI領(lǐng)域最被濫用的術(shù)語”李飛飛終于把世界模型講明白了

量子位 2026-06-07 04:37:43
0 跟貼 0
理想汽車宣布馬赫VLA能力第四季度對齊特斯拉FSD V14

IT之家 2026-06-15 17:42:22
21 跟貼 21
FBI秘密建了座假小鎮(zhèn)，專練網(wǎng)絡(luò)攻擊

硅嶼手記 2026-06-15 02:50:59
0 跟貼 0
察言觀色是藝術(shù)，心領(lǐng)神會是智慧#閱讀提升認知 #強者思維邏輯

叫我金主編 2026-06-15 22:13:10
0 跟貼 0
周靖人的去留不重要

鈦媒體APP 2026-06-15 16:38:18
0 跟貼 0
在中國就得守中國的法律！山姆總部被約談！

看看新聞Knews 2026-06-15 14:30:30
24642 跟貼 24642
理想：馬赫Mind-Pro模型已全面落地賦能L9 Livis車載智能

IT之家 2026-06-15 17:42:22
0 跟貼 0
一句“不吃滾出去”炸出多少情緒：評論區(qū)直接撕起來了

淺遇時光 2026-06-16 00:26:36
0 跟貼 0
新聞聯(lián)播重磅聚焦和林格爾：草原崛起中國云谷，算力改寫區(qū)域發(fā)展

蒙媒 2026-06-15 10:25:05
0 跟貼 0
以青春匠心筑牢電網(wǎng)網(wǎng)絡(luò)安全防線！來認識國網(wǎng)孝感供電公司這位較真的“筑盾尖兵”

極目新聞 2026-06-15 20:49:50
0 跟貼 0
《戰(zhàn)地：硬仗》主機版只剩一周，再不上線就涼透了

宇宙來信發(fā) 2026-06-15 20:44:58
0 跟貼 0
智能體從「單兵作戰(zhàn)」到「精銳團隊」 -2

機器之心Pro 2026-04-28 16:56:00
0 跟貼 0
理想新座艙：算力超手機，90Hz寬屏，蘋果安卓全兼容

我是一個養(yǎng)蝦人 2026-06-16 00:12:42
0 跟貼 0
日本自衛(wèi)隊官員：荷蘭戰(zhàn)機冒險赴日本著實令人驚訝

參考消息 2026-06-15 12:54:08
2175 跟貼 2175
亞洲交流會~有點邏輯

精品街拍 2026-06-14 12:29:09
1 跟貼 1
免費復(fù)刻影視颶風(fēng)工作流

科技俠來了 2026-06-15 14:16:35
3 跟貼 3
“切片式造假”來了，媒體該如何應(yīng)對？

新京報傳媒研究 2026-06-15 18:51:53
0 跟貼 0
300萬元“老破小”被搶瘋，有人一口氣拿下8套

大象新聞 2026-06-15 08:33:06
9950 跟貼 9950
我國備戰(zhàn)俄烏沖突：策略揭秘

小橋流水q 2026-06-14 04:39:51
0 跟貼 0
男子被好友以14根金條抵押借250萬好友失聯(lián)后他懵了

環(huán)球網(wǎng)資訊 2026-06-15 15:53:38
1164 跟貼 1164
媒體評：山姆嚴選不嚴只會涼了會員們的心

瀟湘晨報 2026-06-15 14:13:57
604 跟貼 604
理想汽車基座模型負責人：“除了特斯拉 FSD，國內(nèi)沒有智駕第一梯隊”，太強了！

新浪財經(jīng) 2026-06-16 01:30:09
0 跟貼 0
80%車企或消失，比亞迪能活，李斌余承東預(yù)警，淘汰賽會很慘烈

王新喜 2026-06-15 18:34:23
69 跟貼 69
“張雪機車”獲艾米利亞-羅馬涅站次回合第九名，張雪：其實不需要沮喪，因為我們該做的努力已經(jīng)做完了，輸了就總結(jié)問題，爭取下一站再贏

瀟湘晨報 2026-06-15 10:00:09
444 跟貼 444
熱血傳奇，散人服里的非主流玩家，他們是愛上了介款游戲

羅密歐游戲解說 2026-06-14 07:00:00
0 跟貼 0
布倫森：我沒什么壓力父親簽過八、九份非保障合同那才叫壓力

北青網(wǎng)-北京青年報 2026-06-15 10:04:13
148 跟貼 148
價格戰(zhàn)失效，中國汽車沒有退路了

超電實驗室 2026-06-15 17:24:49
23 跟貼 23
山東雞蛋價格突破每公斤10元，端午節(jié)前仍有上漲空間

星視頻 2026-06-15 10:27:38
197 跟貼 197
用AI定義汽車，AIVA能否跑通新的造車路徑

36氪 2026-06-15 21:30:23
0 跟貼 0
買了個汽車模型，居然有40邁的速度，這時候多么希望它變大！

能把人笑沒社 2026-06-12 16:03:33
1 跟貼 1
毛熊危機解密：中立策略大揭秘

媽媽的保鏢來了 2026-06-15 20:16:36
1 跟貼 1

非凡油條

解讀全球政治財經(jīng)動向

771文章數(shù) 89256關(guān)注度

往期回顧全部

態(tài)度原創(chuàng)

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

親子

房產(chǎn)

游戲

本地

公開課

白巖松談人口老齡化：社會要降低老年人門檻
為什么人類有不同的膚色？
七個無法存下錢的壞習(xí)慣
李彥宏：百度離破產(chǎn)30天

手機 / 數(shù)碼

房產(chǎn) / 家居

平民玩家，開始玩不起AI了

白宮一個電話，最強Claude上線三天就沒了

西班牙遭爆冷：0-0平佛得角 亞馬爾完成首秀

西班牙遭爆冷：0-0平佛得角 亞馬爾完成首秀

世界杯開賽4天，亞足聯(lián)依然保持不敗！

黃大煒猝逝過程太離奇，母親追查真相

活鼠、活蛆、農(nóng)殘超標 山姆回應(yīng)被約談

網(wǎng)易X智己 夏日尊享內(nèi)購會，熱力收官

態(tài)度原創(chuàng)

最低13100元/㎡！三亞新一輪安居房房源，開始登記！

這款13年前爆火的足球爽游，趁著世界杯出新作又能爽玩了？

當年輕人重新愛上黃金，非遺有了新的打開方式

西班牙遭爆冷：0-0平佛得角亞馬爾完成首秀

西班牙遭爆冷：0-0平佛得角亞馬爾完成首秀

活鼠、活蛆、農(nóng)殘超標山姆回應(yīng)被約談

網(wǎng)易X智己夏日尊享內(nèi)購會，熱力收官