作者 | 松壑
![]()
2008年2月,巴菲特在致伯克希爾·哈撒韋股東的年度信中寫下了一段后來被反復引用的話:
假如一位有遠見的資本家當年能把萊特兄弟在基蒂霍克的試飛飛機打下來,顯然是在為他的繼任者造了大福。
這當然是一句玩笑,巴菲特真正想說的是:
最糟糕的生意,是那種增長很快、需要大量資本來維持增長、最后卻幾乎賺不到錢的生意。
想想航空業吧,自萊特兄弟的年代起,持久的競爭優勢就從未出現過。
這段話寫在巴菲特人生中第一次投資航空股失敗將近二十年之后。從1989年到2020年,巴菲特曾斥資百億美元涉足北美航空股,但最終割肉巨虧離場。
民航業的出現,是人類交通方式的巨大革命,但作為一門生意,它的特征是:
巨大的資本開支、激烈的價格競爭、以及無論行業如何增長都難以回報股東的利潤結構。
從萊特兄弟首飛到巴菲特寫下那封信的整整一百多年,航空業消滅的資本比創造的利潤還要多。
改變世界的技術和賺錢的生意之間,可能隔著一道永遠無法逾越的鴻溝。
許多年以后,那架從基蒂霍克起飛的飛機,以另一種形式重新升空了。
一.免費午餐散場
2026年5月4日,五一假期的最后一天,豆包在蘋果App Store頁面掛出了付費版本的服務聲明。三檔訂閱價格浮出水面:標準版每月68元、加強版每月200元、專業版每月500元。話題當天沖上微博熱搜第一。
豆包官方稱免費服務將始終保留,付費版面向專業生產力場景,方案仍在測試階段。但用戶最焦慮的不是收不收費,而是免費版是否會被降配?
過去十幾年中國互聯網的商業化劇本已經演過太多遍了:先免費獲客,再降低免費體驗,最后引導付費升級。
但這一次,促使豆包祭出付費版的因素,并不止于其在簡中互聯網遙遙領先市占率基礎上的一次用戶收割,而是成本端也開始扛不住了。
2026年3月QuestMobile數據顯示,豆包月活用戶達到3.45億,穩居AI原生應用第一,比第二名千問和第三名DeepSeek的總和起來還多。一季度月人均使用次數54.8次,平均活躍率33.5%。
3.45億月活,每人每月用55次,背后的成本注定是一個天文數字。
這種情況下,已經有不止少數用戶反饋,豆包在晚間等高峰時段已出現用戶發起次數過多導致的算力排隊現象。
AI領域的持續投入與成本之下,字節跳動2025年凈利潤同比下滑超過70%,全年約1500億資本開支中,約900億砸向算力采購。
抖音副總裁李亮解釋了這與優先股和期權變動等會計因素有關,但AI投入確實對其利潤帶來了影響。
但后續的投入仍然是個天文數字,據FT報道字節2026年的資本支出預算約1600億人民幣,其中850億用于AI芯片采購。
豆包免費或許很好用,但背后是字節的成本在負重前行,商業公司都有盈利的追求。就算抖音已成為流量印鈔機,它也不可能無限期買芯片、投算力長期供數億人免費使用。
互聯網古早期的普遍免費邏輯,在AI時代正出現根本性變化,大廠們可能更早地進入收費期,來對沖日漸龐大且令人恐懼的電力和算力成本。
二 .地表最強也不夠賺
豆包的困境或許是"用戶太多、成本太高",那么看看大洋彼岸那家被全球開發者公認為"地表最強"的Anthropic的毛利率,也仍然有著顯著的天花板。
Claude在編程和Agent場景中擁有難以撼動的口碑,據Sacra估算的截至2026年3月數據,Anthropic年化收入已達到約300億美元,較一年前增長約14倍。超過500家企業客戶年消費超過100萬美元,財富10強中有8家是Claude的客戶。
收入增長堪稱人類商業史上的奇跡,然而利潤呢?
在走出了前期成本泥潭的2025年,Anthropic的毛利率改善后也僅有40%,但仍然低于此前50%的目標。公司預計到2028年毛利率才有望達到77%。
作為參考,傳統SaaS軟件公司的毛利率通常在75%到85%之間。Anthropic到2028年的目標,才剛剛摸到SaaS行業的底線。
這意味著,哪怕地表最強的大模型,在賣Token這件事上,也很難賺到SaaS級別的利潤。
原因也很簡單,每一次推理調用都需要實打實地消耗GPU算力和電力,這筆成本不會因為模型更聰明就自動消失。
Anthropic的CEO達里奧·阿莫迪曾對Fortune雜志說,如果AI進展延遲12個月,他就會破產,一家年收入300億美元的公司說出這種話,足以說明Token生意的現金流壓力始終懸于行業頭頂。
![]()
三 .成本的剛性
Token這門生意本身雖然代表了未來的方向,但在給股東帶來回報方面,前景并不樂觀。
從成本邊際變化來說,生意大致可以分成三類:
第一類是邊際成本趨零型。
它們是軟件SaaS、游戲皮膚、數字音樂。
這些業態一次開發完成,每多一個用戶的增量成本幾乎為零, WPS多賣一份訂閱,邊際開支微乎其微。這類生意的毛利率往往在75%-85%甚至更高,是資本市場最鐘愛的模型。
第二類是邊際成本穩步遞減型。
正如制造業所遵循的萊特定律:累計產量每翻一倍,單位成本下降約15%到20%。流水線、批量制造和現代化機床決定了制造業的規模越大時,成本越低。
第三類就是Token這門生意所處的位置——邊際成本遞減,但存在剛性底線。
必須承認,賣Token的成本并非完全恒定不變。隨著規模擴大,推理芯片的利用率會提高,波峰波谷也可以通過混合調度打平,KV Cache等技術可以減少重復計算,模型蒸餾和量化也在持續降低單Token的算力消耗。
火山引擎總裁譚待在2024年就介紹過,火山通過PD分離和KV Cache等技術手段,實現了可持續的降本。DeepSeek V4在2026年4月發布時,更是通過全新的混合注意力機制,將百萬上下文推理所需的計算量和顯存分別降至V3.2的27%和10%。
但關鍵問題是:無論技術如何優化,Token生成永遠需要實時計算。每一次推理請求都要GPU運算、消耗電力、占用芯片壽命。
不能把上一次推理的結果"復用"給下一個用戶,每一個回答都是一次全新的計算。這使得Token的成本曲線有一個永遠無法觸及零的剛性底線,正如航空業無論怎么優化燃油效率,每飛一趟航班都需要燒掉實打實的航油一樣。
更令人擔憂的是,短期內這條成本曲線甚至出現了上翹。
DRAM存儲器價格在2026年二季度預估跳升高達63%,NAND閃存價格飆升75%。摩根士丹利4月研報指出,存儲之后,EUV光刻機和CPU將成為新的瓶頸。華為昇騰服務器3月底啟動第二輪調價,910C單臺上漲16萬至48萬元不等。阿里云4月18日起AI算力產品全線漲價,最高漲幅34%。
Token 生意的邊際成本雖能隨技術優化和規模效應緩慢下行,卻存在無法擊穿的剛性底線,永遠無法像傳統 SaaS 那樣趨近于零,這也注定了它的盈利天花板遠低于標準化軟件生意。
四 .價格無限戰爭
再來說競爭格局。
2024年下半年到2025年初,中國大模型市場經歷了一場慘烈的價格戰。字節豆包報價低至0.0008元/千tokens,阿里通義千問主力模型降價97%,智譜將GLM-4-Plus降價90%。一元錢能買百萬token,這在兩年前不可想象。
到了Agent主導的2026年,風向突然轉變了。
智譜率先打響漲價第一槍。從2月12日發布GLM-5到4月的GLM-5.1落地,三次相對上一代GLM-4.7累計漲幅達到83%。智譜CEO張鵬在中關村論壇年會上直言:調整價格是為了回歸正常的商業價值,長期低價競爭不利于行業發展;瓶頸在算力,不在客戶。
然而漲價的代價立竿見影。
GLM-5在2月中旬曾在OpenRouter平臺位列全球第三,是中國調用量最高的模型。三次漲價后,到4月中旬已跌至第17位。
從時間線上看,智譜連續大幅漲價的區間,恰好與 GLM 系列在 OpenRouter 調用量排名明顯下滑重合。雖不能簡單將排名下跌完全歸咎于漲價,但同步走勢也側面說明一件事:
AI Token 行業用戶價格敏感度極高、產品差異化壁壘不足、缺乏強勢定價權,廠商很難脫離價格戰獨立提價而不丟失市場份額。
因為就在智譜漲價同時,幾度延期的DeepSeek突然扔出炸彈。
2026年4月24日,DeepSeek發布了V4預覽版并同步開源,V4-Pro總參數1.6萬億、激活參數49B,性能比肩頂級閉源模型;V4-Flash總參數2840億、激活參數僅13B,輸入定價低至0.14美元/百萬tokens。
DeepSeek團隊在技術報告中坦誠承認,V4-Pro"略落后于GPT-5.4和Gemini-3.1-Pro",但仍然以不到Claude Opus 4.6的1/8價格提供接近的性能,這對Token的"售價錨點"構成了持續的破壞。
Token生意的競爭順序正在和航空業呈現出驚人的相似,即飛機誰都能買,航線誰都能飛,除非建立起壟斷性的網絡效應,否則競爭對手總能以更低的票價把乘客搶走。
在一個開源模型不斷逼近閉源前沿的世界里,靠賣token建立持久的商業護城河,難度可想而知。
一年前比誰降得狠,一年后比誰漲得快。這種180度的急轉彎本身就說明了一件事,這個行業的定價權極不穩定。
定價權不穩定的行業,很難成為好生意。
![]()
五 .搬運工抵達戰場
有關脆弱定價權的一個有趣旁證是,當大模型公司還在為Token成本焦頭爛額時,一批聰明人已經找到了更輕巧的玩法。
那就是Token中轉站。
獵豹移動董事長兼CEO傅盛推出了AI API聚合平臺EasyRouter.io,通過統一接口幫用戶調用GPT、Claude、Gemini、DeepSeek等40余個主流大模型;幾乎同一時間,波場創始人孫宇晨也上線了類似產品b.ai。
最魔幻的一幕發生在5月5日。
特朗普家族的項目World Liberty Financial(WLFI)生態下的首個AI項目WorldClaw宣布上線,首發產品WorldRouter聚合了Claude、GPT、Gemini等300余個主流AI模型,聲稱調用成本比官方定價低30%,用WLFI旗下穩定幣USD1結算,鎖倉WLFI代幣可兌換AI算力額度。
套餐則分四檔,最貴的Max Plan售價9999美元,還宣稱買Claude API額度,送海湖莊園私人晚宴抽獎資格,有機會與特朗普長子小唐納德共進晚餐。
中轉站之所以能讓人蜂擁而入,在于它的商業模式極其簡單:聚合多家大模型的API接口,統一封裝后轉售給終端用戶,賺取價格差和服務費。它不需要訓練模型、買GPU或建數據中心,它不生產Token,只做Token的搬運工。
但是,當一門生意的終端定價低到連"二道販子"都能從中分到一杯羹時,說明生產者自己大概率是在貼著成本、甚至虧著本在賣。
更耐人尋味的是這門生意的競爭門檻。EasyRouter上線不到一周,就被開源社區開發者公開質疑其產品直接使用了NewAPI的開源代碼卻去除了版權信息。
這個插曲,本身說明了Token中轉站的技術壁壘接近于零,一套開源網關代碼、一臺服務器、幾個API Key,啟動資金兩千到五千元人民幣,就能開張營業。
價格差、跨境壁壘、多模型適配的工程成本,這些縫隙疊加在一起,就給了中間商生存的空間,但當一個行業的中間商門檻低到這種程度,上游生產者的利潤空間可想而知。
這門生意的出現,也恰恰映射了Token定價機制和競爭格局的深層矛盾。
因為與Token定價內耗并存的,還有另一個殘酷真相:
大模型的行業競爭中,很難出現一家巨頭可以在全部維度上長期確定的保持絕對領先地位。
Claude在編程和Agent場景中口碑最強,全球開發者社區幾乎將其視為代碼生成的基座生產力。
但在圖像生成領域,OpenAI在4月21日發布的GPT Image 2一舉登頂LM Arena所有圖像排行榜第一,以242分的領先優勢創下該榜單有史以來最大差距,而數個月前,該領域的王者還是谷歌的Nano banana 2。
往前倒推兩個月,字節的Seedance 2.0于春節前橫空出世,以多模態音視頻聯合生成能力驚艷全網;而在數學推理和科學領域,Gemini 3.1 Pro和DeepSeek V4又各有所長。
每個垂直能力維度上,領先者都在輪換。今天的王者可能三個月后就被追平,半年后就被超越。
這種"旋轉門"式的競爭格局,對用戶和投資者意味著同一件事,沒有人能通過訂閱單一模型來一勞永逸。
這也是為什么越來越多的深度AI用戶選擇同時訂閱多個模型:編程用Claude,作圖用ChatGPT,視頻用即夢,日常對話用豆包或DeepSeek,各取所長、按需切換。
Token中轉站的繁榮,正是這種多模型并行需求的產物:用戶需要一個統一入口來調用不同廠商的API,而不是被鎖定在任何一家。
對模型廠商來說,這意味著用戶忠誠度極低、遷移成本幾乎為零。Claude編程再強,用戶也不會因此在視頻生成上容忍你的劣勢,他會直接切到Seedance。GPT作圖再好,用戶也不會因此放棄Claude的Agent能力。
每一家都在某個維度上階段性領先,但沒有一家能形成全面壟斷,也就沒有一家能建立起真正的定價權。
這和航空業又何其相似,每家航空公司都有自己的強勢航線,但乘客從來不會因為一家公司京滬線飛得好就容忍京廣線的高票價,屆時他們會毫不猶豫地切換到另一家。
![]()
六.給顯卡打工,比燃料吃力
如果把視野拉遠一些,Token這門生意面臨的還不只是成本、競爭格局和定價問題。
看整條價值鏈上的利潤分配就知道了。
2026年,全球科技巨頭以前所未有的速度把利潤表上的數字搬到資產負債表上。字節全年資本開支約1600億人民幣。谷歌 2026 年資本開支預計 1800 億至 1900 億美元,Meta 預計 1250 億至 1450 億美元。
然而這些錢最終都會流向英偉達與臺積電。
英偉達2026財年營收2159億美元,同比增長65%,GAAP毛利率高達71.1%。臺積電一季度凈利潤同比增長58.3%。ASML將2026年全年銷售預期上調至360億至400億歐元。
大模型公司燒錢買顯卡、付電費、打Token價格戰,英偉達和臺積電賺走了超額利潤。這和航空業一百年來的格局如出一轍,航空公司燒錢買飛機、付航油費、打票價戰,最后波音和空客賺走了利潤。
價值鏈上最肥的那一段,往往不屬于直接面對用戶的那一環。
更深層的問題在于"重資產悖論"。
即用戶越多,需要的資本開支就越大;
資本開支越大,折舊和運營成本就越高;
激烈的競爭又限制了定價空間。
利潤被兩頭擠壓,模型越流行,資產負債表可能就越沉重。
市場喜歡將Token比作AI時代的燃料,這種敘事傳播度雖然很廣,但可能也低估了Token生意的困難程度。
燃料是資源品。石油、天然氣、金屬礦產,它們有一個共同的特征:
供給側存在天然約束。
地殼里的原油儲量是有限的,OPEC可以聯手限產抬價,一口油井的開采成本構成了價格的硬底。
正因為供給有約束,資源品的生產商可以在需求旺盛時享有定價權,沙特阿美和必和必拓的利潤率長期維持在令人羨慕的水平。
Token恐怕并不具備這種屬性。
服務器、機房、電力、顯卡,這些生產Token的物理母體在理論上是長期且無限的,只要愿意投錢買更多的GPU、建更多的數據中心、拉更多的電力專線,就可以無限放大Token的產出,很難有自然資源或自然規則約束這個過程,需要消耗的無非是資本和電力,這兩樣東西都是可以在市場上買到。
近年來,置身AI浪潮中的海內外科技大廠加大算力開支蜂擁而上,更像是短期以“不能把產能讓給友商”為核心目標的一種擔心掉隊的恐懼所驅動。
但長期結構上,Token的供給側永遠無法形成類似OPEC那樣的卡特爾狀態。
在石油行業,即便需求暴漲,供給擴張也受限于勘探周期和地質條件。在Token行業,需求暴漲的信號一旦出現,全球的科技巨頭會在幾個季度內集體把資本開支翻倍,新的算力潮水般涌入市場。
短期內可能出現算力荒,比如2026年春季OpenClaw引爆的Agent熱潮,但中期來看,只要利潤率足夠高,就會有更多資本涌入建設產能,然后再次把價格打下來。
這是一個典型的"高利潤吸引資本、資本消滅利潤"的循環。
石油和銅是自然地理環境所塑造的稀缺性,這顯然是Token所不具備的。
也有人將Token比作傳統電力,就像每一度電都需要燒煤或轉動渦輪來即時生產,且電力本身極難儲存和差異化。
但它實際的競爭格局恐怕還不如電力,因為后者起碼有輸配網絡構成的區域性壟斷,而Token連這一層保護都沒有,正如算力服務器在廊坊,用戶請求可以從東南亞發過來,中間沒有物理壁壘。
![]()
七.升維敘事的隱秘代價
行業里不乏樂觀者。
火山引擎總裁譚待在2025年末的FORCE原動力大會上提出了一個有趣的觀點:目前基于Token的商業模式還很原始。
他認為,隨著Agent的進步和普及,Token最終會走出"原材料"的定位,例如Agent可以將模型串聯,云平臺把Token組裝成Agent,從更高抽象層次創造價值。"今天討論Token,是在IT預算環節考慮;抽象成Agent后,可從BPO(業務外包)角度看待,那就是在擴大整個市場的規模了。"
譚待2026年4月進一步表示,AI行業以未來所有Token所能創造的收入規模作為終局來看,當前大概相當于一場42公里馬拉松中"跑了一公里左右。
智譜CEO張鵬提出的則是Token Architecture Capability(TAC),即智能調用量乘以智能質量乘以經濟轉化效率。他在財報會上毫不諱言地將智譜定位為"中國的Anthropic",并認為高復雜度、高可靠性的高階Token將擁有持續的定價權。
這些觀點都有道理。但它們本質上在說同一件事:
賣原始的Token不賺錢,必須往上走,賣更高級的智能服務才可能賺錢。
問題是,這個升維敘事里藏著一個容易被忽略的隱秘代價。
無論服務抽象到多高的層次,Agent也好、BPO也好、數字員工也好,只要需要調用大模型來完成任務,底層就必然在消耗Token。
這個生意會向客戶收取一個遠高于Token成本的服務費,就像律所按小時收費而不是按打字數收費一樣,可以賺取“智能溢價”。
但這里有兩個問題。
一是模型側的成本仍然是剛性的。
服務做得越多,底層消耗的Token就越多,成本隨之線性增長。一個Agent執行一次復雜任務,Token消耗量可以達到普通對話的15倍以上。如果定價不能在覆蓋成本基礎上保留合理利潤,生意很難長久維持。
二是溢價受制于競爭。
只要服務本身不具備獨占性的數據壁壘或網絡效應,競爭對手就可以用同樣的底層模型、搭建類似的Agent工作流,以更低的價格搶走客戶。從Token到Agent的升維,本質上是從一個紅海游到另一個紅海。
真正能在升維中賺到錢的,是那些在Token消耗之上疊加了不可替代價值的人。
他們或許擁有獨占性的行業數據、或許有根深蒂固的客戶關系、或許是競爭對手難以復制的工作流集成深度。但這種護城河不是Token本身賦予的,而是要在Token之外獨立構建的。
![]()
八.高價值≠好生意
回到文章開頭巴菲特在致股東信中開的那個地獄笑話。
航空業改變了人類的出行方式,但一百多年來,它成為一批又一批投資者的陷阱。
AI絕對會極大程度改變人類的工作和生活方式,但賣Token這門生意,未來的命題之一,或許是如何避免重蹈航空股的覆轍。
許多時候,高價值從來不等于好生意,更不等同于股東回報。
好生意需要滿足幾個條件:邊際成本可控且能持續下降至低位,供給端存在約束或壁壘,競爭格局相對集中,擁有定價權,能夠持續向股東返還超額回報。
這些條件,Token經濟一個也不完全滿足。
它的邊際成本雖然在下降,但存在永遠無法觸零的剛性底線;供給端沒有任何自然約束,資本可以無限堆疊算力來擴張產出;競爭格局極度紅海,開源勢力持續攪局;定價權在漲價和降價之間劇烈搖擺;利潤大頭流向了上游芯片供應商。即便升維到智能服務層,底層的Token成本仍然如影隨形。
在那封2007年的致股東信里,巴菲特還留了另一句話并不太出名的話:
航空業的資本消耗自萊特兄弟首飛就是無底洞。
投資者總被增長吸引,雖然他們本應被增長嚇退。
把這句話中的"航空業"替換成"大模型",把"萊特兄弟首飛"替換成"ChatGPT3.5出圈",恐怕依然有可能成立。
Token是高價值的,它正在重塑編程、醫療、教育、金融等一切知識密集型行業。
但很多高價值的東西未必是好生意,就像電力的出現塑造了整個人類工業文明,但全球電力公司的平均凈利潤率也不過是個位數。
未來真正能賺到錢的,或許不是賣Token本身,而是那些在Token之上建立起獨占性壁壘的人,那些擁有不可替代的行業數據的人,那些把AI深度嵌入業務流程、使客戶遷移成本高到無法離開的人,那些站在Token之上、而不是站在Token之中的人。
但在這些業態涌現之前,純粹的生產Token很難成為一個好生意。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.