當全球算力結構徹底反轉、推理占比飆升至70%,"誰更低成本跑模型"正在成為比"誰模型更強"更性感的生意。Fireworks AI兩年估值暴漲27倍至150億美元,日處理15萬億Token——接近中國全社會AI調用量的15%。它不訓練模型,只做"賣水人":幫企業跑開源模型,按Token收費。
———— / BEGIN / ————
AI行業,又出現一家千億公司。
5月27日,據彭博社報道,美國AI推理平臺Fireworks AI正在洽談新一輪融資,目標估值150億美元(約1024億元人民幣)。
而7個月前,它的估值還是40億美元。如果再往前看:2024年7月,它B輪估值僅5.52億美元。也就是說,不到兩年,Fireworks AI估值暴漲約27倍。
![]()
Fireworks AI估值變化
更猛的是收入。研究機構Sacra數據顯示:2026年2月,Fireworks AI年化收入已經達到3.15億美元(約22億元人民幣),同比增長416%,較2024年B輪時增長約3-4倍。
![]()
與此同時,它的平臺每天處理約15萬億Token。
這個數字是什么概念?國家數據局此前披露:2025年12月,中國日均Token消耗量約100萬億。
也就是說,Fireworks AI一家公司的日Token處理量,已經接近中國全社會AI調用量的15%。而它成立才不到4年。
01 一幫華人,在AI行業賣Token
Fireworks AI成立于2022年,總部位于美國加州Redwood City。
公司共有7位聯合創始人,其中3位是華人。CEO喬琳(Lin Qiao):復旦本科、碩士,UCSB博士,前Meta工程高級總監。
![]()
Fireworks AI的核心團隊
她曾主導PyTorch在數據中心、移動設備和AR/VR設備上的開發部署。
另外兩位華人聯合創始人:Benny Chen曾在Meta做到首席軟件工程師;Chenyu Zhao則長期負責Google Cloud Vertex AI相關業務。
這家公司不訓練大模型,也不直接做AI應用。它做的事情很簡單:幫企業運行各種開源模型,然后按Token收費。
目前,其支持的模型包括DeepSeek、Kimi、MiniMax等多家開源或開放API模型。
開發者無需自己購買GPU、搭建推理集群或進行底層優化,即可通過兼容OpenAI格式的API直接調用。
![]()
Fireworks AI產品界面
而Fireworks AI則按調用量收費。AI應用跑得越猛,它賺得越多。目前,全球最火的AI編程工具之一Cursor,就是其客戶。
據官方披露:Cursor在Fireworks AI平臺上,已經實現1000 token/秒的生成速度。
02 錢從“訓練”流向“調用”
過去兩年,AI行業最燒錢的地方,是訓練。
OpenAI、Google、Anthropic、xAI都在瘋狂囤GPU,單輪大模型訓練成本動輒數億美元。
但現在,一個變化開始越來越明顯:模型訓練越來越像“一次性投入”,而推理調用開始變成“長期收費”。
算力結構已經徹底反轉:2023年,全球AI算力中訓練占2/3、推理僅1/3;到2026年,推理占比飆升至65%–70%,是訓練算力的4.5倍。
在中國,這一趨勢更極端 ——推理算力已是訓練算力的8倍。英偉達黃仁勛甚至判斷:未來推理規模將達到訓練負載的十億倍。
市場規模同樣爆發:Lightspeed此前披露:過去3年,AI推理市場已經從0增長到超過50億美元。
資本也開始瘋狂涌入這一賽道。
除了Fireworks AI,Baseten最近被曝出正以110億美元估值融資,Together AI估值達到75億美元,Modal估值46.5億美元,Fal估值45億美元。
其中,Baseten在2026年1月剛完成一輪融資估值50億美元,5個月后新一輪融資估值直接翻倍至110億美元。
更夸張的是收入增速。
據The Information報道:Baseten年化收入已經從2026年初的2億美元,增長到Q1末的6億美元。3個月,增長200%。
這些公司有一個共同特點:它們都不直接做大模型,而是幫整個AI行業“跑模型”——做AI時代的“賣水人”,靠永續的Token調用收費,賺取長期、穩定的現金流。
03 NVIDIA等巨頭進場投資
Fireworks AI背后的投資方越來越豪華。其股東包括Lightspeed、Index Ventures、紅杉資本,以及NVIDIA和AMD。
原因很現實:AI應用爆發后,整個行業真正稀缺的東西開始變成GPU,而推理平臺本質上是在幫助整個行業更高效率地使用GPU。
NVIDIA此前曾公開表示:基于Blackwell架構的新一代推理系統,已經將單Token成本降低約10倍。在部分大模型場景下,成本甚至可降至原來的1/35。
這意味著,DeepSeek、Llama 3、Kimi等開源模型,在推理成本上已接近甚至挑戰GPT-4等閉源API,性價比拐點正式到來。
而誰能把Token成本壓得更低,誰就更容易拿下AI應用公司。
目前,Fireworks AI估值對應約3.15億美元ARR,市銷率約47倍。放在2023年AI泡沫期,這個數字不算離譜。
橫向對比同行:Together AI估值75億美元、對應ARR約1.5億美元,市銷率約50倍;Baseten估值110億美元、對應ARR約6億美元,市銷率約18倍。
![]()
放在2023年AI泡沫期,頭部AI公司市銷率普遍在80–150倍,這個數字不算離譜;在2026年,這種估值仍能成立,核心原因是AI調用量仍在爆炸式增長。
Fireworks AI的平臺日Token處理量,已從2025年底的10萬億增長到2026年5月的15萬億,5個月增長50%。按此增速,2026年底有望突破25萬億 / 日,全年處理量將超7000萬億Token——相當于為全球AI應用提供了近1/5的推理算力支撐。
04 中國,何時出現千億公司?
Fireworks AI最值得關注的,其實不只是150億美元估值,而是“按Token收費”這件事已經真正形成商業規模。
過去很多人認為推理平臺只是技術服務,但現在3.15億美元年化收入、416%增速、15萬億日Token處理量,這些數字已經說明:AI調用本身,正在變成一門真正的大生意。
這也是為什么國內越來越多公司開始進入推理層,包括硅基流動、無問芯穹,以及越來越多AI Infra創業公司。僅2025–2026年,國內新增推理賽道創業項目就超過200家。
過去幾年,AI行業拼的是誰能訓練更大的模型。而現在,越來越多人開始盯上另一件事:誰能替整個AI行業,更低成本地“跑模型”。
本文信源:Bloomberg、Sacra、AIWire、The Information、Fireworks AI官網等。融資尚未最終完成,估值可能變化。
本文來自公眾號:鉛筆道 作者:惜文 編輯:王方
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.