每經(jīng)記者:趙雯琪 每經(jīng)編輯:余婷婷
當(dāng)大模型競(jìng)賽從“參數(shù)軍備”轉(zhuǎn)向“應(yīng)用落地”,一個(gè)隱秘而高增長(zhǎng)的底層生意正在浮出水面——“Token工廠”(把人工智能能力拆解成最基礎(chǔ)的計(jì)量單位“Token詞元”,像自來(lái)水廠一樣按需供應(yīng))。
6月16日,國(guó)內(nèi)AI(人工智能)推理服務(wù)企業(yè)“硅基流動(dòng)”官宣完成超20億元B輪融資,創(chuàng)下2026年以來(lái)國(guó)內(nèi)第三方MaaS(模型即服務(wù))賽道最大單筆融資紀(jì)錄。《每日經(jīng)濟(jì)新聞》記者了解到,這家成立不足三年的企業(yè),過(guò)去一年日均Token吞吐量達(dá)數(shù)萬(wàn)億量級(jí),營(yíng)收同比漲超十倍,還曾在11個(gè)月內(nèi)連獲三輪融資,成為一級(jí)市場(chǎng)炙手可熱的標(biāo)的。
無(wú)獨(dú)有偶,5月,同賽道企業(yè)無(wú)問(wèn)芯穹、魔形智能紛紛宣布融資。其中,無(wú)問(wèn)芯穹再獲超7億元融資,累計(jì)融資額超22億元。截至4月底,無(wú)問(wèn)芯穹Agentic MaaS大模型服務(wù)平臺(tái)的日均Token調(diào)用量相較于去年底已增長(zhǎng)超20倍。
資本狂熱加碼的另一面,頭部互聯(lián)網(wǎng)大廠全面落地自研推理算力與MaaS服務(wù)、全行業(yè)API(應(yīng)用程序編程接口)定價(jià)陷入白熱化競(jìng)爭(zhēng)、端側(cè)輕量化模型持續(xù)分流云端Token調(diào)用需求。多重?cái)D壓之下,“Token工廠”普遍陷入業(yè)務(wù)規(guī)模高速擴(kuò)張、盈利空間不斷收窄的矛盾局面,如何走出增收不增利的困局成為賽道核心議題。
產(chǎn)業(yè)資本扎堆入局 “Token工廠”成AI落地核心賽道
一筆20億元級(jí)融資,將“Token工廠”賽道再次推至聚光燈下。
據(jù)硅基流動(dòng)官方披露,本輪融資由攜程戰(zhàn)投、晶科能源控股、金蝶股份、聯(lián)通新沃、盛奕資本(潤(rùn)澤集團(tuán)產(chǎn)業(yè)資本)、壁仞戰(zhàn)投、蔚來(lái)資本、商湯戰(zhàn)投、巨人網(wǎng)絡(luò)等二十余家機(jī)構(gòu)聯(lián)合投資。至此,硅基流動(dòng)已獲得能源、芯片、算力基礎(chǔ)設(shè)施、云服務(wù)、大模型及場(chǎng)景應(yīng)用等AI全產(chǎn)業(yè)鏈企業(yè)投資,產(chǎn)業(yè)資本在本輪融資中占比顯著提升。
![]()
圖片來(lái)源:硅基流動(dòng)公眾號(hào)
這并非賽道首筆大額融資。今年5月,同賽道玩家無(wú)問(wèn)芯穹剛完成超7億元融資;海外市場(chǎng)中,F(xiàn)ireworks AI成立四年目標(biāo)估值達(dá)150億美元,日處理Token規(guī)模15萬(wàn)億。短短一年時(shí)間,“Token工廠”已從AI產(chǎn)業(yè)鏈邊緣環(huán)節(jié),躍升為一級(jí)市場(chǎng)的核心賽道。
資本熱捧的底層邏輯,是AI需求結(jié)構(gòu)的根本性切換。
大模型能力每邁上一個(gè)臺(tái)階,就解鎖一大類應(yīng)用,應(yīng)用反過(guò)來(lái)又提升了底層Token消耗量。據(jù)國(guó)家數(shù)據(jù)局相關(guān)數(shù)據(jù),2024年初中國(guó)日均Token調(diào)用量為1000億;至2025年底躍升至100萬(wàn)億;今年3月已突破140萬(wàn)億,兩年增長(zhǎng)超千倍。
全球知名咨詢機(jī)構(gòu)IDC最新發(fā)布的《中國(guó)AI軟件市場(chǎng)半年度追蹤,2025H2》數(shù)據(jù)顯示:2024年中國(guó)企業(yè)級(jí)MaaS市場(chǎng)調(diào)用量?jī)H114萬(wàn)億Token,2025年躍升至1944萬(wàn)億Token,同比增長(zhǎng)約16倍;2025年公有云MaaS市場(chǎng)規(guī)模達(dá)30.7億元,增速遠(yuǎn)超AI行業(yè)整體水平。Agent智能體普及、多模態(tài)應(yīng)用落地、行業(yè)數(shù)字化轉(zhuǎn)型三大趨勢(shì),仍在持續(xù)推高Token消耗規(guī)模。
![]()
圖片來(lái)源:IDC官方公眾號(hào)
IDC預(yù)測(cè),2026年中國(guó)MaaS市場(chǎng)的Token消耗量將達(dá)到40000萬(wàn)億,較2025年再增約20倍。
從商業(yè)模式本質(zhì)來(lái)看,Token工廠并非簡(jiǎn)單的算力轉(zhuǎn)售,核心是將芯片適配、模型部署、推理引擎調(diào)優(yōu)、異構(gòu)算力調(diào)度等復(fù)雜工程能力,封裝為標(biāo)準(zhǔn)化API接口。客戶按需調(diào)用、按量付費(fèi),省去了企業(yè)自建集群、組建運(yùn)維團(tuán)隊(duì)的重投入,大幅降低了AI落地的技術(shù)門(mén)檻與成本周期。
面對(duì)海量的市場(chǎng)需求爆發(fā),大規(guī)模、高性價(jià)比Token的穩(wěn)定供應(yīng),正成為影響AI技術(shù)規(guī)模化落地的關(guān)鍵能力。
天使投資人、資深人工智能專家郭濤接受《每日經(jīng)濟(jì)新聞》記者采訪時(shí)表示,從“賣模型”到“賣Token”是AI產(chǎn)業(yè)商業(yè)化的重要演進(jìn)。Token作為大模型處理信息的最小單元,具備可計(jì)量、可定價(jià)、可交易的特性,將AI智能能力轉(zhuǎn)化為可標(biāo)準(zhǔn)化交易的大宗商品,解決了AI能力難以量化的行業(yè)痛點(diǎn),推動(dòng)行業(yè)從定制化服務(wù)模式轉(zhuǎn)向標(biāo)準(zhǔn)化、規(guī)模化變現(xiàn)模式,長(zhǎng)期來(lái)看這門(mén)生意具備較好的可持續(xù)性。
中金公司研報(bào)顯示,“Token工廠”模式已成為全球大模型廠商的主流商業(yè)化路徑,海外頭部企業(yè)Anthropic年度經(jīng)常性收入突破300億美元。盈利層面,當(dāng)前海外頭部大模型API業(yè)務(wù)毛利率普遍在40%至50%,國(guó)內(nèi)大模型廠商MaaS API業(yè)務(wù)毛利略低于海外,預(yù)計(jì)今年將達(dá)到20%至40%,隨著規(guī)模效應(yīng)釋放與技術(shù)優(yōu)化,長(zhǎng)期仍有上行空間。
大廠下場(chǎng)、API價(jià)格戰(zhàn)白熱化、端側(cè)AI快速普及??“Token工廠”盈利承壓
不過(guò),頭部企業(yè)營(yíng)收十倍增長(zhǎng)的亮眼數(shù)據(jù)背后,賽道隱憂始終存在。隨著互聯(lián)網(wǎng)大廠下場(chǎng)布局、API價(jià)格戰(zhàn)白熱化,“Token工廠”的商業(yè)模式邊界與增長(zhǎng)天花板正被重新審視。
大廠親自下場(chǎng)是最直接的行業(yè)變量。
![]()
圖片來(lái)源:每經(jīng)記者 張涵 攝
6月8日,阿里巴巴宣布組織架構(gòu)調(diào)整,將通義大模型事業(yè)部與未來(lái)生活實(shí)驗(yàn)室整合,成立全新Token Foundry事業(yè)部,由集團(tuán)CEO(首席執(zhí)行官)吳泳銘直接負(fù)責(zé)。此前3月,阿里成立ATH(Alibaba Token Hub)事業(yè)群,已經(jīng)喊出了“創(chuàng)造Token、輸送Token、應(yīng)用Token”的核心目標(biāo)。
將Token生產(chǎn)提升至集團(tuán)戰(zhàn)略級(jí),背后是大廠對(duì)推理服務(wù)入口價(jià)值的重估:Token產(chǎn)能既是支撐自身電商、云服務(wù)、本地生活等業(yè)務(wù)AI化的基礎(chǔ),也是阿里云對(duì)外輸出MaaS服務(wù)的核心產(chǎn)能。
郭濤認(rèn)為,大廠全面入場(chǎng)后,獨(dú)立第三方“Token工廠”仍有生存空間。他向記者表示,大廠雖有技術(shù)、資源和生態(tài)優(yōu)勢(shì),但市場(chǎng)需求多樣且復(fù)雜,難以覆蓋所有領(lǐng)域和場(chǎng)景。獨(dú)立第三方可聚焦特定垂直領(lǐng)域提供個(gè)性化、定制化服務(wù),或深耕特定技術(shù)優(yōu)化,針對(duì)某類模型或場(chǎng)景提升Token生成效率與質(zhì)量。此外,部分企業(yè)出于數(shù)據(jù)安全、避免過(guò)度依賴單一廠商的考量,也會(huì)選擇與獨(dú)立第三方合作。
API價(jià)格戰(zhàn)持續(xù)白熱化,則是當(dāng)前“Token工廠們”面臨的最直接盈利壓力。
自2023年以來(lái),頭部大模型廠商已累計(jì)十余次下調(diào)API價(jià)格,部分主流模型千Token價(jià)格從最初的數(shù)毛錢(qián)降至幾分錢(qián),累計(jì)降幅超90%。缺乏核心優(yōu)化能力、僅靠算力差價(jià)盈利的中間商型玩家已率先陷入虧損。
今年5月,DeepSeek官方宣布V4-Pro模型API永久降價(jià),整體降幅75%,百萬(wàn)Token輸出價(jià)格為6元。隨后,小米、騰訊云紛紛跟進(jìn),小米旗下MiMo-V2.5系列API永久降價(jià),最高降幅達(dá)99%,Pro版定價(jià)與DeepSeek V4-Pro完全對(duì)齊。騰訊云自6月3日0時(shí)起,對(duì)DeepSeek-V4系列模型調(diào)用價(jià)格進(jìn)行大幅下調(diào),最高降幅達(dá)到97.5%,調(diào)整后價(jià)格全面持平DeepSeek官方售價(jià)。
![]()
圖片來(lái)源:IDC官方公眾號(hào)
業(yè)內(nèi)普遍認(rèn)為,若“Token工廠”效率提升的速度跟不上價(jià)格下降速度,商業(yè)模式的可持續(xù)性將直接面臨挑戰(zhàn)。
此外,端側(cè)AI的快速普及,則從需求端分流市場(chǎng)。隨著手機(jī)、PC(個(gè)人電腦)等終端設(shè)備的端側(cè)大模型能力升級(jí),大量輕量級(jí)推理任務(wù)向端側(cè)遷移,無(wú)需調(diào)用云端Token。行業(yè)普遍預(yù)測(cè),未來(lái)30%至50%的推理需求將在端側(cè)完成,盡管高復(fù)雜度、多模態(tài)、長(zhǎng)上下文的核心推理需求仍依賴云端,但端側(cè)分流無(wú)疑收窄了云端“Token工廠”的整體增長(zhǎng)天花板。
與此同時(shí),頭部客戶自建推理集群的趨勢(shì)也在蠶食第三方市場(chǎng)份額。金融、能源、政務(wù)等數(shù)據(jù)敏感型行業(yè)出于合規(guī)考量,更傾向私有化部署;頭部互聯(lián)網(wǎng)企業(yè)隨著業(yè)務(wù)規(guī)模擴(kuò)大,自建算力集群的單位成本已低于第三方采購(gòu),紛紛轉(zhuǎn)向自建。第三方“Token工廠”的核心客群,可能逐步向中小企業(yè)、長(zhǎng)尾應(yīng)用與彈性需求場(chǎng)景集中,市場(chǎng)定位面臨重構(gòu)。
對(duì)于“Token工廠”賽道的泡沫爭(zhēng)議,郭濤向記者表示,目前市場(chǎng)確實(shí)存在一定泡沫跡象。大量資本涌入下,部分企業(yè)為追求規(guī)模盲目擴(kuò)張,忽視實(shí)際成本與盈利情況。但整體而言,AI發(fā)展是大勢(shì)所趨,Token經(jīng)濟(jì)作為其商業(yè)化關(guān)鍵模式有著真實(shí)需求支撐,只是市場(chǎng)需要經(jīng)歷調(diào)整與整合。
談及破局路徑與行業(yè)終局,郭濤認(rèn)為,“Token工廠”可通過(guò)提升算力利用效率、優(yōu)化能耗降低運(yùn)營(yíng)成本,通過(guò)分級(jí)服務(wù)實(shí)現(xiàn)差異化定價(jià)獲取溢價(jià),還可配套模型優(yōu)化建議、技術(shù)支持等增值服務(wù)拓展收入來(lái)源。
“長(zhǎng)期來(lái)看,市場(chǎng)更可能形成多層次、差異化的競(jìng)爭(zhēng)格局:頭部大廠憑借實(shí)力占據(jù)通用型大規(guī)模市場(chǎng),中小‘Token工廠’憑借特色服務(wù)深耕細(xì)分領(lǐng)域,形成錯(cuò)位競(jìng)爭(zhēng),共同構(gòu)成多元的市場(chǎng)生態(tài)。”郭濤表示。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.