01 Token 產(chǎn)業(yè)鏈全景圖
![]()
02 什么是“Token”
Token,中文名“詞元”,可以理解為 AI 識(shí)別文字的最小碎片,我們普通人以單個(gè)漢字、完整詞語來閱讀理解內(nèi)容,而AI 會(huì)把語句拆解成零散的片段,一個(gè)字、半個(gè)字、一個(gè)詞語、一串字母,甚至標(biāo)點(diǎn)、空格,都能單獨(dú)成為一個(gè) Token。
![]()
AI 本質(zhì)是數(shù)學(xué)模型,無法直接看懂人類文字,需要先將所有文字拆分成一個(gè)個(gè) Token,再給每個(gè) Token 編制專屬數(shù)字編號(hào),把文字轉(zhuǎn)化為數(shù)字形式,AI 才能進(jìn)行運(yùn)算、理解語義并生成回答。
中文約 1.5 個(gè)漢字對(duì)應(yīng) 1 個(gè) Token,英文和標(biāo)點(diǎn)也會(huì)單獨(dú)折算。同時(shí) Token 也是 AI 付費(fèi)的計(jì)費(fèi)標(biāo)準(zhǔn),還決定了模型的上下文記憶上限,超出額度后,AI 就會(huì)遺忘之前的對(duì)話內(nèi)容。
![]()
03 上游產(chǎn)業(yè)鏈--基礎(chǔ)硬件
AI大模型的需求爆發(fā),讓 Token 消耗進(jìn)入指數(shù)級(jí)增長(zhǎng)通道。
從數(shù)據(jù)看,OpenRouter 平臺(tái)的 Token 消耗量,從 2024 年初每周 120-150 億的規(guī)模,增長(zhǎng)至 2026 年 4 月的 20 萬億級(jí)別。
火山引擎豆包大模型的日均 Token 調(diào)用量,2026 年 3 月已突破 120 萬億,過去三個(gè)月實(shí)現(xiàn)翻倍,對(duì)比 2024 年 5 月首次推出時(shí),漲幅達(dá) 1000 倍。
![]()
阿里發(fā)布的編程大模型 Qwen3.6-Plus,上線后單日 Token 調(diào)用量突破 1.4 萬億,刷新了全球單模型單日調(diào)用紀(jì)錄。
![]()
Token 消耗的爆發(fā)式增長(zhǎng),直接拉動(dòng)了 AI 基礎(chǔ)設(shè)施的需求,上游元器件迎來全面漲價(jià)潮。AI 算力芯片供不應(yīng)求,內(nèi)存、硬盤、CPU 等配套硬件環(huán)節(jié),自 2025 年下半年以來均出現(xiàn)供給缺口,開啟漲價(jià)周期。
根據(jù) TrendForce 統(tǒng)計(jì),2026 年第一季度,DRAM 內(nèi)存價(jià)格預(yù)計(jì)環(huán)比上漲 105%-110%,NAND 閃存及企業(yè)級(jí) SSD 價(jià)格漲幅為 53%-58%;服務(wù)器 CPU 方面,Intel 及 AMD 廠商均宣布漲價(jià) 10%-15%。
![]()
03-1、核心部件--內(nèi)存芯片
DRAM
大模型 Token 消耗的指數(shù)級(jí)爆發(fā),催生了對(duì)高帶寬、低延遲、大容量 AI 存儲(chǔ)的剛性且爆發(fā)式需求。DRAM 是 CPU/GPU 運(yùn)行的高速臨時(shí)存儲(chǔ),斷電清空,直連核心芯片,為算力提供高速緩沖,內(nèi)部架構(gòu)分三大模塊,可類比高效數(shù)據(jù)車間。
據(jù) TrendForce,2024 年全球 DRAM 市場(chǎng)規(guī)模 958.63 億美元,同比增 84.83%,存儲(chǔ)賽道強(qiáng)勢(shì)復(fù)蘇。
![]()
全球存儲(chǔ)巨頭全力沖刺 DRAM 技術(shù)升級(jí):三星率先量產(chǎn)第六代 10nm 級(jí) DRAM,送出 HBM4 樣品并敲定 2026 年量產(chǎn),領(lǐng)跑行業(yè);美光推出首款 1γ 工藝內(nèi)存樣品,筑牢旗艦機(jī)型 AI 性能硬件基礎(chǔ)。
國(guó)產(chǎn)廠商同步實(shí)現(xiàn)關(guān)鍵突破:長(zhǎng)鑫多款高速內(nèi)存通過國(guó)際權(quán)威認(rèn)證,支撐消費(fèi)電子與服務(wù)器升級(jí);華邦自研 16nm DRAM 芯片,適配工業(yè)及嵌入式設(shè)備需求。
![]()
![]()
HBM
AI 算力需求暴增,傳統(tǒng)傳輸帶寬與 GPU 內(nèi)置緩存嚴(yán)重制約性能。HBM 以 3D 堆疊 + 硅通孔工藝打造高帶寬低延遲高端內(nèi)存,突破算力瓶頸。
HBM 是高增長(zhǎng)賽道:2024 年市場(chǎng)規(guī)模 56.1 億美元,預(yù)計(jì) 2034 年達(dá) 570.9 億美元,十年年均增速 26.1%。技術(shù)壁壘高,僅三星、SK 海力士、美能量產(chǎn),2025 年二季度市占率分別為 17%、62%、21%,SK 海力士領(lǐng)跑。
廠商縮減低利潤(rùn)傳統(tǒng)存儲(chǔ)產(chǎn)能,轉(zhuǎn)向 HBM、DDR5 等高端產(chǎn)品,傳統(tǒng)存儲(chǔ)產(chǎn)量持續(xù)下降;且 HBM 晶圓消耗約為同容量傳統(tǒng) DRAM 的 3 倍,疊加工藝復(fù)雜,整體產(chǎn)能提升受限。
![]()
03-2、核心能源--電力
Token是歷史級(jí)別的吞電怪獸。2025年,電力故障是全球數(shù)據(jù)中心宕機(jī)首要誘因,當(dāng)年占比達(dá) 54%,遠(yuǎn)高于其他故障;算力密度提升持續(xù)推高數(shù)據(jù)中心用電需求與穩(wěn)定性要求。
![]()
2023 年美國(guó)數(shù)據(jù)中心耗電 176 太瓦時(shí),占全美用電 4.4%;IEA 預(yù)計(jì) 2028 年將達(dá) 325-580 太瓦時(shí),年均增速 26.9%,占比升至 6.7%-12%。
![]()
遠(yuǎn)距離輸電中,提升電壓是兼顧低損耗、低成本的最優(yōu)方案。我國(guó)能源供給集中于西部、用電需求集中于東部,供需錯(cuò)位下,特高壓如同 “電力高鐵”,可低損耗、高效率完成西電東送,既降本增效,也保障全國(guó)用電穩(wěn)定安全,而其落地運(yùn)行完全依賴核心電網(wǎng)設(shè)備的支撐。
![]()
特高壓場(chǎng)景下,四大核心設(shè)備構(gòu)成了電網(wǎng)的關(guān)鍵骨架:變壓器作為調(diào)壓樞紐,負(fù)責(zé)電壓變換;開關(guān)設(shè)備(GIS)如同 “總閘手”,控制電流通斷、切除故障;換流閥作為能量轉(zhuǎn)換器,實(shí)現(xiàn)交直流轉(zhuǎn)換;二次設(shè)備則是 “電網(wǎng)大腦”,以毫秒級(jí)精準(zhǔn)控制實(shí)現(xiàn)調(diào)度保護(hù)。這些設(shè)備是特高壓技術(shù)的核心壁壘,也是我國(guó)能源供應(yīng)安全的關(guān)鍵保障。
![]()
下方掃碼直接加入:
04 中游產(chǎn)業(yè)鏈--Token工廠
Token 是由大模型廠商通過自研的專屬分詞算法生成的,每一家主流大模型廠商都有適配自家模型的分詞體系,用來把文本內(nèi)容轉(zhuǎn)換成模型可識(shí)別、可計(jì)算的 Token 編碼,不同廠商生成方式不同。
04-1、Token工廠--生產(chǎn)和計(jì)費(fèi)
以后的數(shù)據(jù)中心會(huì)徹底換個(gè)定位,不再只是單純存文件的機(jī)房,而是變成專門批量生產(chǎn) Token 的工廠。
黃仁勛明確提出,未來評(píng)判一家 AI 企業(yè)實(shí)力,核心標(biāo)準(zhǔn)就是耗一度電能產(chǎn)出多少 Token。
Token 工廠的邏輯很簡(jiǎn)單,把傳統(tǒng)數(shù)據(jù)中心的通用存儲(chǔ)、普通計(jì)算功能重新改造,變成一套工業(yè)化生產(chǎn)模式。
靠電力、數(shù)據(jù)、算法三樣基礎(chǔ)條件運(yùn)轉(zhuǎn),電力提供算力支撐,數(shù)據(jù)當(dāng)作生產(chǎn)原料,算法作為核心生產(chǎn)工藝,最后批量產(chǎn)出標(biāo)準(zhǔn)化的 Token,支撐文案創(chuàng)作、代碼編寫、圖文交互等所有 AI 功能落地。
![]()
大模型計(jì)費(fèi)邏輯很簡(jiǎn)單,總費(fèi)用由輸入 Token 和輸出 Token 兩部分組成。提問內(nèi)容、系統(tǒng)提示、歷史對(duì)話以及上傳的圖文資料,都會(huì)折算成輸入 Token 計(jì)費(fèi)。模型逐字生成回答需要巨大算力,消耗更多資源,所以輸出 Token 價(jià)格通常是輸入的 2 至 3 倍。
由于單個(gè) Token 價(jià)值極低,行業(yè)統(tǒng)一采用百萬 Token 作為標(biāo)準(zhǔn)計(jì)價(jià)單位,一百萬 Token 約折合 50 萬個(gè)漢字。
目前市場(chǎng)主要有四種計(jì)費(fèi)方式:個(gè)人和散戶適合按量計(jì)費(fèi);企業(yè)可采購 Token 套餐降低單價(jià);高頻用戶可選會(huì)員訂閱;機(jī)構(gòu)私有化部署則按服務(wù)器年費(fèi)收費(fèi),不限 Token 使用量。
![]()
04-2、全球消耗情況
AI 應(yīng)用場(chǎng)景拓展帶動(dòng)算力指數(shù)級(jí)增長(zhǎng),作為 AI 交互核心單位的 Token 消耗量同步攀升,其商業(yè)價(jià)值由計(jì)算效率與產(chǎn)出價(jià)值雙輪驅(qū)動(dòng),AI 輸入輸出均以 Token 為單位,計(jì)算復(fù)雜度與 Token 消耗正相關(guān);
據(jù) OpenRouter 數(shù)據(jù),2026 年 3 月 16 日 - 22 日全球大模型周調(diào)用量達(dá) 20.4 萬億 Token,環(huán)比增 20.7%,其中中國(guó)為 7.359 萬億 Token(環(huán)比 + 56.91%),美國(guó)為 2.954 萬億 Token(環(huán)比 - 10.32%),中國(guó)已連續(xù)三個(gè)周期超越美國(guó)。
![]()
OpenRouter 數(shù)據(jù)顯示,2026 年 3 月 23 日全球 AI 模型周調(diào)用量排名前九,國(guó)產(chǎn)模型占六席且包攬前四;小米 MiMo V2 Pro 以 40% 占比登頂,階躍星辰 Step 3.5 Flash(free)、MiniMax M2.7 分列二三,其余國(guó)產(chǎn)模型還包括 DeepSeek V3.2、GLM 5 Turbo、MiniMax M2.5。
![]()
04-3、大模型推動(dòng)
大模型訓(xùn)練與推理需求持續(xù)擴(kuò)張,Token 消耗量隨之大幅增長(zhǎng)。
訓(xùn)練環(huán)節(jié),模型從密集預(yù)訓(xùn)練向混合專家架構(gòu)演進(jìn),參數(shù)規(guī)模邁向十萬億級(jí),疊加多模態(tài)數(shù)據(jù)復(fù)雜度提升,單任務(wù)計(jì)算量呈指數(shù)級(jí)增長(zhǎng);頭部廠商推進(jìn)萬億參數(shù)模型訓(xùn)練,所需訓(xùn)練數(shù)據(jù)規(guī)模躍升至十萬億 Token 級(jí)。
![]()
推理環(huán)節(jié),據(jù)德勤預(yù)測(cè),2026 年推理算力占比將達(dá) 66%,首次超過訓(xùn)練算力,AI 進(jìn)入 “推理驅(qū)動(dòng)” 階段;伴隨應(yīng)用場(chǎng)景下沉與 AI Agent 規(guī)模化落地,推理端 Token 需求將進(jìn)一步擴(kuò)大。
![]()
大模型市場(chǎng)2025 年起進(jìn)入應(yīng)用深化期,應(yīng)用場(chǎng)景持續(xù)拓寬,商業(yè)模式逐步清晰。
據(jù)艾媒咨詢數(shù)據(jù),2024 年中國(guó)大模型市場(chǎng)規(guī)模達(dá) 294.16 億元,預(yù)計(jì) 2026 年將增至 738.57 億元,2024-2026 年復(fù)合年增長(zhǎng)率為 58.5%。
![]()
05 下游產(chǎn)業(yè)鏈--應(yīng)用與出海
05-1、Token出海--優(yōu)勢(shì)顯著
國(guó)內(nèi)大模型的實(shí)際使用成本,遠(yuǎn)低于海外主流大模型。根據(jù)專業(yè)機(jī)構(gòu)的測(cè)試數(shù)據(jù),完成同一輪標(biāo)準(zhǔn)測(cè)試,國(guó)內(nèi) MiniMax M2.5 的成本僅需 125 美元,而海外 Claude Opus 4.6 的測(cè)試成本高達(dá) 4970 美元,GPT5.2-Codex 也需要 3244 美元,成本差距達(dá)到幾十倍。
![]()
海外模型成本更高,核心有兩個(gè)原因。
一是國(guó)內(nèi)模型的 Token 單價(jià)更低,MiniMax M2.5 的輸入、輸出 Token 價(jià)格,分別僅為 Claude Opus 的 6%、5%,也僅為 GPT5.2 Codex 的 17%、9%;
二是國(guó)內(nèi)模型完成相同任務(wù)消耗的 Token 數(shù)量更少,MiniMax M2.5 單次測(cè)試僅消耗 58M Token,僅為 Claude Opus 的 36%、GPT5.2-Codex 的 29%。單價(jià)更低 + 用量更少,最終讓國(guó)內(nèi)模型的使用成本形成了極為顯著的優(yōu)勢(shì)。
![]()
05-2、出海案例--Minimax
2023 到 2025 年,MiniMax 的收入越來越靠海外市場(chǎng)支撐,全球化布局效果十分突出。2024 年、2025 年,公司海外收入分別達(dá) 2130 萬、5770 萬美元,占總營(yíng)收的 70%、73%,是增長(zhǎng)的核心動(dòng)力;同期國(guó)內(nèi)收入僅 920 萬、2140 萬美元,占比 30%、27%。
![]()
業(yè)務(wù)端,公司核心板塊均實(shí)現(xiàn)翻倍以上增長(zhǎng)。AI 原生產(chǎn)品收入從 80 萬美元漲到 5310 萬美元,收入占比從 22% 提升至 67%;開發(fā)平臺(tái)和 AI 企業(yè)服務(wù)收入,也從 270 萬美元漲到 2600 萬美元,充分證明了公司的 AI 商業(yè)化落地能力。
![]()
05-3、AI應(yīng)用
Token 的下游應(yīng)用幾乎覆蓋了所有 AI 使用場(chǎng)景,不管是日常聊天、寫文案做方案,還是寫代碼、生成圖文視頻,所有 AI 功能都要靠 Token 這個(gè)基礎(chǔ)單元來實(shí)現(xiàn)。
![]()
![]()
下方掃碼直接加入:
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.