網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

一天吃透【Token】產(chǎn)業(yè)鏈，算力 “通用幣”！

2026-05-15 20:34:52　來源: 飛跑的鹿

廣東舉報(bào)

分享至

01 Token 產(chǎn)業(yè)鏈全景圖

02 什么是“Token”

Token，中文名“詞元”，可以理解為 AI 識(shí)別文字的最小碎片，我們普通人以單個(gè)漢字、完整詞語來閱讀理解內(nèi)容，而AI 會(huì)把語句拆解成零散的片段，一個(gè)字、半個(gè)字、一個(gè)詞語、一串字母，甚至標(biāo)點(diǎn)、空格，都能單獨(dú)成為一個(gè) Token。

AI 本質(zhì)是數(shù)學(xué)模型，無法直接看懂人類文字，需要先將所有文字拆分成一個(gè)個(gè) Token，再給每個(gè) Token 編制專屬數(shù)字編號(hào)，把文字轉(zhuǎn)化為數(shù)字形式，AI 才能進(jìn)行運(yùn)算、理解語義并生成回答。

中文約 1.5 個(gè)漢字對(duì)應(yīng) 1 個(gè) Token，英文和標(biāo)點(diǎn)也會(huì)單獨(dú)折算。同時(shí) Token 也是 AI 付費(fèi)的計(jì)費(fèi)標(biāo)準(zhǔn)，還決定了模型的上下文記憶上限，超出額度后，AI 就會(huì)遺忘之前的對(duì)話內(nèi)容。

03 上游產(chǎn)業(yè)鏈--基礎(chǔ)硬件

AI大模型的需求爆發(fā)，讓 Token 消耗進(jìn)入指數(shù)級(jí)增長(zhǎng)通道。

從數(shù)據(jù)看，OpenRouter 平臺(tái)的 Token 消耗量，從 2024 年初每周 120-150 億的規(guī)模，增長(zhǎng)至 2026 年 4 月的 20 萬億級(jí)別。

火山引擎豆包大模型的日均 Token 調(diào)用量，2026 年 3 月已突破 120 萬億，過去三個(gè)月實(shí)現(xiàn)翻倍，對(duì)比 2024 年 5 月首次推出時(shí)，漲幅達(dá) 1000 倍。

阿里發(fā)布的編程大模型 Qwen3.6-Plus，上線后單日 Token 調(diào)用量突破 1.4 萬億，刷新了全球單模型單日調(diào)用紀(jì)錄。

Token 消耗的爆發(fā)式增長(zhǎng)，直接拉動(dòng)了 AI 基礎(chǔ)設(shè)施的需求，上游元器件迎來全面漲價(jià)潮。AI 算力芯片供不應(yīng)求，內(nèi)存、硬盤、CPU 等配套硬件環(huán)節(jié)，自 2025 年下半年以來均出現(xiàn)供給缺口，開啟漲價(jià)周期。

根據(jù) TrendForce 統(tǒng)計(jì)，2026 年第一季度，DRAM 內(nèi)存價(jià)格預(yù)計(jì)環(huán)比上漲 105%-110%，NAND 閃存及企業(yè)級(jí) SSD 價(jià)格漲幅為 53%-58%；服務(wù)器 CPU 方面，Intel 及 AMD 廠商均宣布漲價(jià) 10%-15%。

03-1、核心部件--內(nèi)存芯片

DRAM

大模型 Token 消耗的指數(shù)級(jí)爆發(fā)，催生了對(duì)高帶寬、低延遲、大容量 AI 存儲(chǔ)的剛性且爆發(fā)式需求。DRAM 是 CPU/GPU 運(yùn)行的高速臨時(shí)存儲(chǔ)，斷電清空，直連核心芯片，為算力提供高速緩沖，內(nèi)部架構(gòu)分三大模塊，可類比高效數(shù)據(jù)車間。

據(jù) TrendForce，2024 年全球 DRAM 市場(chǎng)規(guī)模 958.63 億美元，同比增 84.83%，存儲(chǔ)賽道強(qiáng)勢(shì)復(fù)蘇。

全球存儲(chǔ)巨頭全力沖刺 DRAM 技術(shù)升級(jí)：三星率先量產(chǎn)第六代 10nm 級(jí) DRAM，送出 HBM4 樣品并敲定 2026 年量產(chǎn)，領(lǐng)跑行業(yè)；美光推出首款 1γ 工藝內(nèi)存樣品，筑牢旗艦機(jī)型 AI 性能硬件基礎(chǔ)。

國(guó)產(chǎn)廠商同步實(shí)現(xiàn)關(guān)鍵突破：長(zhǎng)鑫多款高速內(nèi)存通過國(guó)際權(quán)威認(rèn)證，支撐消費(fèi)電子與服務(wù)器升級(jí)；華邦自研 16nm DRAM 芯片，適配工業(yè)及嵌入式設(shè)備需求。

HBM

AI 算力需求暴增，傳統(tǒng)傳輸帶寬與 GPU 內(nèi)置緩存嚴(yán)重制約性能。HBM 以 3D 堆疊 + 硅通孔工藝打造高帶寬低延遲高端內(nèi)存，突破算力瓶頸。

HBM 是高增長(zhǎng)賽道：2024 年市場(chǎng)規(guī)模 56.1 億美元，預(yù)計(jì) 2034 年達(dá) 570.9 億美元，十年年均增速 26.1%。技術(shù)壁壘高，僅三星、SK 海力士、美能量產(chǎn)，2025 年二季度市占率分別為 17%、62%、21%，SK 海力士領(lǐng)跑。

廠商縮減低利潤(rùn)傳統(tǒng)存儲(chǔ)產(chǎn)能，轉(zhuǎn)向 HBM、DDR5 等高端產(chǎn)品，傳統(tǒng)存儲(chǔ)產(chǎn)量持續(xù)下降；且 HBM 晶圓消耗約為同容量傳統(tǒng) DRAM 的 3 倍，疊加工藝復(fù)雜，整體產(chǎn)能提升受限。

03-2、核心能源--電力

Token是歷史級(jí)別的吞電怪獸。2025年，電力故障是全球數(shù)據(jù)中心宕機(jī)首要誘因，當(dāng)年占比達(dá) 54%，遠(yuǎn)高于其他故障；算力密度提升持續(xù)推高數(shù)據(jù)中心用電需求與穩(wěn)定性要求。

2023 年美國(guó)數(shù)據(jù)中心耗電 176 太瓦時(shí)，占全美用電 4.4%；IEA 預(yù)計(jì) 2028 年將達(dá) 325-580 太瓦時(shí)，年均增速 26.9%，占比升至 6.7%-12%。

遠(yuǎn)距離輸電中，提升電壓是兼顧低損耗、低成本的最優(yōu)方案。我國(guó)能源供給集中于西部、用電需求集中于東部，供需錯(cuò)位下，特高壓如同 “電力高鐵”，可低損耗、高效率完成西電東送，既降本增效，也保障全國(guó)用電穩(wěn)定安全，而其落地運(yùn)行完全依賴核心電網(wǎng)設(shè)備的支撐。

特高壓場(chǎng)景下，四大核心設(shè)備構(gòu)成了電網(wǎng)的關(guān)鍵骨架：變壓器作為調(diào)壓樞紐，負(fù)責(zé)電壓變換；開關(guān)設(shè)備（GIS）如同 “總閘手”，控制電流通斷、切除故障；換流閥作為能量轉(zhuǎn)換器，實(shí)現(xiàn)交直流轉(zhuǎn)換；二次設(shè)備則是 “電網(wǎng)大腦”，以毫秒級(jí)精準(zhǔn)控制實(shí)現(xiàn)調(diào)度保護(hù)。這些設(shè)備是特高壓技術(shù)的核心壁壘，也是我國(guó)能源供應(yīng)安全的關(guān)鍵保障。

下方掃碼直接加入：

04 中游產(chǎn)業(yè)鏈--Token工廠

Token 是由大模型廠商通過自研的專屬分詞算法生成的，每一家主流大模型廠商都有適配自家模型的分詞體系，用來把文本內(nèi)容轉(zhuǎn)換成模型可識(shí)別、可計(jì)算的 Token 編碼，不同廠商生成方式不同。

04-1、Token工廠--生產(chǎn)和計(jì)費(fèi)

以后的數(shù)據(jù)中心會(huì)徹底換個(gè)定位，不再只是單純存文件的機(jī)房，而是變成專門批量生產(chǎn) Token 的工廠。

黃仁勛明確提出，未來評(píng)判一家 AI 企業(yè)實(shí)力，核心標(biāo)準(zhǔn)就是耗一度電能產(chǎn)出多少 Token。

Token 工廠的邏輯很簡(jiǎn)單，把傳統(tǒng)數(shù)據(jù)中心的通用存儲(chǔ)、普通計(jì)算功能重新改造，變成一套工業(yè)化生產(chǎn)模式。

靠電力、數(shù)據(jù)、算法三樣基礎(chǔ)條件運(yùn)轉(zhuǎn)，電力提供算力支撐，數(shù)據(jù)當(dāng)作生產(chǎn)原料，算法作為核心生產(chǎn)工藝，最后批量產(chǎn)出標(biāo)準(zhǔn)化的 Token，支撐文案創(chuàng)作、代碼編寫、圖文交互等所有 AI 功能落地。

大模型計(jì)費(fèi)邏輯很簡(jiǎn)單，總費(fèi)用由輸入 Token 和輸出 Token 兩部分組成。提問內(nèi)容、系統(tǒng)提示、歷史對(duì)話以及上傳的圖文資料，都會(huì)折算成輸入 Token 計(jì)費(fèi)。模型逐字生成回答需要巨大算力，消耗更多資源，所以輸出 Token 價(jià)格通常是輸入的 2 至 3 倍。

由于單個(gè) Token 價(jià)值極低，行業(yè)統(tǒng)一采用百萬 Token 作為標(biāo)準(zhǔn)計(jì)價(jià)單位，一百萬 Token 約折合 50 萬個(gè)漢字。

目前市場(chǎng)主要有四種計(jì)費(fèi)方式：個(gè)人和散戶適合按量計(jì)費(fèi)；企業(yè)可采購 Token 套餐降低單價(jià)；高頻用戶可選會(huì)員訂閱；機(jī)構(gòu)私有化部署則按服務(wù)器年費(fèi)收費(fèi)，不限 Token 使用量。

04-2、全球消耗情況

AI 應(yīng)用場(chǎng)景拓展帶動(dòng)算力指數(shù)級(jí)增長(zhǎng)，作為 AI 交互核心單位的 Token 消耗量同步攀升，其商業(yè)價(jià)值由計(jì)算效率與產(chǎn)出價(jià)值雙輪驅(qū)動(dòng)，AI 輸入輸出均以 Token 為單位，計(jì)算復(fù)雜度與 Token 消耗正相關(guān)；

據(jù) OpenRouter 數(shù)據(jù)，2026 年 3 月 16 日 - 22 日全球大模型周調(diào)用量達(dá) 20.4 萬億 Token，環(huán)比增 20.7%，其中中國(guó)為 7.359 萬億 Token（環(huán)比 + 56.91%），美國(guó)為 2.954 萬億 Token（環(huán)比 - 10.32%），中國(guó)已連續(xù)三個(gè)周期超越美國(guó)。

OpenRouter 數(shù)據(jù)顯示，2026 年 3 月 23 日全球 AI 模型周調(diào)用量排名前九，國(guó)產(chǎn)模型占六席且包攬前四；小米 MiMo V2 Pro 以 40% 占比登頂，階躍星辰 Step 3.5 Flash（free）、MiniMax M2.7 分列二三，其余國(guó)產(chǎn)模型還包括 DeepSeek V3.2、GLM 5 Turbo、MiniMax M2.5。

04-3、大模型推動(dòng)

大模型訓(xùn)練與推理需求持續(xù)擴(kuò)張，Token 消耗量隨之大幅增長(zhǎng)。

訓(xùn)練環(huán)節(jié)，模型從密集預(yù)訓(xùn)練向混合專家架構(gòu)演進(jìn)，參數(shù)規(guī)模邁向十萬億級(jí)，疊加多模態(tài)數(shù)據(jù)復(fù)雜度提升，單任務(wù)計(jì)算量呈指數(shù)級(jí)增長(zhǎng)；頭部廠商推進(jìn)萬億參數(shù)模型訓(xùn)練，所需訓(xùn)練數(shù)據(jù)規(guī)模躍升至十萬億 Token 級(jí)。

推理環(huán)節(jié)，據(jù)德勤預(yù)測(cè)，2026 年推理算力占比將達(dá) 66%，首次超過訓(xùn)練算力，AI 進(jìn)入 “推理驅(qū)動(dòng)” 階段；伴隨應(yīng)用場(chǎng)景下沉與 AI Agent 規(guī)模化落地，推理端 Token 需求將進(jìn)一步擴(kuò)大。

大模型市場(chǎng)2025 年起進(jìn)入應(yīng)用深化期，應(yīng)用場(chǎng)景持續(xù)拓寬，商業(yè)模式逐步清晰。

據(jù)艾媒咨詢數(shù)據(jù)，2024 年中國(guó)大模型市場(chǎng)規(guī)模達(dá) 294.16 億元，預(yù)計(jì) 2026 年將增至 738.57 億元，2024-2026 年復(fù)合年增長(zhǎng)率為 58.5%。

05 下游產(chǎn)業(yè)鏈--應(yīng)用與出海

05-1、Token出海--優(yōu)勢(shì)顯著

國(guó)內(nèi)大模型的實(shí)際使用成本，遠(yuǎn)低于海外主流大模型。根據(jù)專業(yè)機(jī)構(gòu)的測(cè)試數(shù)據(jù)，完成同一輪標(biāo)準(zhǔn)測(cè)試，國(guó)內(nèi) MiniMax M2.5 的成本僅需 125 美元，而海外 Claude Opus 4.6 的測(cè)試成本高達(dá) 4970 美元，GPT5.2-Codex 也需要 3244 美元，成本差距達(dá)到幾十倍。

海外模型成本更高，核心有兩個(gè)原因。

一是國(guó)內(nèi)模型的 Token 單價(jià)更低，MiniMax M2.5 的輸入、輸出 Token 價(jià)格，分別僅為 Claude Opus 的 6%、5%，也僅為 GPT5.2 Codex 的 17%、9%；

二是國(guó)內(nèi)模型完成相同任務(wù)消耗的 Token 數(shù)量更少，MiniMax M2.5 單次測(cè)試僅消耗 58M Token，僅為 Claude Opus 的 36%、GPT5.2-Codex 的 29%。單價(jià)更低 + 用量更少，最終讓國(guó)內(nèi)模型的使用成本形成了極為顯著的優(yōu)勢(shì)。

05-2、出海案例--Minimax

2023 到 2025 年，MiniMax 的收入越來越靠海外市場(chǎng)支撐，全球化布局效果十分突出。2024 年、2025 年，公司海外收入分別達(dá) 2130 萬、5770 萬美元，占總營(yíng)收的 70%、73%，是增長(zhǎng)的核心動(dòng)力；同期國(guó)內(nèi)收入僅 920 萬、2140 萬美元，占比 30%、27%。

業(yè)務(wù)端，公司核心板塊均實(shí)現(xiàn)翻倍以上增長(zhǎng)。AI 原生產(chǎn)品收入從 80 萬美元漲到 5310 萬美元，收入占比從 22% 提升至 67%；開發(fā)平臺(tái)和 AI 企業(yè)服務(wù)收入，也從 270 萬美元漲到 2600 萬美元，充分證明了公司的 AI 商業(yè)化落地能力。

05-3、AI應(yīng)用

Token 的下游應(yīng)用幾乎覆蓋了所有 AI 使用場(chǎng)景，不管是日常聊天、寫文案做方案，還是寫代碼、生成圖文視頻，所有 AI 功能都要靠 Token 這個(gè)基礎(chǔ)單元來實(shí)現(xiàn)。

下方掃碼直接加入：

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.