網易首頁 > 網易號 > 正文 申請入駐

從活字字塊到Token浪潮:技術民主化的千年接力

0
分享至


01

數據洪流:

7萬億Token背后的歷史回響


3月16日至22日,全球最大AI模型API聚合平臺OpenRouter記錄下一組令人側目的數據:全球AI大模型總調用量20.4萬億Token,其中超過三分之一流向了中國模型。

連續三周,中國AI大模型的周調用量碾壓美國同行——7.359萬億對3.536萬億,漲幅56.9%對7.35%。排行榜前四席,中國模型包攬全部:小米MiMo V2 Pro、階躍星辰Step 3.5 Flash、MiniMax M2.5、DeepSeek-V3.2。

但比排名更值得關注的是這個被頻繁提及卻鮮被理解的詞——Token(詞元)。

1000年前,北宋工匠畢昇在膠泥上刻下一個個反體字,用火焙硬,制成可以反復排列的"活字",改寫了人類知識傳播的歷史。今天,工程師們將文本切割成名為"Token"的最小單元,用向量和矩陣重新定義智能生產的邏輯。

從泥活字到數字Token,從物理排版到神經網絡計算,一場關于"最小單元"的革命,似乎正在以驚人的相似性重演。

但相似不等于相同。本文將借用活字印刷的歷史意象,同時嚴格劃定類比的邊界——因為技術史的精確性,比敘事的流暢性更重要。

02

Token是什么?AI的“文字食材”

——以及它和活字的“表親”關系

"Token是大語言模型處理文本的基本單元,可理解為'AI眼中的字塊'。"

深圳理工大學算力微電子學院助理教授馬智恒這樣解釋。在輸入模型前,文本會被切分成Token并轉換為向量。中文通常每個字對應1至2個Token,英文則約0.75個Token per word。


想象你向AI提問:"人工智能會取代人類嗎?"

在人類眼中,這是一句話。在AI眼中,這是若干Token的序列——可能是"人工"+"智能"+"會"+"取代"+"人類"+"嗎",或者更細粒度的切分。每個Token都被編碼成一個高維向量,在神經網絡的層間通過矩陣運算和注意力機制進行處理,最終生成回答。

深圳計算科學研究院崖山LAB負責人歐偉杰打了個比方:如果將"算力"視為"電力",那么Token就是消耗的"電量",是衡量AI活躍度與處理規模的核心指標。

綜合開發研究院通證數字經濟研究中心執行主任馬朝良看得更遠:"Token背后反映的是一個更大的趨勢——人類正在把世界'拆解'成可以被機器理解和處理的最小單位。"


至此,"Token=數字活字"的類比似乎成立。但這里必須插入一個關鍵的澄清——

活字印刷的"最小單元"(泥活字)是生產工具,可物理復用;Token的"最小單元"是計算過程中的臨時數據,每次調用都在消耗算力資源。 換句話說,活字越用越省(邊際成本遞減),Token越用越費(邊際成本基本線性增長)。二者在成本邏輯上是反向的。


那么,真正的類比對象是什么?

不是Token本身,而是預訓練模型的權重參數——那些在海量數據中訓練得到的、可以被無數應用共享調用的"知識結晶"。這些參數才是更接近"數字活字"概念的對象:刻制一次(訓練),復用無限(推理)。(注:這是本文提出的類比,非學術界標準術語)

而Token,更像是印刷過程中的"紙張和油墨"——是消耗品,而非生產工具。

但為何Token的調用量如此重要?因為它衡量的是"數字活字"被激活的頻率——是技術民主化的溫度計,而非技術本身。

03

歷史的回響:活字印刷的啟示與錯位

1040年代,北宋慶歷年間,布衣畢昇發明了膠泥活字印刷術。


這比古騰堡的鉛活字印刷機早了整整400年。沈括在《夢溪筆談》中詳細記錄了這項技術:用膠泥刻字,薄如錢唇,火燒令堅,然后密布字印,滿鐵范為一板。

但歷史開了一個殘酷的玩笑。

明清時期,活字印刷在中國未能完全取代雕版。原因復雜:漢字數量龐大,常用字就需數萬枚字模;泥活字易損,金屬活字成本高昂;科舉制度下的書籍需求結構,未能形成足夠的商業驅動力。直到19世紀西方鉛活字印刷機傳入,中國才真正進入活字印刷的大規模應用時代。

發明在先,規模化在后——這是中國古代技術史的常見敘事。


但今天,當Token成為智能生產的"消耗單元",中國似乎正在走出不同的軌跡。這里的關鍵差異在于:我們并非Token機制(Transformer架構、注意力機制均源于美國)的"原創發明者",但正在成為Token規模化流動的主導者。

這是一種不同的歷史角色——不是畢昇式的"技術首創者",也不是古騰堡式的"技術整合者",而是"技術采納者+規模化應用者"的新角色。

04

霸榜背后:中國Token經濟的三大支點

OpenRouter的數據揭示了一個清晰的格局:中國模型不僅調用量大,而且增長迅猛。這背后是三個相互強化的支點。



第一支點:

價格革命——讓"紙張油墨"便宜到可以揮霍

以DeepSeek、MiniMax M2.5為代表的國產模型,大幅降低了API使用成本。

"國產模型以較低的訓練成本將AI變為如同柴米油鹽一樣的生活必需品。"粵港灣控股有限公司執行董事羅介平如此評價。

這里需要再次厘清類比:如果說模型權重更接近"數字活字"(一次性投入,無限復用),那么推理成本就是"印刷耗材"(每次調用,持續消耗)。中國模型的真正突破,在于讓"耗材"便宜到可以大規模揮霍——這降低了技術應用的門檻,而非技術生產的門檻。

活字印刷的核心價值,是讓知識復制的邊際成本斷崖式下跌;今天中國AI的核心價值,是讓智能服務的邊際成本趨近于零。效果相似,機制不同。


第二支點:

開源生態——讓"字模"可以被自由復制

中國公司在開源模型領域占據主導地位,與全球頂尖閉源模型的技術代差已縮短至約三個月。

開源意味著什么?意味著"數字活字"(模型權重)可以被全球開發者自由獲取、改進、再分發。畢昇的活字技術受限于時代,未能形成持續迭代的社區;今天的開源模型生態,正在以互聯網的速度自我強化。


第三支點:

場景紅利——讓"印刷機"遍布每個角落

這是最具中國特色的變量。


微信月活13億,釘釘7億,飛書2億。這些超級應用構成了AI觸達用戶的"自來水管網"。

"我國開發者貢獻了大量的Token消耗,"羅介平指出,"這些用戶只需輕輕一點即可調用AI能力,這無疑帶來了海量的模型調用需求。"

歐偉杰稱之為"長尾效應":隨著國內大模型在推理成本、響應速度、API成本等方面的持續優化,大量中小企業和開發者開始將AI接入業務流程,觸發了調用量的指數級增長。

十億級用戶入口 + 極低調用成本 + 開源技術生態,這三者的乘積效應,構成了中國Token經濟的基本盤。

但請注意:這里的競爭優勢不在于Token本身,而在于Token的流動效率——是基礎設施、成本控制、場景滲透的綜合結果。

05

冷思考:Token洪流中的真問題

繁榮的表象下,需要保持清醒。

首先是"量"與"質"的落差。

馬智恒提醒:"我們也必須清醒認識到,美國在原始模型創新、高端芯片與算力基礎設施等領域,仍保持著顯著優勢。"

調用量領先不等于技術領先。中國模型在應用層的Token消耗上占據優勢,但在基礎層的模型架構創新、硬件層的算力自主性上,短板依然存在。

其次是"消耗"與"沉淀"的錯位。

歐偉杰指出了更隱蔽的挑戰:"海量Token的背后,是更大規模的數據吞吐與更復雜的數據治理挑戰。大模型的每一次調用,都依賴底層數據庫系統對實時數據、歷史知識、用戶交互的精準管理與毫秒級響應。"

這里有一個反諷:Token調用量越大,意味著"數字活字"(模型權重)被使用得越頻繁,但同時也意味著系統脆弱性越高——數據治理、實時響應、安全合規的壓力呈指數級增長。

活字印刷不僅要有字塊,還要有精良的排版工藝、優質的紙張墨水、高效的發行網絡。Token經濟同樣需要完整的"排版生態"。


最后是"薄利"與"溢價"的困境。

中國模型以價格優勢收獲全球開發者青睞,但這是否意味著我們只能做"薄利多銷"的生意?如何在Token調用量的基礎上,構建更高附加值的服務和品牌?

這是從"制造大國"到"品牌強國"的老命題,在AI時代的新投射。

06

未來誰將成為"智能排版大師"?


3月,阿里巴巴正式成立Alibaba Token Hub事業群,旨在圍繞"創造Token、輸送Token、應用Token"構建完整的AI生態體系。

幾乎同時,英偉達CEO黃仁勛在GTC 2026上提出"Token經濟學",將數據中心定義為生產AI智能Token的工廠,強調"算力即收入"。

兩種視角,兩種邏輯。

美國視角:數據中心是Token工廠,算力即收入,核心是生產能力的壟斷。

中國實踐:Token Hub是生態樞紐,創造-輸送-應用全鏈條打通,核心是網絡效應的捕獲。

哪種路徑更具可持續性?歷史或許能提供參照。

古騰堡的真正突破,不在于發明了活字(金屬活字早已存在),而在于整合了活字鑄造、印刷機、油墨配方、紙張供應、商業出版的全鏈條。技術的發明重要,但技術的"排版"——即如何將其嵌入社會經濟系統的復雜網絡——可能更重要。

今天,中國擁有最豐富的應用場景、最龐大的用戶基數、最活躍的開發生態。這些條件使得中國有機會成為AI時代的"排版大師"——不僅生產Token,更定義Token流動的方式、規則和價值分配機制。

尾聲:

劃定邊界后的回望

回到1000年前的開封府,畢昇在膠泥上刻下最后一個反體字,火光照亮了他布滿老繭的雙手。


他不知道,這項技術將在400年后才在異國他鄉真正綻放。他更不知道,1000年后,另一群工程師正在服務器機房中,以每秒萬億次的速度切割、編碼、重組著名為"Token"的數字單元。

從泥活字到數字Token,從物理排版到神經網絡,人類對技術民主化的追求從未停止。但本文必須以一個嚴格的限定作結:

Token不是數字活字。模型權重才是。Token只是這些"數字活字"被激活時產生的漣漪。

中國AI的7萬億Token周調用量,衡量的不是技術原創性,而是技術擴散的速度和廣度。這不是畢昇式的"發明者敘事",也不是古騰堡式的"整合者敘事",而是一種新的"規模化敘事"——同樣偉大,但性質不同。

這一次,歷史沒有完全重演。中國正在書寫新的劇本。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
莫家蝶100米欄首秀13秒08奪冠創亞洲第1 劉景揚吳艷妮缺席本場比賽

莫家蝶100米欄首秀13秒08奪冠創亞洲第1 劉景揚吳艷妮缺席本場比賽

勁爆體壇
2026-04-26 16:56:08
《乘風2026》全網吐槽何宣林,不是沒有原因的!

《乘風2026》全網吐槽何宣林,不是沒有原因的!

喜歡歷史的阿繁
2026-04-26 18:21:31
北約正式參戰?凌晨2點,英戰機砸進北約領土!擊落俄軍無人機

北約正式參戰?凌晨2點,英戰機砸進北約領土!擊落俄軍無人機

阿柒的訊
2026-04-26 10:14:15
白宮晚宴開槍了!特朗普撤離前細節耐人尋味,他最害怕的一幕出現

白宮晚宴開槍了!特朗普撤離前細節耐人尋味,他最害怕的一幕出現

畫夕
2026-04-26 17:39:37
CNN主持人原話:中國正趁著天下大亂,悶聲成為頭號強國

CNN主持人原話:中國正趁著天下大亂,悶聲成為頭號強國

愛一449
2026-04-22 20:42:25
民調機構:德國選擇黨支持率創新高

民調機構:德國選擇黨支持率創新高

界面新聞
2026-04-26 14:05:42
震驚!公安部長李震深夜神秘消失,尸體竟在地下管道被發現!

震驚!公安部長李震深夜神秘消失,尸體竟在地下管道被發現!

鑒史錄
2026-04-26 04:47:29
日本澀澀真人影游重返Steam!三大美女伺候 但鎖國區

日本澀澀真人影游重返Steam!三大美女伺候 但鎖國區

游民星空
2026-04-26 09:13:16
沒有什么“法不責輝”,再多的丈母娘也救不了董宇輝

沒有什么“法不責輝”,再多的丈母娘也救不了董宇輝

細雨中的呼喊
2026-04-26 00:12:43
大數據分析,在中國,找個身高1米7年入20萬的老公,到底有多難?

大數據分析,在中國,找個身高1米7年入20萬的老公,到底有多難?

深度報
2026-04-18 23:37:27
又創新低,萬科A已跌90%,50萬股東騎虎難下,補倉還是止損?

又創新低,萬科A已跌90%,50萬股東騎虎難下,補倉還是止損?

丁丁鯉史紀
2026-04-26 16:43:58
突然,做空了!

突然,做空了!

中國基金報
2026-04-26 15:13:41
中方必須無條件割讓領土?美發話后,馬來西亞叫囂:中國放棄南海

中方必須無條件割讓領土?美發話后,馬來西亞叫囂:中國放棄南海

詩酒趁的年華
2026-04-22 05:07:02
大齡剩女可以破防到什么程度?發朋友圈且通知媒人,還向家人告狀

大齡剩女可以破防到什么程度?發朋友圈且通知媒人,還向家人告狀

丫頭舫
2026-04-24 20:40:08
連院子里的樹都被貼了封條,山東臨沂納稅狀元變“黑老大”

連院子里的樹都被貼了封條,山東臨沂納稅狀元變“黑老大”

有戲
2026-04-16 18:23:20
取消戶籍限制!教育部突發新規!9月1日起執行:家長再也不用焦慮

取消戶籍限制!教育部突發新規!9月1日起執行:家長再也不用焦慮

芳姐侃社會
2026-04-24 22:52:50
滕代遠和彭德懷吵完架后不久,開槍把自己打成重傷,彭德懷驚呆了

滕代遠和彭德懷吵完架后不久,開槍把自己打成重傷,彭德懷驚呆了

談古論今歷史有道
2026-04-26 17:15:03
中國國民黨前主席洪秀柱:我沒有刻意追求流行,只是選擇中華美學時尚

中國國民黨前主席洪秀柱:我沒有刻意追求流行,只是選擇中華美學時尚

上觀新聞
2026-04-26 06:53:04
我敢說,大部分會跟我一樣,選擇黑色衣服那個女孩!

我敢說,大部分會跟我一樣,選擇黑色衣服那個女孩!

草莓解說體育
2026-04-12 17:05:01
1986年陳永貴病逝,追悼會規格成難題,鄧小平只說了一句話,全場安靜

1986年陳永貴病逝,追悼會規格成難題,鄧小平只說了一句話,全場安靜

寄史言志
2026-01-04 16:34:31
2026-04-26 19:04:49
科工力量 incentive-icons
科工力量
觀察者網工業科技專欄
220文章數 539關注度
往期回顧 全部

科技要聞

漲價浪潮下,DeepSeek推動AI“價格戰”

頭條要聞

特朗普內閣又一女部長落馬:強迫男下屬為其提供性服務

頭條要聞

特朗普內閣又一女部長落馬:強迫男下屬為其提供性服務

體育要聞

森林狼3比1掘金:逆境中殺出了多孫穆?!

娛樂要聞

僅次《指環王》的美劇,有第二季

財經要聞

事關新就業群體,中辦、國辦發文

汽車要聞

預售19.38萬元起 哈弗猛龍PLUS七座版亮相

態度原創

藝術
教育
游戲
本地
公開課

藝術要聞

18幅 列賓美院教師Artem Tikhonov風景寫生

教育要聞

休學率上漲,驚到很多人!北大六院醫生直言:這背后其實是夫妻關系和家庭關系……

任天堂要學索尼套路?曝Switch2或改變游戲發售策略

本地新聞

云游中國|逛世界風箏都 留學生探秘中國傳統文化

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版