網易首頁 > 網易號 > 正文 申請入駐

中國工程院院士鄭緯民:從模型服務走向詞元服務,是智能體時代對基礎設施的必然要求

0
分享至

4月15日,由北電數智主辦的第二屆酒仙橋論壇在京啟幕。

《每日經濟新聞》記者在現場注意到,會上,中國工程院院士、清華大學計算機科學與技術系教授鄭緯民提出,我國Token(詞元)消耗在兩年間增長了千倍。

然而,當前的AI算力基礎設施還無法高效生產Token;實際Token產能受限于系統優化不足,陷入高耗能、低產出的困局。


圖片來源:每經記者 楊卉攝

在鄭緯民看來,AI競賽的核心標準正在從MaaS(模型即服務)向TaaS(Token即服務)躍遷。未來還需推動Token服務向標準化、分層化與可調度化轉變,按業務目標對產能進行分層定價與調度。不能將所有負載壓在最昂貴的GPU(圖形處理器)資源上,需將大模型參數合理分配至不同的計算資源上,實現計算、緩存、狀態保存與數據搬運的職能分離與各歸其位,將可用計算資源池大幅擴大,將異構設備都用起來,通過優化底層架構來實現智能服務的高效、低成本生產。

“當前AI算力基礎設施無法高效生產詞元”

鄭緯民提到,前幾年大家還都在做大模型,去年開始,風口轉到了Token。Token究竟是什么?

鄭緯民解釋稱,Token介于硬件與應用之間,是AI處理信息的最小語義單元。如“人工智能很強大”這句話,會被分成“人工”“智能”“很”“強大”四個Token。

“你和AI的每一句輸入對話、AI生成的每一段輸出內容,都用Token來計量信息的處理量。”鄭緯民稱。此外,Token還是計算量的映射,是AI運行時算力消耗的基本計量單位,更是AI運行的計價單位。

鄭緯民稱,Token越來越重要的背后,是AI使用方式發生變化的事實。

據他介紹,在生成式AI時代,計算的消耗主要用于輸入、輸出式的單詞請求。到了智能體時代,智能體需要自行圍繞目標持續執行鏈路,實際消耗的Token數量遠超預期?,甚至達到“100倍”級別的膨脹。鄭緯民還強調,一旦未來新的智能水平出現,Token的消耗還可能會達到新的水平。

鄭緯民稱,我國Token消耗已經從2024年的日均千億漲到了如今的140萬億Token/天,兩年增長了千倍。然而,隨著Token消耗大增,新的問題開始出現:當前的AI算力基礎設施還無法高效生產Token;基礎設施主要服務于大模型訓練,而非實際應用中的持續性服務;實際Token產能受限于系統優化不足,陷入高耗能、低產出的困局。

在鄭緯民看來,單純將開源模型和開源推理框架做靜態堆疊,缺乏物理硬件層面的深度優化與系統級調度,昂貴算力就會在鏈路中的各類瓶頸處,如批處理與并發策略失衡、跨節點通信與調度不協調、顯存與系統內存配置不匹配等被持續損耗。

按業務目標對產能進行分層定價與調度

鄭緯民進一步指出,MaaS(模型即服務)一直是產業鏈的重要一環。但隨著AI進入規模化執行后,單純的模型接入已不足以支撐高效能供給。這意味著未來AI競賽的核心標準正在從MaaS(模型即服務)向TaaS(Token即服務)躍遷;從“比拼算力集群規模”徹底轉向“比拼每瓦Token生產效率”。

在鄭緯民的設想里,未來TaaS作為Agent時代生產智能的新型工業級服務體系,既能為產業釋放創新活力、為全國一體化算力網盤活存量資源,更能推動高質量智能服務普惠可及,讓智能生成像水電一樣穩定調度與供給,真正開啟普惠智能時代。

需要注意的是,據鄭緯民介紹,當前的Token服務其實是多樣的,有適用于實時交互、自動駕駛等對延遲敏感場景的極低時延型;有支持長上下文處理,適用于復雜Agent推理、多輪對話等場景的均衡通用型;還有大規模離線處理,適用于數據清洗、研報生成、模型微調等批量任務的高吞吐低成本型。未來,Token服務還需實現標準化、分層化與可調度化,將大模型參數合理分配至不同的計算資源上,以降低成本并提高性能。鄭緯民強調,按業務目標對產能進行分層定價與調度,是Token服務走向基礎設施的前提。

談到調度,鄭緯民還進一步指出,要實現全系統的“異構協同”,就不能將所有負載壓在最昂貴的GPU資源上,需實現計算、緩存、狀態保存與數據搬運的職能分離與各歸其位,將可用計算資源池大幅擴大,將異構設備都用起來。

“過去,我們建設模型;今天,我們要建設智能供給體系。從模型服務走向Token服務,是 Agent 時代對基礎設施的必然要求。只有當智能生成像水電一樣,被穩定調度與供給算力之上、Token 為王的普惠智能時代才算真正到來。”鄭緯民稱。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
羅翔:如果一個人突然努力工作,業余時間開始學習,不再參加社交活動,那么,身邊的人可能不僅不會幫他,還會拉他下來,原因就一個!

羅翔:如果一個人突然努力工作,業余時間開始學習,不再參加社交活動,那么,身邊的人可能不僅不會幫他,還會拉他下來,原因就一個!

譚老師地理大課堂
2026-04-22 00:03:57
難以相信!她已經61歲了,看起來竟然像三四十歲的樣子!

難以相信!她已經61歲了,看起來竟然像三四十歲的樣子!

科學發掘
2026-04-23 08:35:50
30.1碼,尼科-岡薩雷斯打入曼城本賽季最遠進球

30.1碼,尼科-岡薩雷斯打入曼城本賽季最遠進球

懂球帝
2026-04-26 02:27:30
華寶新能41歲獨立董事吳輝因病逝世

華寶新能41歲獨立董事吳輝因病逝世

南方都市報
2026-04-25 21:26:06
多艘船通過霍爾木茲海峽!海峽通行步驟曝光:共分4步,伊朗審查設5檔國籍分級,“越友好越寬松”,收多少錢取決于是哪國的船

多艘船通過霍爾木茲海峽!海峽通行步驟曝光:共分4步,伊朗審查設5檔國籍分級,“越友好越寬松”,收多少錢取決于是哪國的船

揚子晚報
2026-04-25 07:09:10
71.5%!歷史性暴跌,以貸養貸的泡沫崩了

71.5%!歷史性暴跌,以貸養貸的泡沫崩了

月滿大江流
2026-04-16 13:54:38
普京主動送上骨折價,俄媒酸中國占盡便宜?中方不慣著:愛賣不賣

普京主動送上骨折價,俄媒酸中國占盡便宜?中方不慣著:愛賣不賣

春若秋水
2026-04-24 22:15:24
中央5臺直播乒乓球時間表:4月25日CCTV5轉播國乒!附乒壇動態

中央5臺直播乒乓球時間表:4月25日CCTV5轉播國乒!附乒壇動態

林子說事
2026-04-25 17:48:24
斯諾克世錦賽:趙心童擴大優勢!3次上手零封丁俊暉,9-6沖8強!

斯諾克世錦賽:趙心童擴大優勢!3次上手零封丁俊暉,9-6沖8強!

劉姚堯的文字城堡
2026-04-26 00:04:00
第三批禁足名單將出爐!媒體人點名5人:丁勇曹楊被禁足不奇怪

第三批禁足名單將出爐!媒體人點名5人:丁勇曹楊被禁足不奇怪

說歷史的老牢
2026-04-26 01:05:11
局勢惡化!日本開出危險一槍,中國紅線遭踩踏,東部戰區行動了

局勢惡化!日本開出危險一槍,中國紅線遭踩踏,東部戰區行動了

人間無味啊
2026-04-23 17:30:01
72歲林青霞現身香港中文大學,頭發濃密,發際線也沒上移狀態超好

72歲林青霞現身香港中文大學,頭發濃密,發際線也沒上移狀態超好

點點細語
2026-04-25 20:15:26
臺灣省經濟數據看著越來越亮眼,可普通老百姓的日子卻越來越緊巴

臺灣省經濟數據看著越來越亮眼,可普通老百姓的日子卻越來越緊巴

流蘇晚晴
2026-04-20 20:12:45
尚界汽車法務部:北京車展有人蓄意破壞展車內飾 已取證將追責

尚界汽車法務部:北京車展有人蓄意破壞展車內飾 已取證將追責

快科技
2026-04-25 11:45:05
印尼財長:考慮效仿伊朗,在馬六甲海峽收“過路費”!新加坡、馬來西亞緊急表態!馬六甲海峽承擔全球約40%的貿易運輸量

印尼財長:考慮效仿伊朗,在馬六甲海峽收“過路費”!新加坡、馬來西亞緊急表態!馬六甲海峽承擔全球約40%的貿易運輸量

揚子晚報
2026-04-25 07:11:14
25萬噸!美國對華封鎖打響,解放軍在南海集結世界最強航母戰斗群

25萬噸!美國對華封鎖打響,解放軍在南海集結世界最強航母戰斗群

軍機Talk
2026-04-24 17:32:10
沒有不透風的墻!沈騰和林允的瓜未必是假的、站姐關站跑路

沒有不透風的墻!沈騰和林允的瓜未必是假的、站姐關站跑路

琴聲飛揚
2026-01-20 14:25:10
普京罕見讓步,中國了結30年心愿!日本徹底慌了,高市遣使求饒

普京罕見讓步,中國了結30年心愿!日本徹底慌了,高市遣使求饒

娛樂的宅急便
2026-04-25 11:50:56
場均9+3,從龐崢麟手里搶走月最佳星銳球員!球迷:吳前該讓位了

場均9+3,從龐崢麟手里搶走月最佳星銳球員!球迷:吳前該讓位了

弄月公子
2026-04-25 23:11:41
浙江隊0比4慘敗成都蓉城,王鈺棟惱羞成怒,揮拳疑似辱罵隊友

浙江隊0比4慘敗成都蓉城,王鈺棟惱羞成怒,揮拳疑似辱罵隊友

姜大叔侃球
2026-04-25 21:27:59
2026-04-26 02:44:49
每日經濟新聞 incentive-icons
每日經濟新聞
中國主流財經全媒體平臺。
1550482文章數 2725525關注度
往期回顧 全部

科技要聞

DeepSeek V4發布!黃仁勛預言的"災難"降臨

頭條要聞

媒體:美軍在中東罕見高密度集結 伊朗開始調整戰術

頭條要聞

媒體:美軍在中東罕見高密度集結 伊朗開始調整戰術

體育要聞

那一刻開始,兩支球隊的命運悄然改變了

娛樂要聞

《我們的爸爸2》第一季完美爸爸翻車了

財經要聞

90%訂單消失,中東旺季沒了

汽車要聞

2026款樂道L90亮相北京車展 樂道L80正式官宣

態度原創

教育
親子
游戲
家居
手機

教育要聞

高校重磅改革:40%課程將AI化

親子要聞

父母的高期待和擔心,正在給孩子制造焦慮!

金發美少女魔王和我是鄰居!新游首曝美女角色太吸睛

家居要聞

自然肌理 溫潤美學

手機要聞

iPhone Ultra機模上手:11mm厚、無長焦,蘋果第一折就這?

無障礙瀏覽 進入關懷版