今天,全球經濟正在被一種全新的價值單位——“Token”(詞元)所重構。這個最初僅用于身份認證的計算機概念,如今已躍升為智能經濟的度量衡、算力的價值憑證,甚至被譽為驅動數字世界的“新石油”。
過去幾年,AI算力中心的核心關注點在于通過GPU/DCU等加速芯片堆疊峰值算力。然而,隨著算力經歷“Token化”變革,算力不再僅僅是訓練一次模型的能力,而是每秒生成多少個Token的服務能力。此時,常常被忽視的CPU,正重新回到舞臺中央,成為決定AI算力效率與覆蓋廣度的關鍵。
在2026年智博會中,海光信息總裁助理兼智能計算產品部總經理 系統地闡述了這一趨勢。他指出,CPU其實是現在數據中心發展非常關鍵的方向。
Token化驅動CPU需求增長
杜夏威表示,大模型和算力Token化帶來的直接結果是受眾和用戶群體的數量級躍升。為了讓Token能夠觸達各行各業的業務場景,企業不能完全依賴于當前相對“重型”的AI芯片或算力中心。
在這一背景下,CPU的作用正變得越來越重要。從數據中心層面來看,CPU在支撐模型推理與訓練、任務調度以及各類形態的計算場景中,都發揮著關鍵作用。
隨著智能體技術的成熟和端側設備的普及,CPU將承擔更多實時、復雜的邏輯處理任務,其市場需求正在快速放大。
CPU與GPU協同發展是必然趨勢
杜夏威在會議上強調,CPU與GPU協同發展是必然趨勢。CPU不僅有助于保障昂貴的GPU算力被高效利用,也是算力Token化觸達更廣泛場景的重要支撐。
他指出,隨著大模型參數量持續擴大,混合專家模型(MOE)成為主流架構,行業不得不將KV Cache以及部分算力和模型參數Offload到主機的CPU端。
這一變化意味著,無論是在智能體與端側應用領域,還是在數據中心內部,構建CPU與GPU緊密耦合的系統化架構都將成為重點發展方向。兩條路徑的共同推動,將使行業對CPU的依賴和需求持續走高。
海光既有CPU,也有DCU,那么針對不同廠商的CPU或GPU是否有機會與海光產品協同使用?杜夏威給出了明確答復:這種開放生態的構建正是海光戰略考量的一部分。
他透露,目前海光CPU不僅與自家的DCU進行組合搭配,也與生態內各類第三方AI芯片完成了產品化的組合適配。這一做法有助于推動國產計算生態形成良性循環,各方在協作中互相學習、共同成長。對海光而言,與伙伴的深度合作也成為推動自身產品與技術快速迭代的有效動力。
“云端協同”的完整布局
杜夏威介紹,海光在面對不同客戶群體,服務方式需要因需而異。一方面,海光依托光合組織及其重要成員構建的算力網絡,通過云上算力模式服務中小微企業、個人開發者乃至C端用戶,實現算力的便捷觸達。另一方面,通過開放的通用計算架構,推動算力系統在本地落地,重點覆蓋對Token消耗負載較高的“重型”用戶。
這兩種模式未來將形成“云端協同”的完整布局。云端提供高效便捷的Token服務,適合快速獲取和使用算力資源的場景;而私有化落地方案則面向那些對數據敏感度較高、需要與自身業務深度集成的行業客戶。
杜夏威特別強調,私有化部署的價值不僅在于保障用戶數據資產安全,更能夠幫助企業在AI轉型過程中,將原有歷史數據沉淀為核心數據資產。同時,私有化布局還便于企業實現傳統業務與Token化能力的深度整合。
隨著越來越多的用戶對私域數據的安全性高度關注,這一場景已經不再是探索階段,而是已經進入實質落地階段。杜夏威同時坦言,雖然數據中心方向已呈現明確增長趨勢,但目前尚未達到“拐點”,仍處于快速增長期。AI終端設備能夠與云端算力網絡高效互動,進一步拓展了算力的應用邊界。
在終端合作方面,海光已與聯想開天等多家終端廠商建立合作。
CPU逐漸走到臺前
從云端協同的算力布局,到開放多元的芯片生態,再到終端側AI工作站的加速落地,海光的CPU戰略正在圍繞“全覆蓋”和“深耦合”兩條主線快速推進。在國產替代與AI普及的雙重浪潮下,CPU正從幕后走向臺前,成為支撐千行百業智能化轉型的關鍵基礎設施。
針對市場關心的缺貨問題,杜夏威回應稱,目前并不存在明確的缺貨狀況。以海光為例,公司始終保持充沛的產品供應狀態。
來源:電子工程世界(EEWorld) 作者:付斌
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.