真是風水輪流轉
前幾年,大模型剛火那陣子
全網都在追捧GPU、唱衰CPU
![]()
可最近你會發現,這苗頭不對了
很多AI項目,開始大量采購CPU
圈里人士評價:CPU,王者歸來!
![]()
CPU出貨瘋狂起量
開始強勢回到AI基礎設施的C位
與GPU分庭抗禮
![]()
今天,我們簡單討論一下
為什么CPU能重回C位?
AI上半場,訓練大模型階段
GPU們的確唱主角
千卡萬卡集群,不計成本地堆起來
GPU大廠們一個個都橫著走
![]()
現在AI下半場,企業真正落地AI時候
推理場景占據主流
各種智能體和AI應用要上線
算力搭配就需要更加合理
![]()
所以,今年的很多AI項目采購中
CPU+GPU配比,正在變化
以一個智算中心集群為單位
CPU與GPU的部署比例
已經從1:8猛拉到了1:4甚至1:1
![]()
這種配比的改變
是因為工作負載的需求變了
推理階段尤其企業級推理
用戶請求是實時的、碎片化、高并發
每個請求都要經過一系列復雜流程
![]()
這對擅長大規模矩陣計算的GPU來講
實屬一臉懵逼、有勁沒處使
而對CPU來講,恰恰是它的舒適區
控制、調度、邏輯判斷、數據搬運、系統協調
每項工作,CPU都有能力精準命中靶心
![]()
同時,隨著龍蝦類智能體的火爆
CPU的工作量進一步暴增
一次智能體任務
可能觸發幾十上百次工具調用
這背后的爛攤子都需要CPU收拾
![]()
另外,特別重要的一點
智算集群,好比一列高鐵
GPU好比每節車廂,雖然擁有動力
但他們都離不開車頭帶
![]()
機頭就像車頭一樣
是所有AI服務器的指揮官
接請求、調資源、理數據、管網絡、連存儲、控全局
機頭這事兒,非CPU莫屬
![]()
一旦AI落地企業生產環境
穩定性+安全性,立馬變成第一硬指標
用戶擔心的是這些事
![]()
這時候,CPU的價值就出來了
這些安全保障層面的關鍵能力
很多都離不開CPU平臺來支撐
![]()
除此之外,還有一些場景
比如中小模型推理和嵌入式模型
完全不需要GPU參與
不是GPU買不起,而是CPU更有性價比
![]()
好了,我們簡單總結下
CPU重回C位,且值得長期看好
原因無非這么幾點
![]()
- ①接請求:用戶請求進入 AI 平臺,CPU 負責網關、鑒權、限流、負載均衡、會話管理。
- ②管流程:Agent 的任務拆解、工具調用、API 編排、業務邏輯執行,主要由 CPU 承擔。
- ③調資源:GPU 調度、模型實例分配、批處理合并、隊列管理、容器編排,都離不開 CPU。
- ④搬數據:RAG 檢索、數據庫訪問、文件讀取、網絡傳輸、數據預處理、結果后處理,CPU 是核心參與者。
- ⑤管內存:長上下文、KV Cache、參數緩存、冷熱數據分層,需要 CPU 協調內存、顯存和存儲。
- ⑥連設備:網卡、DPU/IPU、NVMe SSD、PCIe/CXL 設備、存儲系統,都要通過 CPU 平臺組織起來。
- ⑦保穩定:監控、日志、故障恢復、資源隔離、安全策略、權限審計,主要靠CPU,GPU白瞎。
- ⑧跑小模型和非GPU任務:很多embedding、規則引擎、中小模型推理、業務插件、數據清洗,CPU更便宜、更靈活。
聊到這個地步
很多老鐵就會問
![]()
嘿嘿,英特爾剛剛給大家打了個樣
還冒著新鮮熱氣呢
英特爾至強6+處理器
基于英特爾 18A 制程打造的
新一代數據中心CPU
為高密度而設計、為AI而生
![]()
我們結合前面智能體時代CPU的需求
來看看為啥英特爾至強6+處理器很給力
我把這份“給力”,落到了四個維度
算力、存力、連接力、保障力
![]()
1、算力
至強6+處理器擁有超高核心數
單CPU最高達到恐怖的288個核心
![]()
不得不說,核多就是猛
基于這款CPU
業界天花板級的超高密度服務器
已經就位!
![]()
具體到在AI落地場景上
單柜能支持超過10萬+智能體部署
這里面,用了英特爾至強6+處理器的
「4倍超配」黑科技
每個核能跑4個“龍蝦殼”
(即支撐4個類OpenClaw智能體實例)
單柜46080核,輕松跑10萬+智能體
![]()
不僅如此,至強6+處理器還提供
提供從芯片級到應用級的通透監控
完美支撐這一柜子“龍蝦”穩定運行
![]()
別看至強6+能效核處理器這么猛
至強6性能核也一直是
智算中心“機頭”的扛把子
![]()
上圖的這個“金牌火車頭”
由云尖信息打造,專拉高密GPU車身
過去,2顆CPU帶8張GPU就是極限
現在,至強6打破天花板
用2顆CPU拉起16張GPU嗖嗖跑
![]()
這個金牌機頭
通過引入全新的拓撲架構
把“內存墻”拆得一干二凈
整機訓推性能大幅提升
![]()
面對智能體時代的算力墻、內存墻
英特爾至強6家族
已經為大家準備好了強力破墻工具
2、存力
大規模推理和智能體時代
AI存儲的需求也在暴漲
新華三基于英特爾至強6處理器打造了
H3C UniStor X20000系列
高密度全NVMe存儲方案
![]()
如此強悍的性能
背后是至強6家族的四大支撐
①PCIe通道多,帶盤能力極強
單節點2個至強6性能核處理器
可掛載24—32塊NVMe SSD
每塊盤獨享PCIe5.0×4超高帶寬
把單節點存儲吞吐推到物理極限
![]()
②集成QAT加速,為CPU減負
作為集成在至強平臺里的搬磚小能手
QAT接管海量數據的壓縮與加密任務
大幅提升存儲服務器數據處理性能
![]()
③芯片級SPDK優化,進一步提升性能
讓數據繞過內核,直達NVMe,消滅卡頓
這波操作也讓存儲更加適配智能體時代
完美契合Agent零碎、高頻的數據訪問特性
![]()
說白了,要玩轉智能體和大規模推理
存力相當重要
而英特爾至強6家族,恰恰就是
「降本增效、打通存力墻」的后臺大管家
3、連接力
AI集群中,就算有再大存力和算力
網絡連接拉胯,也會續不上勁兒
隨著至強6+的重磅登場
英特爾也甩出了終極“網絡外掛”
以太網E835網卡 + IPU聯合方案
![]()
英特爾以太網E835控制器
支持Veloci GDA 和GDS技術
實現GPU-to-GPU跨節點直通
為大模型緩存搬運修好了高架快速路
![]()
同時,IPU也沒閑著
它在后臺默默地幫CPU扛起網絡雜活
讓CPU算力100%釋放出來
專心當車頭、搞計算、干大活
![]()
4、保障力
前面講過,AI進入企業生產環境后
不能只看性能,安全和穩定同等重要
英特爾至強6家族內置
硬件級機密計算技術
用來保護運行中的數據和模型
![]()
并增強AI集群的RAS能力
確保99.999% 的企業級可用性
![]()
這種「零信任級」硬件保護和RAS能力
助力云大廠打造出更加安全的AI云服務
滿足客戶生產級AI業務上云
當 AI 進入下半場
拼的是整個智算中心的協同效率
算力、存力、連接力、保障力,全力以赴
這些力,離不開一顆給力的CPU
CPU,正在用鐵一般的事實向全行業宣告
“你大爺依舊是你大爺”
王者歸來,C位非我莫屬
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.