《科創板日報》5月19日訊(編輯 宋子喬) 當地時間5月18日,英偉達正式宣布,其首款專為Agentic AI(智能體AI)設計的CPU——Vera,已完成對Anthropic、OpenAI、SpaceX AI及甲骨文云的首批交付。
![]()
這款在今年3月GTC大會上亮相的重磅芯片,正式從英偉達的實驗室走向了生產前線,首批交付過程充滿了硅谷特有的儀式感。
上周五,英偉達副總裁伊恩?巴克親自“開車送貨”,第一站是Anthropic位于舊金山SoMa區的辦公室,其計算負責人詹姆斯?布拉德伯里接收了服務器;在OpenAI的總部,巴克甚至掏出螺絲刀,當場打開機箱蓋展示內部結構;當天行程的終點是帕洛阿爾托的SpaceX AI辦公室,埃隆?馬斯克親自簽收,并在現場詳細詢問了核心數量、內存布局及散熱方案,SpaceX AI正計劃將Vera用于強化學習工作負載與智能體仿真管線。
![]()
![]()
![]()
本周一,甲骨文產品管理負責人卡蘭?巴塔在接收現場透露,“甲骨文云基礎設施(OCI)計劃從2026年開始部署數十萬顆英偉達Vera CPU。Agentic AI需要在大規模下維持持續性能,Vera的架構專為高吞吐推理設計,這正是我們為下一代企業AI提供動力所需的效率。”
![]()
Agent AI并非僅靠GPU運行。每個代理沙箱、每次工具調用、每個編排層、每次長上下文檢索操作都需要CPU處理。
Vera旨在滿足Agent AI對CPU的需求,黃仁勛在本屆GTC大會上將其定位為公司"下一個數十億美元級業務"。
與傳統CPU設計追求“核心數量”最大化不同,Vera專為高吞吐推理、工具調用及代碼生成設計。它搭載了88個英偉達自研的奧林巴斯(Olympus)核心,滿載情況下單核性能較前代Grace提升50%,內存帶寬高達1.2 TB/s,同時支持FP8精度,可直接承接AI推理與強化學習任務,無需GPU中轉數據,可大幅提升AI流水線整體效率。
黃仁勛曾指出,當企業坐擁價值500億美元的GPU時,絕不能讓它們因為CPU處理速度慢而閑置。Vera存在的意義,就是當AI智能體需要同時處理規劃任務、檢索長上下文或調用API時,以極致的單線程性能和能效,讓昂貴的GPU滿負荷運轉。
另外,Vera不僅是獨立的CPU產品,它還將作為即將發布的Vera Rubin超級芯片平臺的主機處理器,通過NVLink-C2C與兩顆Rubin GPU配對,形成統一內存架構,以更高的能效為AI工廠供能。這種“CPU+GPU”異構協同的全棧AI算力方案,有望推動英偉達從單一GPU廠商向全棧AI計算平臺提供商轉型。
英偉達表示,Vera的高速核心與互連設計能夠以傳統基礎設施兩倍的能效,完成向GPU饋送數據所需的調度、控制與數據搬移工作。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.