5月20日消息,據外媒HPCwire報道,英偉達(NVIDIA)近期正式將首款自研Vera CPU 送到了客戶手中,Anthropic、OpenAI、xAI 與Oracle Cloud Infrastructure(OCI)已率先收到首批系統,標志著這款為代理AI 設計的處理器從發布已經走向了實際部署。英偉達大規模與高性能計算副總裁Ian Buck 親自交付了設備,凸顯公司正把AI 基礎設施的競爭重心延伸到GPU之外的CPU 層級。
![]()
據了解,英偉達的這批Vera CPU 已于5月15日送達三家頂尖客戶的AI實驗室:Anthropic 位于舊金山SoMa 的辦公室、OpenAI 的Mission Bay 總部,以及xAI 在帕羅奧圖(Palo Alto)的據點。隨后于5 月18 日送到位于圣塔克拉拉(Santa Clara)的Oracle AI Customer Excellence Center。
英偉達表示,Vera CPU是專為代理式AI 工作負載打造的新型CPU,因為這類模型不只是在“回答”,還要進一步執行工具呼叫、協調流程、擷取長上下文與處理即時工作,對CPU 的需求遠高于傳統推理場景。
英偉達此前已于3月的GTC大會上正式發布了Vera CPU,并將其視為下一個規模可達數十億美元的業務。這次正式交付,也代表者英偉達Vera CPU開始進入生產環境。英偉達指出,Vera CPU 采用88顆英偉達自研Olympus 核心,具備1.2 TB/s 內存帶寬,以及每核心性能提升約50%,目標是在高負載、平行且即時的工作中,提升整體AI 工廠效率與回應速度。
據介紹,Anthropic 由計算負責人James Bradbury 接收Vera CPU系統,并表示擴充算力是模型成長的重要加速器;OpenAI 則由負責計算基礎設施的薩欽·卡蒂(Sachin Katti)接手,英偉達甚至在現場打開機殼展示內部結構。 xAI 方面,馬斯克(Elon Musk)親自聽取說明并詢問核心數、內存配置與散熱設計,該公司正評估將Vera CPU用于強化學習與代理式模擬流程。
Oracle Cloud Infrastructure主管Karan Batta 表示,公司計劃自今年起部署數十萬顆英偉達 Vera CPU,因為代理式AI 需要在大規模下維持持續性能。
英偉達也指出,OCI 是首家在超大規模(hyperscale)規模部署Vera CPU的云端服務商,意味著企業客戶可望取得更接近生產級的代理式AI 基礎設施。
編輯:芯智訊-浪客劍
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.