![]()
經濟觀察報記者 鄭晨燁
“過去的大語言模型,你問它問題,它給你回答,這很酷。但這個階段正在過去。”5月19日,美國超微半導體公司(AMD.US,下稱AMD)董事會主席、CEO蘇姿豐在上海的AMD AI開發者日上說。
在半導體行業,CEO們大多有自己的綽號,英偉達的黃仁勛被稱為“黃教主”,蘇姿豐則被叫作“蘇媽”。蘇姿豐2014年出任AMD CEO時,這家公司已瀕臨破產,市場普遍認為AMD已經沒有翻身機會,12年后的今天,AMD市值接近7000億美元。
蘇姿豐認為AI正在進入Agent(智能體)時代,Agent需要自主拆解任務、規劃步驟、調用外部工具、處理數據、檢查結果,這些編排和調度工作全部由CPU完成,GPU只負責其中“調用模型做推理”的環節。
在蘇姿豐看來,數據中心里CPU與GPU的配比正在從過去的1:4甚至1:8,向1:1靠攏。
兩周前的5月6日,AMD發布了超出市場預期的2026年一季度業績:當季營收約103億美元,同比增長38%;其中數據中心業務收入57.75億美元,同比增長57%。同期,英特爾(INTC.US)數據中心收入51億美元。
根據市場研究機構Mercury Research發布的2026年一季度數據,AMD在全球服務器CPU市場的營收份額達到46.2%,創歷史新高。
在2026年一季度業績交流會上,AMD把2030年全球服務器CPU市場規模預期上調到1200億美元以上,對應年復合增速從此前的18%提升至超過35%。
從1:4到1:1
事實上,在2025年11月的一場投資者交流活動中,AMD給出的CPU市場年復合增速預期還只是18%。但在2026年5月6日的一季度業績交流會上,蘇姿豐表示,基于當前觀察到的需求信號,公司已將這個預期增速上調至超過35%。
在上述業績交流會上,蘇姿豐認為,服務器CPU的需求可以分成三類。第一類是傳統的通用計算需求,增速相對溫和。第二類是作為GPU頭節點的CPU。在數據中心的服務器集群里,通常需要CPU來管理和調度旁邊的GPU運算,這顆CPU就是“頭節點”。第三類是專門為Agent工作流服務的CPU,負責任務編排、數據處理和工具調用。
蘇姿豐表示,在上述三類CPU中,增速最快的是第三類,即專門為Agent工作流服務的CPU。
5月19日,蘇姿豐在上海又談到了這個趨勢。她說,未來每個人可以同時擁有5個、10個甚至100個Agent,“想想你能多做多少事”。
每個Agent運行的時候,都在持續調度CPU。Agent執行任務的流程大致如下:先把目標拆分成若干子任務,然后依次調用不同的AI模型做推理,模型和模型之間需要傳遞數據,中間可能還要去調用搜索引擎或者從企業內部的數據庫獲取額外信息,拿到結果后做匯總檢查,如果發現結果不對,就重新規劃再來一輪。
在上述Agent執行任務的流程中,GPU只在“調用模型做推理”這一步起作用。其余每一步,分配任務、搬運數據、調用外部工具、檢查結果、重新規劃,都由CPU完成。
也就是說,Agent處理的任務越復雜,中間來回的步驟越多,CPU的工作量越大。
在AMD的上海活動現場,零一萬物CEO李開復在與蘇姿豐的對話中亦提到,2024年行業關心的是AI能不能通過考試,2025年是能不能完成工作流,2026年是能不能代替一家公司的某個職能部門。
李開復認為,Agent經濟本質上是推理經濟。和大模型訓練不同,推理對延遲極其敏感,多個Agent之間協作時,響應時間需要控制在100毫秒以內才會流暢。他說,單個Agent的能力有上限,真正的方向是多智能體架構,讓擅長規劃的、擅長執行的、擅長風控的多個Agent分工協作,像一個委員會一樣運轉。
李開復還說了一句:如果你的AI部署沒有改變公司季報上的某個數字,那你做的只是在運營一個AI實驗室。
根據Mercury Research 2026年一季度數據,AMD EPYC(霄龍)服務器CPU按營收計算的全球市場份額達到46.2%,按出貨量計算為33.2%,兩項均創歷史新高。營收份額比出貨量份額高出13個百分點,原因是面向AI和云計算場景的高端EPYC 服務器CPU全球出貨占比在提升,拉高了單顆CPU的均價。
2026年一季度,AMD服務器CPU收入同比增長超過50%。蘇姿豐在上述業績會上給出的二季度指引更高——同比增速超過70%。她同時表示,這個增長勢頭會延續到2026年下半年和2027年。
值得注意的是,CPU需求的快速增長并非AMD的一家之言。英特爾CEO陳立武在2026年一季度業績電話會上也表示,CPU與GPU的比例正在從1:8向1:4走,還會繼續向1:1方向發展。
雖然眼下GPU仍然是AI算力的核心需求,但CPU正在成為AI基建中增速最快的品類之一。
中國機會
李開復在與蘇姿豐的對話中還提及,中國開發者和大模型公司承受不起美國閉源模型所需的算力成本,“出于絕對的必要性,找到了一條路”,即用工程效率和開源協作來彌補硬件資源的不足。
李開復說,中國企業對數據主權的要求很高,不愿意把核心業務數據發送到云端,AMD本地化部署的方案“契合了中國企業的需求”。
對本地部署和數據主權的需求,是AMD在中國市場看到的機會所在。對此,蘇姿豐強調“中國是驅動我們產品路線圖的核心部分”,AMD在北京、上海、深圳和中國臺北設有研發中心,中國團隊超過4000名工程師,上海研發中心是AMD全球規模最大的研發基地之一,EPYC處理器目前為中國主要云服務商的超過700個云實例提供支撐。
值得一提的是,上海這場AI開發者日是AMD首次在北美以外地區舉辦的AI開發者日,現場來了超過2000名開發者。AMD在活動上還宣布,面向中國AI開發者推出免費的GPU開發者計劃,同時與阿里云旗下的魔搭社區(ModelScope)進行合作。
魔搭社區是中國規模最大的開源AI模型托管和開發平臺之一,開發者可以直接在社區的在線開發環境里選用AMD GPU運行AI任務,不需要自己裝驅動或做額外配置。
階躍星辰是當天活動上另一個值得關注的參與者,該公司由前微軟全球副總裁姜大昕創立,總部位于上海,是國內頭部大模型公司之一。該公司核心管理層包括董事長印奇(曠視科技創始人)、CEO姜大昕、首席科學家張祥雨和CTO朱亦博。
朱亦博在當天活動上分享了階躍星辰與AMD的合作進展,該公司今年2月發布的Step 3.5模型大約2000億參數,專門針對Agent任務優化。這個模型經過壓縮處理后,體積大幅縮小,可以在搭載AMD Ryzen AI Max處理器、配備128GB統一內存的筆記本電腦上完整運行,推理速度接近每秒100個token。
每秒100個token是什么概念?這個速度接近甚至超過很多云端大模型在線服務的響應速度,而它跑在一臺可以裝進背包的筆記本上。朱亦博說,未來的方向是端云協同——日常的、對隱私敏感的任務在本地跑,只有特別復雜的任務才需要調用云端大模型,本地推理的token成本趨近于零。
AMD工程師劉暢當天在一臺搭載Ryzen AI Max處理器的筆記本電腦上做了現場演示,用本地部署的通義千問大模型運行了三個Agent協同工作的醫療問診輔助系統,全程沒有連接網絡。
他還演示了開發者的“晨間簡報”Agent,在人睡覺時自動從GitHub、掘金等技術社區抓取當天的重要信息并按優先級排序,GitHub是全球最大的開源代碼托管平臺,掘金是國內開發者常用的技術內容社區。
劉暢說,同樣的工作如果調用云端API每天至少花25元人民幣,本地運行不花錢。
發力GPU
除了越來越樂觀的關于CPU需求的預期,在GPU方面,AMD也在加速推進。
英偉達在數據中心GPU市場的份額目前超過90%,但AMD正在拿到越來越多的大客戶訂單。
AMD的GPU產品線面向數據中心的品牌叫Instinct,對應英偉達的A100、H100等產品。目前AMD即將量產的最新一代數據中心AI芯片是MI450,AMD的服務器CPU產品線品牌叫EPYC(霄龍)。
今年2月,Meta與AMD簽了覆蓋多代產品、總計6吉瓦算力的訂單,包含基于MI450架構的定制GPU和第六代EPYC服務器CPU。此前,AMD還分別與OpenAI、甲骨文達成大規模算力部署合作,其中甲骨文已宣布將部署MI450 GPU。
MI450計劃今年三季度開始向客戶交付,四季度進入大規模出貨。
蘇姿豐在2026年一季度業績會上就曾表示,AMD對2027年數據中心AI業務“實現數百億美元年收入充滿信心”。她還透露,AMD計劃在下半年啟動Helios的量產。
Helios是AMD新推出的機架級AI計算系統,把自家的Instinct AI芯片和EPYC服務器CPU裝進同一套機架里統一調度,和英偉達目前最高端的NVL72機架方案屬于同類產品。
(作者 鄭晨燁)
免責聲明:本文觀點僅代表作者本人,供參考、交流,不構成任何建議。
![]()
鄭晨燁
資深記者。關注新能源、半導體、智能汽車等新產業領域,有線索歡迎聯系:zhengchenye@eeo.com.cn,微信:zcy096x。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.