這幾天Meta一系列動作向大家宣告,AI推理的時代正在拉開帷幕。
幾周前,The Information曝出Meta已經(jīng)砍掉了最先進的訓(xùn)練芯片項目Olympus,轉(zhuǎn)頭簽下了科技史上最大的兩筆芯片采購合同。
從Nvidia采購數(shù)百萬顆 GPU(規(guī)模達數(shù)百億美元),向AMD買了6吉瓦 GPU(多年多代合作)。
這周,它又高調(diào)宣布:我們自己造了四款芯片。
Meta工程副總裁直接喊出:" 我們看到推理需求正在爆炸。這是我們當(dāng)前的首要聚焦方向。 "
2025年5月英偉達財報會解讀中,王煜全告訴大家推理需求崛起已經(jīng)勢不可擋,這是英偉達下一個大發(fā)展的機會,也是Agent生態(tài)崛起的信號。
下周的英偉達GTC大會,王煜全會分享哪些新的判斷呢?如果你想第一時間掌握,一定要鎖定前哨科技特訓(xùn)營的周四直播!
接下來,我們一起和你聊聊Meta動作背后的趨勢。
![]()
2025年5月前哨PPT報告
先搞清楚一件事:訓(xùn)練和推理有什么區(qū)別?
如果你把AI模型比作一個學(xué)生:
訓(xùn)練就是上學(xué),讀教材、做習(xí)題、考試、糾錯,最終形成知識體系。成本極高、算力極大、周期極長。
推理就是畢業(yè)后工作,用學(xué)到的知識回答問題、做決策、執(zhí)行任務(wù)。每次調(diào)用成本低,但調(diào)用頻次極高。
過去三年,AI行業(yè)的焦點一直在訓(xùn)練側(cè),誰能訓(xùn)出更大的模型、誰能拿到更多GPU來訓(xùn)練。
但現(xiàn)在,游戲規(guī)則變了。
當(dāng)模型訓(xùn)好之后,面對上億用戶每天使用,推理成本的暴漲已經(jīng)是必然。
每一次你和ChatGPT對話、每一次AI Agent執(zhí)行任務(wù)、每一次Meta在Facebook上給你推薦內(nèi)容,都是一次推理調(diào)用。
Meta自己就有40億用戶。每天產(chǎn)生的推理請求是一個天文數(shù)字。
這就是為什么Meta說"推理需求正在爆炸"。
![]()
Facebook 數(shù)據(jù)中心機房內(nèi)部(早期自建數(shù)據(jù)中心)Meta既要又要的三層戰(zhàn)略
表面看,Meta的行為很矛盾:剛放棄自研芯片,花了幾百億買Nvidia和AMD的芯片,轉(zhuǎn)身又要自己造?
其實一點都不矛盾。這是目的明確的三層芯片戰(zhàn)略:
![]()
![]()
AMD 與 Meta 擴大合作
Meta 副總裁說得很直白:"這(自研+采購)讓我們在硅供應(yīng)上有更多多樣性,在采購上有更多的籌碼(leverage),一定程度上抑制了價格波動。"
翻譯成大白話:Nvidia你漲價?沒關(guān)系,我有AMD備選!AMD交不了貨?沒關(guān)系,我自己能造。
這是在Nvidia的定價權(quán)上插了一刀。
說到這可能有人會問,前面訓(xùn)練芯片失敗了,為什么推理芯片有機會?
原因也很簡單,訓(xùn)練芯片的技術(shù)壁壘太高了,除了要搞定萬卡級別的并行計算,還要支持FP32/FP16/BF16/FP8各種精度格式,什么都沒做,看到這些專業(yè)名詞是不是就覺得頭大?
到這還沒完,還要搞定Nvidia在這個領(lǐng)域20年的軟件生態(tài)(CUDA)。
但推理芯片完全是另一個故事:模型已經(jīng)訓(xùn)好,要做的就是讓它跑起來就行,只要符合需求,不用搞什么萬卡集群,也不需要支持多種精度格式,還能針對模型優(yōu)化芯片,大幅降低成本。
這正是Google(TPU)和Amazon(Inferentia)走過的路。
Meta的選擇非常理性:訓(xùn)練交給Nvidia(花錢買最好的),推理自己做(自己造最省的)。
關(guān)鍵細節(jié):每6個月一款新芯片
Meta自研芯片最重要的其實是這句:"每6個月發(fā)布一款新芯片。對任何芯片公司或團隊來說,這都是非常罕見的節(jié)奏。"
為什么這么急?Meta的AI基建擴張速度太快了:
$1350億年度AI資本開支(2026年)
5吉瓦的Hyperion超級數(shù)據(jù)中心正在路易斯安那州建設(shè)
另有俄亥俄州和印第安納州兩個大型數(shù)據(jù)中心在建
據(jù)Bloomberg報道,Meta還在接盤OpenAI/Oracle退出的Stargate德州數(shù)據(jù)中心
每建一個數(shù)據(jù)中心,就需要裝滿芯片。如果全用Nvidia GPU,成本將是天文數(shù)字。
而MTIA芯片由臺積電代工,設(shè)計完全由Meta控制,預(yù)期使用壽命5年以上。
這是一道簡單的數(shù)學(xué)題:40億用戶 × 爆炸式推理需求,既然在基建上已經(jīng)花了1350億美元,再花點錢自研推理芯片更劃算。
"推理為王"時代已經(jīng)到來?
把Meta今天的動作放到整個產(chǎn)業(yè)背景里看,一個清晰的趨勢浮現(xiàn)了:
所有巨頭都在從"訓(xùn)練優(yōu)先"轉(zhuǎn)向"推理優(yōu)先"。
![]()
為什么所有人同時轉(zhuǎn)向推理?王煜全最近用三講直播,為大家梳理了AI行業(yè)正在發(fā)生的拐點:
階段性的模型瓶頸:由于一個硬件技術(shù)限制,模型性能進展暫時放緩
Agent時代到來:掃描787家Agent公司,呈現(xiàn)了AI的幾個超級賽道
商業(yè)化需求,上下游都必須依靠降低成本獲取收益
簡單說:訓(xùn)練決定你的AI有多強,推理決定你能不能靠AI賺錢。
下周GTC前瞻:Nvidia的反擊
3月16日,Nvidia GTC 2026將在圣何塞開幕。3萬人現(xiàn)場參會,190個國家線上觀看。
老黃發(fā)出預(yù)告要"震驚世界"。
根據(jù)我們的研究看:Nvidia的策略已經(jīng)非常清晰,你們想自研推理芯片?可以。但我會讓推理芯片的性能天花板永遠高出你一截。
所以老黃這次還能不能拿出震驚我們的產(chǎn)品呢?
歡迎加入前哨科技特訓(xùn)營,下周四晚8點,王煜全與你一起瞭望前沿。
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.