![]()
4月22日,谷歌于拉斯維加斯召開Cloud Next 2026大會,大會首先展示,谷歌目前有75%的新增代碼由AI生成(并由工程師審閱批準),谷歌已經進入了AI Agent時代,并推出Workspace Intelligence、Gemini企業級Agent平臺等一系列AI Agent產品。
當然最吸引資本市場注意力的是,谷歌推出了第八代TPU——這是十年以來,谷歌首次將訓練ASIC與推理ASIC拆分,推出面向訓練的TPU 8t和面向推理的TPU 8i,搭配自研Axion Arm CPU,構建極致高效的算力體系。其中,尤其以TPU 8i推理ASIC,受到市場格外關注。
![]()
圖片說明:谷歌TPU 8t與TPU 8i,數據來源于推特
推理像個無底洞,吞噬著一切算力
進入2026年,以OpenClaw為代表的AI Agent類產品、和以Seedance、Nano Banana為代表的多模態產品,均進入規模化應用階段,驅動全球算力需求呈現爆發式增長。4月22日谷歌CEO表示,通過客戶直接使用API的方式,谷歌的模型每分鐘處理超過160億token,而上季度是100億token,環比增長60%,直觀體現出人類對AI工具的需求正以超預期的速度增長。
而2026年僅僅是AI Agent的一個開端,是少數人初步使用Agent,Agent滲透率極低的初期;未來還將伴隨Agent門檻降低、滲透率逐步提升、人與Agent共存的階段;最后進入完全由Agent主導的階段。毫無疑問,每躍升一個階段,都將呈現Token消耗量的指數級增長。
![]()
圖片說明:谷歌TPU 8t與TPU 8i,數據來源于騰訊開發者社區
然而,盡管目前AI Agent還處在一個非常早期的階段,但作為一名普通消費者,即便你不是專業投資者,你也能夠明顯感受到:算力嚴重不夠用了。
很簡單,當你現在使用Gemini、Claude或者GPT的時候,你會發現這些大模型的智商越來越低了,遠遠不如以前好用了。例如回答問題時輸出的Token越來越短了,回答越來越偷懶了,上下文也不記憶了,錯誤率越來越高了,幻覺也越來越嚴重了,更糟糕的是費用還越來越貴了。
當然,從專業投資者的角度,還需要用量化數據來審視這一現象。根據Ornn Compute的數據,今年以來,英偉達全系列GPU在云端數據中心的現貨租賃價格均大幅上漲,Blackwell系列芯片單小時租金已達4.08美元,較兩個月前的2.75美元上漲48%
SemiAnalysis的數據顯示,H100的一年期租賃合約價格已由2025年10月的低點約1.70美元/小時/GPU提升至2026年3月的2.35美元/小時/GPU,漲幅近40%。
更夸張的是,甚至連“老古董”A100的租賃價格也在上漲,截止到3月底達1.48美元/小時/GPU,環比上漲+6.5%(相比之下,2月份環比上漲+3.7%,1月份環比上漲+1.5%),標志著環比漲幅連續第三個月加速。
![]()
圖片說明:H100價格走勢,數據來源于SemiAnalysis
當2020年發布的A100、2022年發布的H100還在因為供不應求而漲價時,那么最開心的一定是那些普遍采用5年直線折舊的NeoCloud企業,那些殘值為“零”的老古董正在發光發熱。
資本市場已經投出了這一票,無論是美股市場的CoreWeave、Nebius等等,還是A股市場的協創數據(300857.SZ)、宏景科技(301396.SZ)、利通電子(603629.SH)等等,其股價都走出了完全不遜于“光”的磅礴氣勢。
![]()
圖片說明:年初至今,NeoCloud公司的股價完全不輸于EML公司,數據來源于Wind
毫無疑問,推理需求正如同無底洞一樣,吞噬著所有的算力產能,也難怪馬斯克要發出“未來AI芯片將嚴重不足”的感慨了。
![]()
圖片說明:特斯拉啟動Terafab芯片工廠的原因,數據來源于新浪財經
把訓練和推理分開做,正在成為行業共識
面對指數級增長的推理需求,英偉達從去年12月以200億美元收購了Groq,LPU甚至被黃仁勛認為是重要性不亞于2019年收購Mellanox的里程碑事件,再到近日谷歌推出第八代TPU拆分訓練ASIC和推理ASIC,兩大巨頭殊途同歸,都指向了一件事情:推理ASIC的時代來了。
訓練和推理,前者是在制造“硅基大腦”,后者是在使用“硅基大腦”,因此顯而易見的是,訓練和推理對于算力的需求并不完全相同:訓練拼的是力大飛磚的單卡算力(比如每秒的浮點運算次數)、是極限的互聯集群規模(幾十萬卡甚至上百萬卡集群)等等;而推理拼的是內存訪問效率(如SRAM做的更大,緩存更多數據就近使用)、ASIC間的通信速度(減少芯片間的通信延遲)等等。
![]()
圖片說明:谷歌TPU 8t與TPU 8i的核心參數差異,數據來源于華泰證券
毫無疑問,推理需求將指數級增長,且其需求量終將是訓練需求的很多倍,這一點已基本成為行業共識,在這一共識之下,推理ASIC的崛起也是水到渠成,GPU不會落幕,只是可預見的未來,GPU的行業增速很難高于推理ASIC。
最后,推理ASIC的崛起,除了利好資本市場耳熟能詳的EML、光模塊、NPO、MPO、OCS等光通信板塊外,國產的一批優秀ASIC相關上市公司未來的業績增速也非常值得期待。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.