網易首頁 > 網易號 > 正文 申請入駐

谷歌第八代TPU雙艦齊發,終結AI推理延遲,讓智能體實現隨叫隨到

0
分享至

今天,谷歌在 Cloud Next '26 峰會上發布了其第八代 TPU 架構(TPU 8t 與 TPU 8i),TPU 8t 主攻訓練,TPU 8i 主攻推理,將在 2026 年晚些時候上市。第八代 TPU 采用申請制,Google Cloud 用戶如需使用,需要在官網提交登記需求。原生 PyTorch 對于 TPU 的支持等軟件棧功能,目前也處于 Preview 階段。眼下,谷歌是在小范圍內開放給特定合作伙伴和早期客戶進行測試,旨在管理早期算力資源的分配。

TPU 8t 憑借 SparseCore 核心與 Virgo 網絡拓撲,將大規模預訓練效能推向極致,以 2.7 倍的單位成本算力改寫了模型訓練版圖。

TPU 8i 專為實時推理與復雜決策而生,其通過 CAE 加速引擎與新型 Boardfly 拓撲結構,在一定程度上擊碎了長上下文推理的延遲瓶頸,讓 AI 從單一的下一個詞預測進化到場景模擬和深度邏輯推理,AI 回應將變得更及時、更連貫。在谷歌自研 Arm Axion 架構 CPU 的算力支持下,這套架構還實現了兩倍的能效飛躍。

第八代 TPU 將開放給所有谷歌云客戶使用。TPU 8t 和 TPU 8i 支持主流的 AI 框架比如 PyTorch 和 JAX。開發者不需要學習新的編程語言,使用自己熟悉的工具就能直接調用 TPU 算力。谷歌還提供了開源的參考模型代碼,讓用戶可以快速上手。


(來源:谷歌)

我們可能都遇到過 AI 反應很慢的情況,要轉好幾圈才給出答案,很多時候問題不在于網速,其實是處理請求的芯片距離太遠。我們的聲音數據要跑到遠處的數據中心,在那里排隊、計算、再傳回來,一來一回時間就過去了,此次第八代 TPU 正是為解決這個問題而來。

當前,AI 訓練和 AI 推理對于芯片的要求越來越不一樣。訓練需要極致的算力,這要求芯片之間能夠高效地協同工作。推理則需要極低的延遲,這要求芯片能夠快速處理多個請求,并且還得盡可能地省電。于是,第八代 TPU 分成了 TPU 8t 和 TPU 8i。

TPU 8t:專為大規模 AI 訓練設計

TPU 8t 主要負責訓練,它被設計得可以成千上萬個連在一起工作。谷歌用一個名為 3D Torus 的網絡把其連接起來,組成了一個超級計算集群。一個單獨的超級計算單元里就裝了 9600 顆 TPU 8t 芯片,一起共享高達 2PB 的內存,總共能夠提供高達 121 ExaFlops 的算力。


圖 | TPU 8t ASIC 框圖(來源:谷歌)

TPU 8t 還用到了 SparseCore 這一技術。現在的很多大模型用的是混合專家技術,每次計算只激活一小部分參數,混合專家技術雖然能效高,但是會產生大量不規則的內存訪問,這讓普通芯片招架不來。

而谷歌此次使用的 SparseCore 技術專門負責處理這種任務,比如它可以讓負責核心數學運算的矩陣乘法單元專心做自己擅長的事情,通過這樣互相配合的方式,芯片就不會閑置,始終保持滿負荷運轉的狀態。

TPU 8t 還改進了數據傳輸方式,用上了谷歌自研的 Virgo 網絡,把芯片之間的通信帶寬翻了一倍,把連接到外部數據中心的帶寬提升了四倍。TPU 的 Direct Storage 技術允許芯片直接從高速存儲里讀取數據,從而能夠繞開 CPU 這個“中間人”。

這樣一來,喂給芯片的數據流就不會斷,訓練速度能提升十倍。在能耗上,TPU 8t 相比上一代的每瓦性能提升了兩倍。訓練超大模型時,它的性價比提升了 2.7 倍。對于需要訓練幾百甚至上千億參數模型的團隊來說,這意味著能夠節約大量的時間和電費。


圖 | TPU 8t 機架級與 Virgo 光纖通道的連接(來源:谷歌)

TPU 8i:能快速響應需求和處理長上下文推理

相比之下,TPU 8i 主打一個反應極快,它專門為那些復雜的、需要多步推理的問題而生。當你和 AI 聊一個很長的上下文,比如討論一個復雜的心理問題,那么 AI 需要記住之前所有的對話內容。

上述對話記憶被存放在一個叫 KV Cache 的地方,而 TPU 8i 配備了 288GB 的高帶寬內存和 384MB 的超大片上 SRAM,后者比上一代多了三倍,因此它可以把整個對話的上下文都裝進芯片內部,不用頻繁地去外面拿數據,處理速度自然也就變快了。


圖 | TPU 8i ASIC 框圖(來源:谷歌)

TPU 8i 的另一項關鍵創新是集體通信加速引擎。當大模型進行推理的時候,尤其是在處理混合專家模型時,芯片之間需要頻繁地同步數據和匯總結果,這個過程叫做集體通信。要是做得不好,芯片的大部分時間都在干等。

TPU 8i 的 CAE 專門負責加速這個環節,把延遲降低了五倍。它還把芯片之間的互聯帶寬翻了一番,達到了 19.2 Tb/s。

與此同時,谷歌還為 TPU 8i 設計了一種名為 Boardfly 的全新網絡連接方式。傳統的 3D Torus 網絡在連接大量芯片時,數據包在芯片之間傳輸時需要經過很多跳。Boardfly 通過借鑒 Dragonfly 拓撲的思想,利用增加長距離直連鏈路的方式,把由 1024 顆芯片組成的系統里的最遠的兩個芯片之間的通信距離從 16 跳減少至 7 跳,降低了 56%,讓任何兩顆芯片之間都能更快地交換信息,助力更好地處理復雜的推理任務。

這些改進讓 TPU 8i 在推理任務上的性價比比上一代提升了 80%。對于一家企業用戶來說,將能用同樣的成本服務將近兩倍的客戶。谷歌還為 TPU 8i 搭配了自研的 Axion ARM 架構 CPU,并做了針對性優化,讓系統運行得更順暢。


圖 | TPU 8i 分層式 Boardfly 拓撲結構(來源:谷歌)

眾所周知,谷歌這套 TPU 體系已經運行了很多年,谷歌的 Gemini 正是跑在 TPU 之上。如前所述,他們這次將第八代 TPU 開放給了所有云客戶,旨在為全球開發者構建一座通往更高 AI 想象力的算力基石。總的來說,在智能體時代這種芯片設計上的精細化分工,將有利于打造一個隨叫隨到、反應靈敏的 AI 應用。

參考資料:

https://blog.google/innovation-and-ai/infrastructure-and-cloud/google-cloud/eighth-generation-tpu-agentic-era/

https://cloud.google.com/blog/products/compute/tpu-8t-and-tpu-8i-technical-deep-dive/

https://www.bloomberg.com/news/articles/2026-04-22/google-cloud-releases-new-tpu-chip-lineup-in-bid-to-speed-up-ai

https://x.com/patrickmoorhead/status/2046928498292412771

排版:胡巍巍

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
美海軍部長突然離職:曾深夜給特朗普發短信討論工作,赫格塞思不滿其“越級匯報”,兩人關系緊張;越南裔老兵上位,有25年海軍服役經歷

美海軍部長突然離職:曾深夜給特朗普發短信討論工作,赫格塞思不滿其“越級匯報”,兩人關系緊張;越南裔老兵上位,有25年海軍服役經歷

揚子晚報
2026-04-23 14:23:42
CBA公司做出1個重要決定,更改季后賽賽制!

CBA公司做出1個重要決定,更改季后賽賽制!

體育哲人
2026-04-23 18:50:04
狄龍:季后賽應該像喬丹、詹姆斯一樣強硬,亞歷山大有點脆弱

狄龍:季后賽應該像喬丹、詹姆斯一樣強硬,亞歷山大有點脆弱

懂球帝
2026-04-23 13:41:07
再見了,開拓者,賽季離隊第一人,楊瀚森更難了!

再見了,開拓者,賽季離隊第一人,楊瀚森更難了!

體育新角度
2026-04-23 15:51:56
姐夫手術我墊50萬,他們不提還錢,今年他二次病危,姐撥99通電話

姐夫手術我墊50萬,他們不提還錢,今年他二次病危,姐撥99通電話

千秋文化
2026-04-20 19:48:09
最新法規4.30號執行!帶煙出門要留心!不抽不用,也可能違規被罰

最新法規4.30號執行!帶煙出門要留心!不抽不用,也可能違規被罰

復轉這些年
2026-04-22 20:23:34
A股:今日大幅放量下跌,原因是什么?做好準備,主力將有大動作

A股:今日大幅放量下跌,原因是什么?做好準備,主力將有大動作

虎哥閑聊
2026-04-23 11:43:39
智能汽車的下一個十年,地平線用一顆“星空”照亮

智能汽車的下一個十年,地平線用一顆“星空”照亮

賽博汽車
2026-04-23 13:32:15
曝科爾引球隊內部不滿!他可以離開勇士 但他舍得離開庫里嗎?

曝科爾引球隊內部不滿!他可以離開勇士 但他舍得離開庫里嗎?

羅說NBA
2026-04-23 19:17:36
曾高喊打敗美帝:如今卻全家跑去美國,84歲活成這樣,引人熱議!

曾高喊打敗美帝:如今卻全家跑去美國,84歲活成這樣,引人熱議!

小莜讀史
2026-04-20 22:58:35
忍耐3天,解放軍動真格了!日本意識到嚴重性,中國徹底丟棄幻想

忍耐3天,解放軍動真格了!日本意識到嚴重性,中國徹底丟棄幻想

說歷史的老牢
2026-04-21 16:33:53
人人都不看好,偏偏又不爭氣!斯佳輝岌岌可危,種子恐他一人出局

人人都不看好,偏偏又不爭氣!斯佳輝岌岌可危,種子恐他一人出局

叮咚體壇
2026-04-23 09:51:20
不打了!第3次腿筋拉傷!這可是雷霆的首發核心

不打了!第3次腿筋拉傷!這可是雷霆的首發核心

籃球實戰寶典
2026-04-23 18:20:06
首輪G2打完,這2支球隊最有冠軍相,火箭偽強隊,3支球隊基本出局

首輪G2打完,這2支球隊最有冠軍相,火箭偽強隊,3支球隊基本出局

毒舌NBA
2026-04-23 12:58:11
經過伊朗這一戰,中美之間可能至少50年內不會爆發戰爭

經過伊朗這一戰,中美之間可能至少50年內不會爆發戰爭

流史歲月
2026-04-17 23:20:03
中國3月Swift人民幣在全球支付中占比為3.1%

中國3月Swift人民幣在全球支付中占比為3.1%

每日經濟新聞
2026-04-23 09:08:05
1比4逆轉后特魯姆普放話:趙心童不是最大威脅,50倍丁俊暉才是

1比4逆轉后特魯姆普放話:趙心童不是最大威脅,50倍丁俊暉才是

生活新鮮市
2026-04-23 18:37:10
紀委的朋友透露:貪官被查之前都有這三個前兆

紀委的朋友透露:貪官被查之前都有這三個前兆

細說職場
2026-04-23 15:31:19
情侶在瑞士雪山頂“撒歡”,就這么被全世界直播了···

情侶在瑞士雪山頂“撒歡”,就這么被全世界直播了···

新歐洲
2026-04-21 19:37:05
老人擠公交插隊被乘客撞倒離世 家屬起訴公交公司索賠70萬被駁回

老人擠公交插隊被乘客撞倒離世 家屬起訴公交公司索賠70萬被駁回

封面新聞
2026-04-23 14:00:02
2026-04-23 19:51:00
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技評論獨家合作
16616文章數 514897關注度
往期回顧 全部

科技要聞

馬斯克喊出"史上最大產品",但量產難預測

頭條要聞

女生赴泰過潑水節被賣電詐園 家屬遭威脅報警就"輪奸"

頭條要聞

女生赴泰過潑水節被賣電詐園 家屬遭威脅報警就"輪奸"

體育要聞

萊斯特城降入英甲,一場虧麻了的豪賭

娛樂要聞

王大陸因涉黑討債被判 女友也一同獲刑

財經要聞

關于AI算力鏈"瓶頸" 這是高盛的最新看法

汽車要聞

令人驚艷的奇瑞車 風云A9可不只是樣子貨

態度原創

游戲
旅游
藝術
公開課
軍事航空

《黑旗》RE美女胸變小?原版竟然有這么多大膽穿著!

旅游要聞

偶遇大理天子莊,村后山頂孤伶伶一屋一樹,難道它叫“天子廟”?

藝術要聞

她辭掉高管,花20年自費100萬:這本書,救了山西“正在消失的壁畫”

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

人民海軍成立77周年 主力艦艇亮相上海

無障礙瀏覽 進入關懷版