无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

AI與HPC發展所需的內存技術

0
分享至

(本文編譯自Electronic Design)

在過去二十年間,用于高性能計算(HPC)與人工智能(AI)系統的處理器,其原始計算能力以驚人的速度提升。圖1展示了這一趨勢:同期XPU浮點性能提升超過90,000倍,而DRAM帶寬與互聯帶寬僅提升約30倍。


圖1:20年間XPU性能與互聯帶寬的增長情況。

計算能力與數據傳輸能力之間日益擴大的差距——通常被稱為內存墻與I/O墻——已成為制約系統可實現的實際性能的最主要因素之一。

對于系統設計者而言,這種失衡直接導致計算資源利用率不足、功耗上升以及架構復雜度不斷增加。因此,內存帶寬與封裝技術對于人工智能性能的擴展,已變得與晶體管密度或核心數量同等關鍵。

HBM是現代人工智能架構的基礎

為應對這些帶寬挑戰,高性能計算與人工智能系統越來越多地采用基于芯粒(Chiplet)的解耦式架構。盡管LPDDR與DDR內存仍發揮著重要作用,但HBM已成為當前可用的最高帶寬DRAM解決方案,也是現代加速器的關鍵支撐技術。

HBM器件由底部的緩沖(或基礎)裸片以及上方的多個3D堆疊DRAM層構成。緩沖裸片采用超細間距微凸點,使得內存堆疊能夠通過硅中介層或硅橋等先進封裝技術與專用集成電路(ASIC)進行協同封裝。

在JEDEC的HBM工作組嚴格標準化的支持下,HBM已成為量產系統中最成功、應用最廣泛的芯粒集成案例之一。圖2展示了典型的HBM DRAM堆疊通過硅中介層與ASIC連接的側視示意圖。


圖2:HBM DRAM與ASIC連接的一個實例。

HBM在實際應用中一個被廣泛部署的案例是英偉達的B100 Blackwell加速器(如圖3所示)。該封裝包含兩顆大尺寸、掩模版級別的XPU裸片,裸片之間通過高帶寬鏈路互連,每顆裸片的上下邊緣均布置有HBM器件。每顆XPU裸片集成四個HBM堆疊——每條長邊各兩個——使得每個封裝總計搭載八顆HBM器件。


圖3:英偉達B100 Blackwell加速器集成了兩顆大尺寸、掩模版級別的XPU裸片,芯片之間通過高帶寬鏈路相互連接。

采用JEDEC標準通過時的典型HBM3規格,每顆HBM3器件可使用8層堆疊的16Gb DRAM層,每個堆疊提供16GB容量。在6.4Gb/s的數據速率和1024個I/O端口下,每顆HBM3器件可提供約0.8TB/s的帶寬。通過八顆器件,該配置可提供128GB的總內存容量和約6.6TB/s的總帶寬。

HBM4的拓展帶寬與容量

為了讓內存性能能夠隨計算能力同步提升,JEDEC近期發布了HBM4標準JESD270-4。相比HBM3,HBM4在架構上做出多項改進,直接滿足人工智能工作負載日益增長的帶寬與容量需求。

HBM4最重大的變化之一是通道數翻倍,I/O數量從1024提升至2048。與此同時,支持的數據速率提升至6~8Gb/s及更高水平。內存密度也同步提升,標準定義了24Gb與32Gb的DRAM層,并支持12層與16層堆疊。包括DRFM在內的可靠性、可用性與可維護性(RAS)功能也得到增強。

綜合來看,這些改進使得HBM4在帶寬、功耗效率和容量上相比HBM3都實現了大幅提升。例如,采用16層32Gb DRAM堆疊的HBM4e器件,單顆容量即可達到64GB(如圖4所示)。


圖4:該示例使用了8顆HBM4器件。

該器件擁有2048個I/O,數據速率為8Gb/s,單顆帶寬最高可達2TB/s。在搭載8顆HBM4器件的封裝中,總內存容量提升至512GB,是此前HBM3方案的4倍,總帶寬則超過16TB/s,提升2.5倍。

定制化HBM及基礎裸片的作用

隨著HBM4的應用加速,部分系統設計者正針對特定應用,探索開發定制化HBM解決方案。推動這一趨勢的關鍵因素,是HBM基礎裸片的技術演進。

在早期HBM世代中,基礎裸片通常采用面向DRAM優化的工藝制造,這類工藝適合電容結構,但對高速邏輯電路并非最優。而在HBM4中,多數供應商正轉向采用標準先進邏輯工藝來制造基礎裸片。這一轉變與SoC設計者已熟悉的工藝更加契合,也為定制化開發打開了空間。

無論采用標準還是定制HBM4器件,這類方案仍將依賴先進封裝與硅基板技術(如中介層或橋接芯片),以實現內存與ASIC之間大量超細間距的連接。

SPHBM4將HBM級帶寬引入有機封裝

盡管傳統HBM集成在性能上具備優勢,但其需要采用先進封裝技術,這會推高成本并增加復雜度。許多系統設計者,尤其是那些專注于量產與可靠性的設計者,更傾向于使用標準有機基板。為彌補這一缺口,JEDEC宣布即將完成一項全新標準——SPHBM4。

SPHBM4器件采用與HBM4相同的DRAM核心裸片,并可提供相當的總帶寬,但該方案引入了全新的接口基礎裸片,專為適配標準有機基板而設計。圖5展示了一顆SPHBM4 DRAM與一顆ASIC一同直接安裝在有機封裝基板上的側視示意圖。ASIC既可直接置于有機基板上,也可保留在硅橋等先進封裝方案中,以實現多XPU集成。


圖5:SPHBM4 DRAM與ASIC的側視結構。

為了用更少引腳實現HBM4級別的吞吐能力,SPHBM4采用了更高的接口頻率與串行化技術。HBM4定義了2048路數據信號,而SPHBM4預計采用512路數據信號并搭配4:1串行化,從而滿足有機基板所需的更寬松凸點間距要求。

由于SPHBM4與HBM4使用相同的DRAM堆疊,單堆疊容量保持不變。不過,有機基板的布線支持更長的SoC與內存之間的通道長度,這可以帶來新的系統級折中方案。特別是更長的布線距離與斜角走線,通常能夠在同一顆裸片周圍布置更多內存堆疊。

圖6展示了這一效果。當HBM器件安裝在硅基板上時,必須緊鄰XPU放置,限制為每25毫米裸片邊緣最多兩個堆疊。而在有機基板上使用SPHBM4時,同一條邊緣可連接三顆內存器件,使內存容量與帶寬均提升約50%。


圖6:采用了12顆SPHBM4器件的示例。

即便在XPU下方仍使用硅基板(例如為了支持高帶寬的XPU間互聯鏈路),將內存器件移至有機封裝后,整體中介層尺寸也能大幅減小。這一縮減可在系統成本、可制造性與測試復雜度方面帶來顯著收益。

展望未來

人工智能工作負載持續挑戰著內存帶寬、容量與封裝技術的極限。JEDEC的HBM4標準是滿足這些需求的重要一步。而新興的SPHBM4標準則通過在標準有機基板上實現HBM級性能,拓展了設計空間。

對于系統架構師而言,這些技術在平衡性能、成本與集成復雜度方面提供了新的靈活性。隨著內存與封裝對系統整體性能的影響日益關鍵,盡早考慮HBM4、定制化HBM以及SPHBM4等方案,對于充分釋放下一代人工智能與高性能計算的性能潛力至關重要。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
突發! 韓國股市重挫6% 觸發熔斷

突發! 韓國股市重挫6% 觸發熔斷

每日經濟新聞
2026-05-15 13:55:21
釋永信“開光”真相大白,過程不堪入目,易中天也被牽連

釋永信“開光”真相大白,過程不堪入目,易中天也被牽連

往史過眼云煙
2026-03-24 17:05:24
暗黑界2025排行榜:新王登基,世代交替!

暗黑界2025排行榜:新王登基,世代交替!

吃瓜黨二號頭目
2026-05-15 10:12:00
多地國央企發侮辱性工資!

多地國央企發侮辱性工資!

黯泉
2026-05-14 21:32:42
美智庫分析:殲-20雷達反射面為F-22百倍,戰略目標不同

美智庫分析:殲-20雷達反射面為F-22百倍,戰略目標不同

一網打盡全球焦點
2026-05-15 03:38:00
昨夜北京機場爆火!紅裙女孩一遞花,這獻花姑娘把東方美演活了!

昨夜北京機場爆火!紅裙女孩一遞花,這獻花姑娘把東方美演活了!

趣味萌寵的日常
2026-05-15 11:48:31
王少杰離開東莞!無人相送,1個細節說明:他與廣東隊說拜拜

王少杰離開東莞!無人相送,1個細節說明:他與廣東隊說拜拜

體育哲人
2026-05-14 14:34:42
三過草地的女紅軍當農民,朱老總怒斥當地領導:你知道她是誰嗎?

三過草地的女紅軍當農民,朱老總怒斥當地領導:你知道她是誰嗎?

史之銘
2026-05-07 20:06:03
違法徒步穿越臥龍保護區,2人被依法處罰

違法徒步穿越臥龍保護區,2人被依法處罰

澎湃新聞
2026-05-15 06:14:12
最高院:提供 “口交” “肛交”等進入式性服務,是否屬賣淫行為?

最高院:提供 “口交” “肛交”等進入式性服務,是否屬賣淫行為?

周軍律師聊案子
2026-04-21 09:50:16
根本不在乎!同樣是看儀仗隊政客和商人的區別顯出來了!

根本不在乎!同樣是看儀仗隊政客和商人的區別顯出來了!

阿龍聊軍事
2026-05-15 10:48:40
俄羅斯與阿富汗建立“全面伙伴關系”,紹伊古敦促烏克蘭投降

俄羅斯與阿富汗建立“全面伙伴關系”,紹伊古敦促烏克蘭投降

山河路口
2026-05-14 21:08:12
會談結束!中美談足135分鐘,中方一錘定音,臺灣問題有了定論

會談結束!中美談足135分鐘,中方一錘定音,臺灣問題有了定論

阿物評論哥
2026-05-14 16:58:40
孫穎莎退出國家隊24小時內現詭異一幕,陳夢預言成真

孫穎莎退出國家隊24小時內現詭異一幕,陳夢預言成真

二爺臺球解說
2026-05-15 10:53:45
雷軍追著馬斯克合影,結果尷尬了!

雷軍追著馬斯克合影,結果尷尬了!

廣告創意
2026-05-14 22:15:06
狀元簽潛在競爭者:我的風格像愛德華茲、亞歷山大、布克和米切爾

狀元簽潛在競爭者:我的風格像愛德華茲、亞歷山大、布克和米切爾

稻谷與小麥
2026-05-15 14:14:05
中國外長缺席金磚會議,西方沒給印度面子,莫迪政府無法挑起大梁

中國外長缺席金磚會議,西方沒給印度面子,莫迪政府無法挑起大梁

云上烏托邦
2026-05-14 20:30:14
退市,年虧7.3億,套牢阿里、小米!曾站風口上的巨頭也熬不住了

退市,年虧7.3億,套牢阿里、小米!曾站風口上的巨頭也熬不住了

財經八卦
2026-05-14 17:26:40
在歡迎晚宴上,特朗普罕見破例了!

在歡迎晚宴上,特朗普罕見破例了!

仕道
2026-05-15 13:26:03
英偉達給黃仁勛兒女漲薪了!年薪百萬美元,“憑能力而不是身份”

英偉達給黃仁勛兒女漲薪了!年薪百萬美元,“憑能力而不是身份”

量子位
2026-05-15 11:53:51
2026-05-15 14:24:49
TechSugar incentive-icons
TechSugar
做你身邊值得信賴的科技新媒體
5105文章數 12748關注度
往期回顧 全部

科技要聞

兩年聯姻一地雞毛,傳蘋果OpenAI瀕臨決裂

頭條要聞

特朗普訪華"二號位"系美國駐華大使 其曾受超規格禮遇

頭條要聞

特朗普訪華"二號位"系美國駐華大使 其曾受超規格禮遇

體育要聞

德約科維奇買的球隊,從第6級聯賽升入法甲

娛樂要聞

方媛回應住男生單人間:女孩的配得感

財經要聞

特朗普的北京時刻

汽車要聞

雙零重力座椅/AI智能體/調光天幕 啟境GT7內飾發布

態度原創

時尚
手機
親子
健康
數碼

冰涼一夏 | 比沒穿還舒服,這些貼身衣物我囤了5件

手機要聞

首臺語音喚醒游戲本!七彩虹iGame M16 Origo2026到手價8999元

親子要聞

女子花大價錢入住月子中心,多名月嫂的行為讓她無法理解

專家揭秘干細胞回輸的安全風險

數碼要聞

單臺9.8PB!戴爾將40塊245TB 鎧俠SSD塞進一臺2U服務器:一臺頂一套豪宅

無障礙瀏覽 進入關懷版