網易首頁 > 網易號 > 正文申請入駐

HBM，太熱了！

2026-06-09 08:50:08　來源: 半導體行業觀察

上海舉報

分享至

公眾號記得加星標??，第一時間看推送不會錯過。

當AI芯片的功耗向1000瓦大關逼近，當HBM的堆疊層數沖向20層，存儲芯片行業的競爭主軸正發生一場根本性的位移——誰能讓芯片“冷靜”下來，誰就能拿到下一代AI算力的入場券。

過去，HBM市場的競爭邏輯十分清晰：比拼堆疊層數、傳輸帶寬與引腳速率，誰能堆疊更多DRAM裸片、跑出更高的數據速率，誰就能搶占市場份額。但如今格局已然劇變，三星、SK海力士、美光三大存儲巨頭不約而同將研發重心轉向熱管理。

近日，在COMPUTEX 2026展會上，三星首次公開展示了其第八代HBM5原型，最吸引眼球的并非單純的帶寬數據，而是一項名為HPB（Heat Path Block）的全新散熱技術。

三星在COMPUTEX 2026展出的HPB方案

幾乎同一時間，SK海力士也在5月底發布了集成冷卻元件的iHBM方案。

存儲巨頭不約而同地將戰場轉移到了同一個方向——散熱。這背后，是日趨嚴峻的熱管理挑戰正從一個傳統的后端問題，升級為決定下一代AI算力能否順利釋放的核心瓶頸，也意味著散熱不再是HBM的附屬配套功能，而是決定其性能上限、硬件可靠性與行業競爭力的核心剛需。

一場圍繞給芯片降溫的技術軍備競賽，正在AI算力基礎設施領域全面打響。

HBM散熱為何突然成為AI算力的“命門”？

眾所周知，HBM是AI芯片的核心引擎，負責為GPU高速輸送數據。然而，隨著AI大模型規模膨脹、硬件迭代、芯片架構特性、下游客戶訴求等多重因素交織，傳統依賴服務器風扇、外置冷板的后端散熱模式徹底失效，HBM的熱管理正在被迫從事后補救轉向前端設計。

可見，散熱成為剛需，并非偶然，而是由幾大因素共同造就的。

AI芯片功耗暴漲：當下英偉達、AMD新一代AI服務器GPU單芯片功耗普遍逼近1000W，部分下一代旗艦架構芯片功耗更是突破千瓦紅線，單臺AI服務器、整機機柜的熱密度遠超傳統算力設備。傳統風冷的物理極限約為單芯片1000W，面對持續走高的功耗早已力不從心，液冷逐步成為數據中心標配。

但即便系統級液冷不斷普及，也只能解決芯片表面散熱問題，無法化解HBM垂直堆疊結構內部的積熱難題。與此同時，HBM自身功耗也代際攀升，從HBM2的12W增長至HBM3e的42.5W，規劃中的HBM5單顆功耗預計突破100W，8顆HBM5組成的內存陣列功耗便可接近800W，熱電互鎖成為制約性能釋放的首要障礙。

垂直堆疊的“夾層式”架構陷阱：HBM的核心形態是多層DRAM芯片垂直堆疊，依靠硅通孔（TSV）與微凸點實現層間互聯，層間填充的聚合物材料導熱性能極差。這種結構帶來了致命的熱阻問題：熱量主要產生于靠近GPU的堆疊底部基底芯片，卻需要穿透十幾層硅片、封裝材料才能抵達頂部散熱器，漫長的傳導路徑讓熱量難以逃逸。

實測數據顯示，僅4層HBM2堆疊，底部芯片最熱區域與最冷區域的溫差就達到24℃，而DRAM芯片的安全結溫上限僅為95℃。隨著堆疊層數向20層邁進，層間熱阻持續疊加，層數越高，底部高溫區與頂部低溫區的溫差就會進一步擴大，形成一個難以消散的熱塔。

D2D PHY局部熱失控風險加劇：作為連接HBM與GPU的高速物理層，D2D PHY（Die-to-Die物理層，負責HBM與GPU通信的接口）承擔著每秒數TB的數據傳輸任務，是數據交換最頻繁、發熱最集中的區域。該區域功耗占比超過HBM整體功耗的40%，是發熱重災區。在滿載工況下，D2D PHY區域溫度可飆升至125℃，遠超105℃的安全閾值，直接導致數據錯誤率暴漲300%。傳統散熱方案無法對這一局部熱點進行針對性降溫，一旦溫度超標，芯片便會觸發降頻保護，AI訓練、推理等核心算力隨之大幅縮水。

頭部客戶強勢倒逼：HBM過熱會直接導致芯片降頻、算力縮水，這對于動輒價值數十萬美元的AI服務器而言，是不可接受的。

對此，英偉達、AMD等頭部客戶已正式向三大存儲廠商提出明確要求，新一代HBM必須強化熱控能力與低功耗設計。在行業發展早期，散熱屬于芯片設計完成后的后端工作，依靠系統級散熱設備兜底；但面對HBM4E、HBM5的超高功耗與超高堆疊密度，這種模式徹底走到盡頭。行業共識逐步形成：熱管理必須深度融入HBM的芯片布局、堆疊工藝與封裝設計，從源頭切斷積熱隱患，而非單純依靠外部設備散熱。

簡單來說，芯片功耗代際翻倍，而散熱路徑卻因為物理結構越變越窄。當傳統的依賴芯片表面被動散熱的方式走到盡頭，一場從HBM內部發起的“散熱革命”勢在必行。

群雄逐鹿，HBM散熱技術路線競速

面對即將到來的熱挑戰，三星、SK海力士、美光這三大存儲巨頭雖目標一致，卻選擇了三條不同的技術路徑。

三星HPB：給芯片加裝“煙囪”

三星在COMPUTEX上展示的HPB（Heat Path Block）技術，其核心邏輯是在芯片內部開辟一條獨立、高效的熱傳導通道，如同為堆疊芯片加裝“散熱煙囪”。

HPB技術概念圖

據了解，HPB采用高導熱銅基材料打造導熱結構，其導熱能力是基板、塑封料等傳統聚合物材料的500-1000倍；針對HBM多層堆疊的特殊結構，三星后續還規劃改用硅基材質，進一步適配半導體工藝。該結構精準布局在發熱最集中的D2D PHY區域，引導熱量不再逐層繞行，而是通過獨立通道側向、向上快速導出，最高可將芯片熱阻降低16%。

在落地節奏上，HPB技術此前已率先成功落地于Exynos 2600移動處理器——通過在芯片上方放置銅質結構，構建更高效的散熱路徑，熱阻最高可降低16%，已經過消費級市場的長期驗證。

目前，HPB技術已在HBM4E產品中完成工程驗證。首批12層HBM4E樣品運行速率達14Gbps，后續可升級至16Gbps，單堆疊帶寬達3.6TB/s。與此同時，HBM5基底芯片將全面采用三星自主研發的2納米制程工藝，取代此前使用的4納米工藝。公司高層指出，在當前AI系統架構中，熱管理能力、數據處理效率以及封裝長期運行的穩定性，已與內存帶寬、延遲等傳統性能指標同等重要。

按照規劃，搭載HPB的HBM5預計2028年實現量產，堆疊層數覆蓋12層至20層，全面匹配下一代AI算力需求。依托存儲、代工、封裝一體化的IDM優勢，三星將HPB深度整合進HBM堆疊架構，而非簡單疊加外置散熱部件，最大化發揮散熱效能。

SK海力士iHBM：把冷卻元件“塞進”封裝

相比于三星的“煙囪”，SK海力士的iHBM方案更為激進，iHBM技術的核心是在HBM封裝內最熱的D2D PHY區域，直接嵌入ICE（集成冷卻元件）的硅基材料。相當于在封裝內部新增獨立導熱通路，繞開低效的逐層散熱路徑。

iHBM解決方案概念圖

ICE選用絕緣導熱硅基材料，在杜絕電路短路風險的前提下保障導熱性能，相當于在“火山口”直接安裝了一個內置散熱器。

據官方數據顯示，iHBM可將整體熱阻降低30%以上，效果顯著。更關鍵的是，該技術基于SK海力士已經非常成熟的MR-MUF封裝工藝，與客戶現有的系統級封裝環境高度兼容，這意味著客戶無需大規模改動設計即可快速導入，大大降低了應用門檻。

這一技術布局，充分考慮了下游客戶的遷移成本，展現了其作為HBM市場老大的老練。

不過，SK海力士的HBM5量產時間定在2029年至2030年，比三星晚約一年。SK集團會長崔泰源也承認，雖然需求旺盛，但技術突破仍需時間。

iHBM通過將熱控制元件深度集成至內存封裝內部，實現了從被動散熱到主動熱管理的范式轉變。其核心價值在于：

結構創新：打破傳統封裝中“芯片-基板-散熱器”的熱傳導鏈；
工藝協同：將熱設計與晶圓級封裝工藝深度融合；
場景適配：為AI/HPC場景的高功耗密度挑戰提供工程化解決方案。

隨著HBM向16層、20層、32層堆疊演進，iHBM代表的集成式熱管理技術將成為下一代內存封裝的標準配置，其設計方法論也將影響CPU、GPU等高功耗芯片的散熱架構演進。

美光：低功耗+TSV溝槽冷卻的“迂回戰術”

與兩家韓廠主攻“強化導熱”的思路不同，美光秉持少發熱優于強散熱的理念，走出差異化路線，以低功耗設計為核心，搭配TSV溝槽冷卻技術補強散熱能力。美光公開表示，其HBM產品整體功耗較競品低30%，從源頭削減熱量產生，降低散熱壓力。

在散熱補強層面，美光布局TSV溝槽冷卻技術：一方面在硅片內部蝕刻微米級微型溝槽，通入冷卻液實現芯片內部循環降溫；另一方面設計專用導熱TSV，這類硅通孔不承擔數據傳輸功能，僅負責垂直導熱，與信號TSV并行排布，不額外占用芯片面積，構建低阻垂直熱路徑。

目前，美光相關技術已完成全球專利布局，依托低功耗優勢主攻多元化算力場景，避開與三星、SK海力士在封裝內嵌散熱領域的正面競爭。此外，美光確認2026年全部HBM產能已售罄，并上調HBM市場預期，看好行業長期增長。

HBM三巨頭散熱技術方案

三星HPB、SK海力士iHBM、美光低功耗+TSV——三條技術路線各有優劣，但指向同一個結論：散熱已成為HBM競爭的核心維度。

過去，存儲巨頭的護城河是制程工藝和產能規模；未來，封裝技術和熱管理能力將同等重要。正如三星CTO Song Jae-hyuk所說：“AI系統正向超高集成演進，競爭焦點已不再局限于單純的存儲性能，熱管理能力已成為關鍵因素。”

從硬件到系統：IMEC的STCO與MCL的散熱革命

與此同時，行業機構也跳出單一硬件散熱的思維，探索系統與芯片協同優化的全新解法，多元化技術共同構筑HBM的散熱屏障。

其中，比利時微電子研究中心IMEC在2025年IEEE國際電子會議上發表的一項研究表明：僅靠硬件層面的散熱改良，遠遠不夠。

IMEC的研究模擬了一種更激進的3D架構——3D HBM-on-GPU，將HBM直接堆疊在GPU上方。這種將HBM直接堆疊在GPU上方的3D架構，相比當前主流2.5D集成模式，能大幅提升算力密度與內存帶寬。

整合方法（a）目前的2.5D方案與（b）HBM與GPU堆疊的3D提案

但仿真數據卻觸目驚心：在不加干預的情況下，GPU峰值溫度高達141.7°C，遠超安全閾值。但通過“系統-技術協同優化”（STCO），即結合通過移除HBM冗余基片、合并DRAM堆疊、減薄頂層芯片、動態調節GPU核心頻率、部署雙面散熱等多重手段及系統級策略，成功將溫度降到了與當前2.5D封裝方案持平的70.8°C。

這個研究揭示了一個核心思想：僅靠硬件散熱無法徹底解決3D集成的熱難題，未來的AI芯片設計，必須將散熱視為一個從晶體管到數據中心的多層級系統工程。芯片設計者不能再先設計，后散熱，而必須在設計初期就讓性能與溫度達成動態平衡。

而MCL（微通道頂蓋，Microchannel Lid）技術則是連接封裝級與系統級散熱的關鍵技術。MCL將50-500μm的微流道直接集成于芯片封裝頂蓋內部，取消傳統熱界面材料與獨立水冷板，冷卻液直接流經芯片發熱核心，大幅縮短散熱路徑、降低整體熱阻。

據悉，MCL專為英偉達Rubin系列超高功耗GPU打造，最快將于2026年底在超頻版VR200芯片中小批量試水，2027年下半年隨Rubin Ultra大規模商用。從市場規模來看，MCL市場將從2026年的0.4億美元激增至2028年的22億美元，增長潛力巨大。MCL與HPB、iHBM形成互補：前者打通封裝與外部液冷的最后一環，后者解決HBM內部積熱，二者協同構建從芯片內核到數據中心機柜的全鏈路散熱體系。

HBM散熱技術“進化史”

回顧HBM散熱的演進歷程，我們看到的是一條清晰的技術主線：散熱技術的演進始終緊跟芯片功耗、堆疊層數與集成架構的迭代節奏，整體呈現從系統外置到封裝內嵌，再到芯片級液冷的清晰路徑，每一代技術都對應著明確的功耗等級與應用場景，清晰勾勒出行業向熱源不斷靠攏的發展邏輯。

（1）基礎散熱時代（HBM2-HBM3）：此階段以風冷主導，散熱純為后端配套。這一階段HBM單顆功耗僅12W左右，堆疊層數普遍低于8層，熱量密度較低。行業依靠服務器風扇、常規散熱片等傳統風冷方案即可滿足需求，散熱始終是芯片設計完成后的附屬環節，并未納入核心研發范疇。

（2）液冷普及時代（HBM3E-HBM4）：D2C直觸液冷成為主流。當HBM功耗攀升至42.5W-75W，堆疊層數提升至12-16層，風冷徹底觸及極限，D2C直觸液冷開始大規模商用。冷卻液直接接觸芯片表面，散熱效率達到風冷的3倍，可將芯片溫度穩定在85℃降頻臨界值以下，目前該方案已廣泛應用于主流AI服務器與高性能計算設備。

（3）封裝內嵌散熱時代（HBM5）：原生散熱+浸沒式冷卻結合。HBM5單顆功耗預計突破100W，堆疊層數沖擊20層，三星HPB、SK海力士iHBM等封裝內嵌散熱技術全面落地，散熱設計正式前置到芯片與封裝階段。同時，浸沒式冷卻開始商用，將GPU+HBM整體模塊浸入絕緣冷卻液中，散熱效率較直觸液冷再提升2倍，即便芯片滿負荷運行，溫度也能控制在80℃以內，成為高端AI集群的標配。

（4）芯片級液冷時代（HBM6-HBM8）：極致散熱適配超高功耗。該技術面向120W-200W的超高功耗場景，散熱技術進一步深入芯片內部。有業內人士表示，HBM6或將引入專用熱通孔（Thermal TSV），這些通孔不傳輸數據，專門傳導熱量，能把芯片內部的熱量快速傳到冷卻液里，強化垂直導熱能力；HBM7采用“嵌入式冷卻”——在Base Die和Core Die里直接刻出“微型水道”，實現冷卻液在芯片內部循環，快速帶走熱量；HBM8甚至可能采用雙面嵌入式冷卻，搭配雙面中介層，全方位疏導積熱，即使局部有“熱點”（比如GPU的計算核心），也能快速降溫。這類極致散熱方案主要面向AGI原型機、超大規模超算等極限算力場景，也是行業長期技術探索方向。

嵌入式冷卻方案

雙面嵌入式冷卻方案

（5）應對200W+功率的“散熱技術”

未來，HBM有望突破200W，散熱會成為更大的挑戰，業界在材料、散熱架構和智能化領域展開攻關。

新型散熱材料突破：研發石墨烯基、碳納米管基等高熱導率冷卻液，其散熱效率較傳統方案提升50%以上，可快速帶走高密度堆疊芯片產生的集中熱量；同時優化封裝散熱層材料，提升熱量從芯片到冷卻系統的傳導效率。

芯片級冷卻：在HBM裸片與封裝之間集成微型散熱鰭片，通過增大散熱表面積強化熱交換；采用“液冷直觸”封裝設計，減少熱量傳導中間環節，縮短散熱路徑。

智能溫控：搭載基于負載的自適應溫控系統，實時監測HBM的運行功率與溫度，動態調整冷卻液流量、散熱風扇轉速等參數，既避免高負載時過熱，又減少空載狀態下的能源浪費，實現散熱效率與能耗的平衡。

整體而言，HBM散熱技術的迭代過程，就是不斷消除熱傳導中間損耗、持續貼近核心熱源的過程。在AI算力密度持續飆升的大背景下，這一演進方向不會逆轉。

任何宏大的AI敘事，最終都要向冰冷的物理規律低頭。算力向前推進一寸，底層的材料、封裝和散熱就要跟進一尺。

從三星的HPB“煙囪”、SK海力士的iHBM內嵌散熱，到美光的低功耗策略；從IMEC的STCO系統級優化，到MCL的封裝級革命，所有信號都在指向同一個結論：散熱，已不再是芯片設計的輔助問題，而是決定AI算力能否持續規模擴展的核心硬資產。

短期來看，以冷板式液冷為代表的系統級散熱方案將迎來大規模放量。有數據預測，全球AI數據中心液冷滲透率將突破40%，液冷設備、高導熱封裝材料等上游供應鏈率先迎來訂單爆發，2026年全球液冷市場規模預計達到165億美元，年復合增長率高達59%。

高盛預測全球服務器冷卻市場液冷滲透率將從2024年的15%躍升至2027年的80%。其中，2026-2027年將是液冷從小眾走向主流的關鍵轉折。

中期，隨著iHBM和MCL等封裝級散熱技術的快速滲透，散熱的價值將更多地從服務器機架前移到芯片封裝內部，引發產業鏈價值量的系統性重估。長期來看，一個覆蓋芯片、封裝、機架、數據中心的四層級熱管理協同的完整散熱體系將最終形成。

與此同時，行業將直面多重物理極限：20層以上超高堆疊的層間熱阻、200W+超高功耗的熱量疏導、先進封裝帶來的材料應力、散熱性能與制造成本、產品良率的平衡，都將成為全行業需要長期攻克的課題。此外，Chiplet架構、存算一體等新型算力架構的興起，也會催生全新的熱分布特征，倒逼熱管理技術持續迭代。

對于投資者和產業參與者而言，這場圍繞HBM的散熱暗戰提供了一個清晰的認知窗口：誰能在芯片散熱中抓住機遇，誰或許就拿到了通往下一代AI算力時代的入場券。

*免責聲明：本文由作者原創。文章內容系作者個人觀點，半導體行業觀察轉載僅為了傳達一種不同的觀點，不代表半導體行業觀察對該觀點贊同或支持，如果有任何異議，歡迎聯系半導體行業觀察。

今天是《半導體行業觀察》為您分享的第4432內容，歡迎關注。

加星標??第一時間看推送

求推薦

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.