公眾號記得加星標??,第一時間看推送不會錯過。
當AI芯片的功耗向1000瓦大關逼近,當HBM的堆疊層數沖向20層,存儲芯片行業的競爭主軸正發生一場根本性的位移——誰能讓芯片“冷靜”下來,誰就能拿到下一代AI算力的入場券。
過去,HBM市場的競爭邏輯十分清晰:比拼堆疊層數、傳輸帶寬與引腳速率,誰能堆疊更多DRAM裸片、跑出更高的數據速率,誰就能搶占市場份額。但如今格局已然劇變,三星、SK海力士、美光三大存儲巨頭不約而同將研發重心轉向熱管理。
近日,在COMPUTEX 2026展會上,三星首次公開展示了其第八代HBM5原型,最吸引眼球的并非單純的帶寬數據,而是一項名為HPB(Heat Path Block)的全新散熱技術。
![]()
三星在COMPUTEX 2026展出的HPB方案
幾乎同一時間,SK海力士也在5月底發布了集成冷卻元件的iHBM方案。
存儲巨頭不約而同地將戰場轉移到了同一個方向——散熱。這背后,是日趨嚴峻的熱管理挑戰正從一個傳統的后端問題,升級為決定下一代AI算力能否順利釋放的核心瓶頸,也意味著散熱不再是HBM的附屬配套功能,而是決定其性能上限、硬件可靠性與行業競爭力的核心剛需。
一場圍繞給芯片降溫的技術軍備競賽,正在AI算力基礎設施領域全面打響。
HBM散熱為何突然成為AI算力的“命門”?
眾所周知,HBM是AI芯片的核心引擎,負責為GPU高速輸送數據。然而,隨著AI大模型規模膨脹、硬件迭代、芯片架構特性、下游客戶訴求等多重因素交織,傳統依賴服務器風扇、外置冷板的后端散熱模式徹底失效,HBM的熱管理正在被迫從事后補救轉向前端設計。
可見,散熱成為剛需,并非偶然,而是由幾大因素共同造就的。
AI芯片功耗暴漲:當下英偉達、AMD新一代AI服務器GPU單芯片功耗普遍逼近1000W,部分下一代旗艦架構芯片功耗更是突破千瓦紅線,單臺AI服務器、整機機柜的熱密度遠超傳統算力設備。傳統風冷的物理極限約為單芯片1000W,面對持續走高的功耗早已力不從心,液冷逐步成為數據中心標配。
但即便系統級液冷不斷普及,也只能解決芯片表面散熱問題,無法化解HBM垂直堆疊結構內部的積熱難題。與此同時,HBM自身功耗也代際攀升,從HBM2的12W增長至HBM3e的42.5W,規劃中的HBM5單顆功耗預計突破100W,8顆HBM5組成的內存陣列功耗便可接近800W,熱電互鎖成為制約性能釋放的首要障礙。
垂直堆疊的“夾層式”架構陷阱:HBM的核心形態是多層DRAM芯片垂直堆疊,依靠硅通孔(TSV)與微凸點實現層間互聯,層間填充的聚合物材料導熱性能極差。這種結構帶來了致命的熱阻問題:熱量主要產生于靠近GPU的堆疊底部基底芯片,卻需要穿透十幾層硅片、封裝材料才能抵達頂部散熱器,漫長的傳導路徑讓熱量難以逃逸。
實測數據顯示,僅4層HBM2堆疊,底部芯片最熱區域與最冷區域的溫差就達到24℃,而DRAM芯片的安全結溫上限僅為95℃。隨著堆疊層數向20層邁進,層間熱阻持續疊加,層數越高,底部高溫區與頂部低溫區的溫差就會進一步擴大,形成一個難以消散的熱塔。
D2D PHY局部熱失控風險加劇:作為連接HBM與GPU的高速物理層,D2D PHY(Die-to-Die物理層,負責HBM與GPU通信的接口)承擔著每秒數TB的數據傳輸任務,是數據交換最頻繁、發熱最集中的區域。該區域功耗占比超過HBM整體功耗的40%,是發熱重災區。在滿載工況下,D2D PHY區域溫度可飆升至125℃,遠超105℃的安全閾值,直接導致數據錯誤率暴漲300%。傳統散熱方案無法對這一局部熱點進行針對性降溫,一旦溫度超標,芯片便會觸發降頻保護,AI訓練、推理等核心算力隨之大幅縮水。
頭部客戶強勢倒逼:HBM過熱會直接導致芯片降頻、算力縮水,這對于動輒價值數十萬美元的AI服務器而言,是不可接受的。
對此,英偉達、AMD等頭部客戶已正式向三大存儲廠商提出明確要求,新一代HBM必須強化熱控能力與低功耗設計。在行業發展早期,散熱屬于芯片設計完成后的后端工作,依靠系統級散熱設備兜底;但面對HBM4E、HBM5的超高功耗與超高堆疊密度,這種模式徹底走到盡頭。行業共識逐步形成:熱管理必須深度融入HBM的芯片布局、堆疊工藝與封裝設計,從源頭切斷積熱隱患,而非單純依靠外部設備散熱。
簡單來說,芯片功耗代際翻倍,而散熱路徑卻因為物理結構越變越窄。當傳統的依賴芯片表面被動散熱的方式走到盡頭,一場從HBM內部發起的“散熱革命”勢在必行。
群雄逐鹿,HBM散熱技術路線競速
面對即將到來的熱挑戰,三星、SK海力士、美光這三大存儲巨頭雖目標一致,卻選擇了三條不同的技術路徑。
三星HPB:給芯片加裝“煙囪”
三星在COMPUTEX上展示的HPB(Heat Path Block)技術,其核心邏輯是在芯片內部開辟一條獨立、高效的熱傳導通道,如同為堆疊芯片加裝“散熱煙囪”。
![]()
HPB技術概念圖
據了解,HPB采用高導熱銅基材料打造導熱結構,其導熱能力是基板、塑封料等傳統聚合物材料的500-1000倍;針對HBM多層堆疊的特殊結構,三星后續還規劃改用硅基材質,進一步適配半導體工藝。該結構精準布局在發熱最集中的D2D PHY區域,引導熱量不再逐層繞行,而是通過獨立通道側向、向上快速導出,最高可將芯片熱阻降低16%。
在落地節奏上,HPB技術此前已率先成功落地于Exynos 2600移動處理器——通過在芯片上方放置銅質結構,構建更高效的散熱路徑,熱阻最高可降低16%,已經過消費級市場的長期驗證。
![]()
目前,HPB技術已在HBM4E產品中完成工程驗證。首批12層HBM4E樣品運行速率達14Gbps,后續可升級至16Gbps,單堆疊帶寬達3.6TB/s。與此同時,HBM5基底芯片將全面采用三星自主研發的2納米制程工藝,取代此前使用的4納米工藝。公司高層指出,在當前AI系統架構中,熱管理能力、數據處理效率以及封裝長期運行的穩定性,已與內存帶寬、延遲等傳統性能指標同等重要。
按照規劃,搭載HPB的HBM5預計2028年實現量產,堆疊層數覆蓋12層至20層,全面匹配下一代AI算力需求。依托存儲、代工、封裝一體化的IDM優勢,三星將HPB深度整合進HBM堆疊架構,而非簡單疊加外置散熱部件,最大化發揮散熱效能。
SK海力士iHBM:把冷卻元件“塞進”封裝
相比于三星的“煙囪”,SK海力士的iHBM方案更為激進,iHBM技術的核心是在HBM封裝內最熱的D2D PHY區域,直接嵌入ICE(集成冷卻元件)的硅基材料。相當于在封裝內部新增獨立導熱通路,繞開低效的逐層散熱路徑。
![]()
iHBM解決方案概念圖
ICE選用絕緣導熱硅基材料,在杜絕電路短路風險的前提下保障導熱性能,相當于在“火山口”直接安裝了一個內置散熱器。
據官方數據顯示,iHBM可將整體熱阻降低30%以上,效果顯著。更關鍵的是,該技術基于SK海力士已經非常成熟的MR-MUF封裝工藝,與客戶現有的系統級封裝環境高度兼容,這意味著客戶無需大規模改動設計即可快速導入,大大降低了應用門檻。
這一技術布局,充分考慮了下游客戶的遷移成本,展現了其作為HBM市場老大的老練。
不過,SK海力士的HBM5量產時間定在2029年至2030年,比三星晚約一年。SK集團會長崔泰源也承認,雖然需求旺盛,但技術突破仍需時間。
iHBM通過將熱控制元件深度集成至內存封裝內部,實現了從被動散熱到主動熱管理的范式轉變。其核心價值在于:
結構創新:打破傳統封裝中“芯片-基板-散熱器”的熱傳導鏈;
工藝協同:將熱設計與晶圓級封裝工藝深度融合;
場景適配:為AI/HPC場景的高功耗密度挑戰提供工程化解決方案。
隨著HBM向16層、20層、32層堆疊演進,iHBM代表的集成式熱管理技術將成為下一代內存封裝的標準配置,其設計方法論也將影響CPU、GPU等高功耗芯片的散熱架構演進。
美光:低功耗+TSV溝槽冷卻的“迂回戰術”
與兩家韓廠主攻“強化導熱”的思路不同,美光秉持少發熱優于強散熱的理念,走出差異化路線,以低功耗設計為核心,搭配TSV溝槽冷卻技術補強散熱能力。美光公開表示,其HBM產品整體功耗較競品低30%,從源頭削減熱量產生,降低散熱壓力。
在散熱補強層面,美光布局TSV溝槽冷卻技術:一方面在硅片內部蝕刻微米級微型溝槽,通入冷卻液實現芯片內部循環降溫;另一方面設計專用導熱TSV,這類硅通孔不承擔數據傳輸功能,僅負責垂直導熱,與信號TSV并行排布,不額外占用芯片面積,構建低阻垂直熱路徑。
目前,美光相關技術已完成全球專利布局,依托低功耗優勢主攻多元化算力場景,避開與三星、SK海力士在封裝內嵌散熱領域的正面競爭。此外,美光確認2026年全部HBM產能已售罄,并上調HBM市場預期,看好行業長期增長。
![]()
HBM三巨頭散熱技術方案
三星HPB、SK海力士iHBM、美光低功耗+TSV——三條技術路線各有優劣,但指向同一個結論:散熱已成為HBM競爭的核心維度。
過去,存儲巨頭的護城河是制程工藝和產能規模;未來,封裝技術和熱管理能力將同等重要。正如三星CTO Song Jae-hyuk所說:“AI系統正向超高集成演進,競爭焦點已不再局限于單純的存儲性能,熱管理能力已成為關鍵因素。”
從硬件到系統:IMEC的STCO與MCL的散熱革命
與此同時,行業機構也跳出單一硬件散熱的思維,探索系統與芯片協同優化的全新解法,多元化技術共同構筑HBM的散熱屏障。
其中,比利時微電子研究中心IMEC在2025年IEEE國際電子會議上發表的一項研究表明:僅靠硬件層面的散熱改良,遠遠不夠。
IMEC的研究模擬了一種更激進的3D架構——3D HBM-on-GPU,將HBM直接堆疊在GPU上方。這種將HBM直接堆疊在GPU上方的3D架構,相比當前主流2.5D集成模式,能大幅提升算力密度與內存帶寬。
![]()
整合方法(a)目前的2.5D方案與(b)HBM與GPU堆疊的3D提案
但仿真數據卻觸目驚心:在不加干預的情況下,GPU峰值溫度高達141.7°C,遠超安全閾值。但通過“系統-技術協同優化”(STCO),即結合通過移除HBM冗余基片、合并DRAM堆疊、減薄頂層芯片、動態調節GPU核心頻率、部署雙面散熱等多重手段及系統級策略,成功將溫度降到了與當前2.5D封裝方案持平的70.8°C。
這個研究揭示了一個核心思想:僅靠硬件散熱無法徹底解決3D集成的熱難題,未來的AI芯片設計,必須將散熱視為一個從晶體管到數據中心的多層級系統工程。芯片設計者不能再先設計,后散熱,而必須在設計初期就讓性能與溫度達成動態平衡。
而MCL(微通道頂蓋,Microchannel Lid)技術則是連接封裝級與系統級散熱的關鍵技術。MCL將50-500μm的微流道直接集成于芯片封裝頂蓋內部,取消傳統熱界面材料與獨立水冷板,冷卻液直接流經芯片發熱核心,大幅縮短散熱路徑、降低整體熱阻。
據悉,MCL專為英偉達Rubin系列超高功耗GPU打造,最快將于2026年底在超頻版VR200芯片中小批量試水,2027年下半年隨Rubin Ultra大規模商用。從市場規模來看,MCL市場將從2026年的0.4億美元激增至2028年的22億美元,增長潛力巨大。MCL與HPB、iHBM形成互補:前者打通封裝與外部液冷的最后一環,后者解決HBM內部積熱,二者協同構建從芯片內核到數據中心機柜的全鏈路散熱體系。
HBM散熱技術“進化史”
回顧HBM散熱的演進歷程,我們看到的是一條清晰的技術主線:散熱技術的演進始終緊跟芯片功耗、堆疊層數與集成架構的迭代節奏,整體呈現從系統外置到封裝內嵌,再到芯片級液冷的清晰路徑,每一代技術都對應著明確的功耗等級與應用場景,清晰勾勒出行業向熱源不斷靠攏的發展邏輯。
(1)基礎散熱時代(HBM2-HBM3):此階段以風冷主導,散熱純為后端配套。這一階段HBM單顆功耗僅12W左右,堆疊層數普遍低于8層,熱量密度較低。行業依靠服務器風扇、常規散熱片等傳統風冷方案即可滿足需求,散熱始終是芯片設計完成后的附屬環節,并未納入核心研發范疇。
(2)液冷普及時代(HBM3E-HBM4):D2C直觸液冷成為主流。當HBM功耗攀升至42.5W-75W,堆疊層數提升至12-16層,風冷徹底觸及極限,D2C直觸液冷開始大規模商用。冷卻液直接接觸芯片表面,散熱效率達到風冷的3倍,可將芯片溫度穩定在85℃降頻臨界值以下,目前該方案已廣泛應用于主流AI服務器與高性能計算設備。
![]()
(3)封裝內嵌散熱時代(HBM5):原生散熱+浸沒式冷卻結合。HBM5單顆功耗預計突破100W,堆疊層數沖擊20層,三星HPB、SK海力士iHBM等封裝內嵌散熱技術全面落地,散熱設計正式前置到芯片與封裝階段。同時,浸沒式冷卻開始商用,將GPU+HBM整體模塊浸入絕緣冷卻液中,散熱效率較直觸液冷再提升2倍,即便芯片滿負荷運行,溫度也能控制在80℃以內,成為高端AI集群的標配。
![]()
(4)芯片級液冷時代(HBM6-HBM8):極致散熱適配超高功耗。該技術面向120W-200W的超高功耗場景,散熱技術進一步深入芯片內部。有業內人士表示,HBM6或將引入專用熱通孔(Thermal TSV),這些通孔不傳輸數據,專門傳導熱量,能把芯片內部的熱量快速傳到冷卻液里,強化垂直導熱能力;HBM7采用“嵌入式冷卻”——在Base Die和Core Die里直接刻出“微型水道”,實現冷卻液在芯片內部循環,快速帶走熱量;HBM8甚至可能采用雙面嵌入式冷卻,搭配雙面中介層,全方位疏導積熱,即使局部有“熱點”(比如GPU的計算核心),也能快速降溫。這類極致散熱方案主要面向AGI原型機、超大規模超算等極限算力場景,也是行業長期技術探索方向。
![]()
嵌入式冷卻方案
![]()
雙面嵌入式冷卻方案
(5)應對200W+功率的“散熱技術”
未來,HBM有望突破200W,散熱會成為更大的挑戰,業界在材料、散熱架構和智能化領域展開攻關。
新型散熱材料突破:研發石墨烯基、碳納米管基等高熱導率冷卻液,其散熱效率較傳統方案提升50%以上,可快速帶走高密度堆疊芯片產生的集中熱量;同時優化封裝散熱層材料,提升熱量從芯片到冷卻系統的傳導效率。
芯片級冷卻:在HBM裸片與封裝之間集成微型散熱鰭片,通過增大散熱表面積強化熱交換;采用“液冷直觸”封裝設計,減少熱量傳導中間環節,縮短散熱路徑。
智能溫控:搭載基于負載的自適應溫控系統,實時監測HBM的運行功率與溫度,動態調整冷卻液流量、散熱風扇轉速等參數,既避免高負載時過熱,又減少空載狀態下的能源浪費,實現散熱效率與能耗的平衡。
整體而言,HBM散熱技術的迭代過程,就是不斷消除熱傳導中間損耗、持續貼近核心熱源的過程。在AI算力密度持續飆升的大背景下,這一演進方向不會逆轉。
任何宏大的AI敘事,最終都要向冰冷的物理規律低頭。算力向前推進一寸,底層的材料、封裝和散熱就要跟進一尺。
從三星的HPB“煙囪”、SK海力士的iHBM內嵌散熱,到美光的低功耗策略;從IMEC的STCO系統級優化,到MCL的封裝級革命,所有信號都在指向同一個結論:散熱,已不再是芯片設計的輔助問題,而是決定AI算力能否持續規模擴展的核心硬資產。
短期來看,以冷板式液冷為代表的系統級散熱方案將迎來大規模放量。有數據預測,全球AI數據中心液冷滲透率將突破40%,液冷設備、高導熱封裝材料等上游供應鏈率先迎來訂單爆發,2026年全球液冷市場規模預計達到165億美元,年復合增長率高達59%。
高盛預測全球服務器冷卻市場液冷滲透率將從2024年的15%躍升至2027年的80%。其中,2026-2027年將是液冷從小眾走向主流的關鍵轉折。
中期,隨著iHBM和MCL等封裝級散熱技術的快速滲透,散熱的價值將更多地從服務器機架前移到芯片封裝內部,引發產業鏈價值量的系統性重估。長期來看,一個覆蓋芯片、封裝、機架、數據中心的四層級熱管理協同的完整散熱體系將最終形成。
與此同時,行業將直面多重物理極限:20層以上超高堆疊的層間熱阻、200W+超高功耗的熱量疏導、先進封裝帶來的材料應力、散熱性能與制造成本、產品良率的平衡,都將成為全行業需要長期攻克的課題。此外,Chiplet架構、存算一體等新型算力架構的興起,也會催生全新的熱分布特征,倒逼熱管理技術持續迭代。
對于投資者和產業參與者而言,這場圍繞HBM的散熱暗戰提供了一個清晰的認知窗口:誰能在芯片散熱中抓住機遇,誰或許就拿到了通往下一代AI算力時代的入場券。
*免責聲明:本文由作者原創。文章內容系作者個人觀點,半導體行業觀察轉載僅為了傳達一種不同的觀點,不代表半導體行業觀察對該觀點贊同或支持,如果有任何異議,歡迎聯系半導體行業觀察。
今天是《半導體行業觀察》為您分享的第4432內容,歡迎關注。
加星標??第一時間看推送
求推薦
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.