![]()
![]()
![]()
50余年來,在看似不可撼動的摩爾定律的推動下,工程師實現了每兩年將單位面積內可以容納的晶體管數量翻倍的目標。但在行業追求邏輯密度的進程中,熱量這個棘手的問題日益凸顯。
在當今的中央處理器和圖形處理單元等片上系統(SoC)中,溫度會影響性能、功耗和能效。長期過熱會造成處理器中的關鍵信號傳輸變慢,導致芯片性能永久性衰退,同時還會加劇晶體管的漏電流,造成電力浪費。反過來,功耗上升又迫使芯片執行相同任務時消耗更多的能量,進一步降低了能效。
問題的根源在于“登納德縮放定律”的終結。該定律指出,晶體管線性尺寸縮小時,電壓應降低,使得單位面積的總功耗保持恒定。然而登納德縮放定律已在2005年左右終結,當時如果不犧牲晶體管功能的完整性,任何進一步降低電壓的操作都不可行。因此,在邏輯電路的密度繼續提高的同時,功率密度也在同步攀升,熱量便作為副產品不斷累積。
隨著芯片體積日益變小、功能日漸強大,高效散熱將成為維持其性能和使用壽命的關鍵。為了確保散熱效率,我們需要一種工具來預測新型半導體技術(晶體管、互連技術和邏輯單元的制造工藝)對熱量的產生和散發方式有何影響。筆者與比利時微電子研究中心(Imec)的同事們共同開發了一套解決方案。我們的仿真框架采用了行業標準和開源電子設計自動化(EDA)工具,并結合了自主研發的工具套件,可快速探索半導體技術與使用該技術構建的系統架構之間的交互影響。
目前得出的結論毋庸置疑:隨著每個新技術節點的推進,熱管理挑戰正持續加劇。我們必須探索新的解決方案,包括芯片和系統的創新設計方法,如果新方法還能夠應對散熱問題的話。
![]()
在過去,片上系統依靠附著在封裝外殼上的散熱片配合風冷降溫。一些數據中心已開始改用液體冷卻方案,因為液體吸收的熱量比氣體更多。如今,英偉達新的人工智能圖形處理單元的功耗據稱已達1000瓦,對這類最新一代高性能芯片而言,液體冷卻劑(通常是水或水基混合物)也許尚可以應對。但面對未來更精密、更小節點技術的芯片,無論是風扇還是液體冷卻劑都將力不從心。
![]()
以納米片晶體管和互補式場效應晶體管(CFET)為例。主流芯片制造商已開始轉向納米片器件,用水平堆疊的半導體薄片代替現行鰭式場效應晶體管中的鰭狀結構。而互補式場效應晶體管則將這種架構推向了極致,垂直堆疊了更多薄片并將它們分割成兩個器件,在大約一個晶體管的占位面積內容納了兩個晶體管。專家預計,半導體行業將在21世紀30年代引入互補式場效應晶體管技術。
![]()
我們研究了即將推出的名為A10(指10埃,即1納米節點)的納米片技術以及互補式場效應晶體管技術的A5版本。比利時微電子研究中心預測,A5會在A10問世兩代之后亮相。我們測試設計的模擬結果表明,A5節點的功率密度比A10節點高12%至15%。在工作電壓相同的情況下,這種功率密度的提升預計將導致溫度升高9℃。
![]()
9℃看起來不高,但在容納數十萬甚至數百萬芯片的數據中心,這一微小的溫差可能成為穩定運行與熱失控的分水嶺。熱失控是一種可怕的反饋循環,溫度升高會導致漏電功率增加,從而推升溫度,周而復始,直至安全機制強制關閉硬件以避免永久損傷。
研究人員正在探索基礎液冷和風冷的先進替代方案,以便幫助緩解這種極端高溫問題。例如,微流體冷卻技術使用了蝕刻在芯片內部的微小管道,可在設備內部循環冷卻液。其他方案包括噴射沖擊冷卻(將高速氣體或液體直接噴射至芯片表面)以及浸沒式冷卻(將整塊印刷電路板浸入冷卻液槽)。
不過,即便應用了這些新技術,單純依賴冷卻系統處理余熱仍不現實。移動設備尤其如此,因為它們受到了尺寸、重量、電池續航和不能燙傷用戶等要求的限制。同時,數據中心則面臨另一種制約,冷卻系統屬于建筑級別的基礎設施,如果芯片的每次更新換代都要改造散熱方案,成本將極為高昂并且會大面積中斷服務。
幸運的是,冷卻技術并非防止芯片過熱的唯一手段。有很多系統級解決方案可以動態適應變化的熱條件,從而控制溫度。
一種方法是在芯片周圍布置熱傳感器。傳感器檢測到溫度異常上升時,會發出信號來降低工作電壓和頻率,從而減少功耗、抑制升溫。這種方案雖然能解決熱問題,但也可能明顯影響芯片性能。例如,在高溫環境下,芯片可能始終表現不佳,就像將智能手機遺忘在陽光下一樣。
另一種方法名為“熱力沖刺”(thermal sprinting),對多核數據中心中央處理器尤為適用。該技術的原理是讓一個內核持續運行直至過熱,隨后將運算任務轉移至第二個內核,此時第一個內核便可冷卻。這種方案雖然能最大化單線程的性能,但在運行必須由多個內核協同處理的長任務時可能引發延遲。熱力沖刺還會降低芯片的整體吞吐量,因為總有一部分內核需要冷卻而無法使用。
由此可見,系統級解決方案需要謹慎地平衡散熱與性能。為了有效實施這些方案,片上系統設計者必須全面了解芯片的功率分布情況和熱點區域,精準確定應在何處布置傳感器、何時觸發電壓和頻率降低,以及芯片各部分冷卻需要多長時間。然而,即使是最頂尖的芯片設計師也亟需更具創意的熱管理思路。
![]()
在晶圓背面開發新功能是一個前景廣闊的研究方向。雖然該策略主要致力于提升供電效率和計算性能,但或許也有助于解決一些熱量問題。
比利時微電子研究中心預測了多項晶圓背面技術,這些技術可讓芯片在低壓下運行,從而減少產生的熱量。技術路線圖中的第一項技術稱為背面供電網絡(BSPDN),顧名思義,該技術將供電線路從芯片正面轉移至背面。所有先進的互補金屬氧化物半導體代工廠均計劃在2026年底前采用該技術。早期測試表明,通過拉近供電單元與晶體管的距離,該技術可有效降低電阻。電阻減小意味著電壓損失減少,因此芯片能在更低的輸入電壓下運行。電壓降低會造成功率密度下降,從而降低溫度。
在背面供電網絡之后,制造商可能會在晶圓背面集成高容量電容器。印刷電路板和芯片封裝中的電感所引發的大幅電壓波動對高性能片上系統尤為不利。背面電容器或許有助于解決這一問題,它們與晶體管的距離更近,可更快地吸收電壓峰值和波動。與單獨使用背面供電網絡時相比,這種排布方式使芯片能在更低的電壓下運行,因而溫度也更低。
![]()
最終,芯片制造商將推出背面集成電壓調節器(IVR)電路。該技術旨在通過更精細的電壓調控進一步降低芯片的電壓需求。以智能手機的片上系統為例,它們通常搭載8個以上的計算內核,但芯片上已沒有空間來為每個內核配置單獨的電壓調節器。現有方案通常用一個芯片外部調節器同時管理4個內核的電壓,無論這4個內核的實際運算負載是否相同;而集成電壓調節器則通過專門的電路對每個內核實施獨立管理,從而提升能效,將其置于晶圓背面還可節省寶貴的正面空間。
背面供電技術對熱管理的影響目前尚不明確,需通過演示與模擬來厘清其效應。新技術常會提高功率密度,芯片設計師必須考量其熱效應。例如,在布置背面集成電壓調節器時,哪一種分布方式更有利于熱管理,是均勻分布,還是集中布置在內核和緩存區等特定區域?
我們最新的研究發現,背面供電技術在解決原有散熱問題的同時,可能會引發新的散熱問題。原因在于實現背面供電網絡后,硅材料層將會變得非常薄。在正面設計中,硅基底的厚度可達750微米。硅的導熱性良好,因此這種相對較厚的硅層可以在晶體管中橫向傳導熱量,有助于控制熱點。而采用背面供電技術,則需要將硅基底減薄至約1微米,以便從背面接觸晶體管。夾在兩層導線與絕緣體之間的超薄硅片無法有效地將熱量傳導至四周。因此,異常活躍的晶體管所產生的熱量被困在局部區域并向散熱器方向聚集,反而會加劇熱點問題。
![]()
我們對80核處理器片上系統的模擬顯示,背面供電網絡可能會導致熱點的溫度升高多達14℃。雖然提高背面金屬層的密度等設計和工藝上的調整可以有所緩解,但我們仍需更多的優化策略才能徹底規避這個問題。
![]()
背面供電網絡是比利時微電子研究中心提出的名為互補金屬氧化物半導體2.0的硅邏輯技術新范式的重要組成部分。新的技術時代還將涌現先進的晶體管架構和專用邏輯層。雖然這些技術的主要目標是優化芯片性能和提高能效,但或許也能帶來熱管理優勢,例如改進散熱技術等。
![]()
在當今的互補金屬氧化物半導體芯片中,遠處和近處的組件均由一個晶體管驅動,導致能效低下。如果有兩個驅動層,會是什么結果?一個驅動層專門負責長線傳輸并通過專用晶體管緩沖這些連接,另一層僅處理10微米以內的短程連接。由于第二層的晶體管針對短連接進行了優化,可在更低的電壓下運行,因此可降低功率密度。然而,具體的降幅仍有待驗證。
可以肯定的是,解決行業熱難題需要跨學科協作。無論是熱界面材料、晶體管設計、系統控制方案、封裝技術還是冷卻系統,任何單一技術都無法解決未來芯片的熱挑戰。我們必須整合所有學科,借助先進的模擬工具和分析方法,科學規劃各項技術的應用比例和推進時序。盡管互補金屬氧化物半導體2.0技術(特別是背面功能化和專用邏輯層)的熱管理前景十分可觀,我們仍需驗證其初期預測并審慎評估其影響。以背面技術為例,我們必須精確了解它對產熱和散熱的影響,以及這些改變是否會在解決舊問題的同時引發更多新問題。
![]()
芯片設計師也許很容易被新興半導體技術吸引,希望通過后期軟件方案解決無法預見的熱問題。這種想法或許正確,但僅限于某種程度。過度依賴軟件解決方案可能對芯片性能產生負面影響,因為這類解決方案實際上并不精確。例如,為了消除一個熱點,可能不得不降低大片區域的性能,而這些區域原本并不會過熱。因此,協同優化片上系統設計與制造片上系統所采用的半導體技術勢在必行。
值得欣慰的是,更多電子設計自動化產品正在增加有關先進熱分析的功能,包括在芯片設計的早期階段。專家們也呼吁采用名為“系統技術協同優化”(STCO)的芯片開發新方法。系統技術協同優化旨在打破系統架構、物理設計和工藝技術間固有的壁壘,實現全局優化。各領域的資深人士應突破各自的舒適區,與芯片工程領域的其他專家協作。雖然目前并不知道要如何完美解決行業日趨嚴峻的熱挑戰,但我們堅信,借助恰當的工具和協同創新,這一難題終將得以攻克。
來源:悅智網
編輯:辣條
轉載內容僅代表作者觀點
不代表中科院物理所立場
如需轉載請聯系原公眾號
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.