被稱為"HBM之父"的韓國科學技術院(KAIST)金正浩教授拋出一個顛覆認知的判斷:AI的本質(zhì)是內(nèi)存,而不是GPU。
近日,韓國科學技術院(KAIST)電氣工程系教授金正浩接受視頻專訪,圍繞HBM技術演進、AI算力格局和未來半導體架構作出系統(tǒng)性闡述。金正浩被業(yè)界稱為"HBM之父",早在2010年代初期便與SK海力士合作參與HBM1開發(fā),此后主導了一系列底層架構研究。此次訪談內(nèi)容在科技與投資圈廣泛流傳,核心觀點直指當前AI算力競賽的結(jié)構性矛盾。
![]()
金正浩在訪談中直接給出了一個令人震動的數(shù)字:
"GPU裝100萬臺,真正工作的時間只有10%。"
他解釋,每當ChatGPT輸出一個詞,系統(tǒng)就需要從HBM中讀取數(shù)據(jù)、完成計算、再寫回內(nèi)存,"讀和寫幾乎占掉了全部時間,GPU就在旁邊干等著。"即便通過算法優(yōu)化,GPU利用率也很難突破30%。
這正是他多年堅持的核心論斷的現(xiàn)實依據(jù):"AI等于內(nèi)存(AI = Memory)。"
一、為什么GPU遇到了"外通死局"
金正浩對英偉達(NVIDIA)現(xiàn)狀的判斷措辭犀利。他說,黃仁勛近期頻繁訪問韓國、參加綜藝、吃炸雞喝啤酒、會見各路人士,"這么多會面背后,說明他不安心"。
"GPU的技術性成長已經(jīng)快停了,這是我的判斷。人工智能計算機的進化,掌握在內(nèi)存手里。"
他的邏輯鏈條清晰:GPU想提升性能,只能擴大芯片面積、堆更多計算單元;但GPU太熱,必須在背面安裝散熱裝置,因此無法像內(nèi)存一樣垂直堆疊。"GPU陷入了外通死局(外通手? ?? ??)。"
相比之下,從訓練時代轉(zhuǎn)向推理時代,內(nèi)存的重要性正在被重新定價。金正浩說:"推理時代,更重要的是往AI里塞進多少數(shù)據(jù),而決定這一點的半導體是內(nèi)存。"
他進一步指出,AI能力的競爭最終是內(nèi)存能力的競爭:"谷歌Gemini、OpenAI、Anthropic Claude,誰更強,是由內(nèi)存決定的——這是我的主張。"
二、HBM的兩大核心:容量與帶寬
金正浩將HBM的價值歸結(jié)為兩個維度。
第一是容量。隨著上下文工程(context engineering)、多模態(tài)輸入和Agentic AI的到來,內(nèi)存需求以每年翻倍的速度增長,"10年就是1000倍"。傳統(tǒng)方式靠縮小晶體管來增容,但如今已逼近量子力學邊界,幾乎無法繼續(xù)縮小,因此必須"向上堆疊"。
第二是帶寬。金正浩打了個比方:"傳統(tǒng)內(nèi)存如果是8車道高速公路,HBM是1024車道,現(xiàn)在是2048車道,幾年后可能達到100萬車道。" 靠并行通道同時傳輸海量數(shù)據(jù),才能匹配AI計算的速度需求。
三、HBF:NAND閃存的堆疊時代
HBM解決了速度問題,但容量依然有天花板。金正浩在訪談中詳細闡述了他認為的下一條技術路線——HBF(High Bandwidth Flash)。
簡單說,HBF就是把NAND閃存像HBM一樣垂直堆疊。DRAM速度快但容量有限,NAND閃存容量大、可長期保存數(shù)據(jù),速度雖然慢一些,但在推理場景中足夠滿足"冷數(shù)據(jù)"的存儲需求。
金正浩認為,未來HBM和HBF將形成共存格局,類似于城市規(guī)劃:"就像有百貨商場,周圍有復式公寓、普通住宅,各種形態(tài)的HBM、HBF組合在一起,形成復合體,向GPU供給數(shù)據(jù)。"
他作出了一個明確的長期預判:"現(xiàn)在是HBM的時代,但10年后,NAND閃存和HBF的市場需求將超過HBM。三星和SK海力士必須為HBF時代做好準備。"
他指出,目前正在開發(fā)HBF的公司包括SK海力士、閃迪、三星電子,以及日本的鎧俠(Kioxia)。鎧俠市值最近超過了豐田汽車,成為日本股市第一,閃迪股價持續(xù)上漲,而三星和SK海力士則在韓國市場維持市值領先地位。
四、HBS:更超前的第三條路
金正浩還提出了一個目前仍屬于前沿概念的設想——HBS(High Bandwidth SRAM)。
SRAM(靜態(tài)隨機存儲器)比DRAM快約1000倍,但密度低、成本高,傳統(tǒng)上只能作為芯片內(nèi)的小容量緩存。金正浩的思路是:把整張12英寸晶圓全部做成SRAM,再垂直堆疊12至16層,就能將容量從100GB擴展到1600GB。
"這樣速度快1000倍,容量又足夠,那就說得通了。"
他描述的終極AI芯片形態(tài)是一棟"100層3D大樓":"HBM、HBF、HBS各自構成多層建筑,GPU放在頂層負責散熱冷卻,這就是未來AI計算機不可避免的3D半導體結(jié)構——這是我現(xiàn)在的判斷。"
他同時坦言,這條路最大的工程挑戰(zhàn)不是計算,而是供電與散熱:"要給GPU和堆疊內(nèi)存供幾千安培的電,電力供應網(wǎng)絡的設計將是最難的技術,這也將成為企業(yè)間真正的核心競爭力。"
五、定制HBM:甲乙關系正在逆轉(zhuǎn)
金正浩專門談到了HBM4帶來的供需結(jié)構變化。
過去,內(nèi)存是標準化產(chǎn)品,廠商先生產(chǎn)、客戶再選購,買家主導價格,庫存風險由內(nèi)存廠商承擔,這就是"內(nèi)存周期"的本質(zhì)。
但從HBM4開始,由于需要根據(jù)英偉達、谷歌、AMD等客戶的加速器架構量身設計(即"定制HBM"),內(nèi)存廠商必須在研發(fā)之初就拿到客戶的數(shù)量承諾,才會啟動開發(fā)——也就是所謂的"長期協(xié)議(Long-term Agreement)"。
"AI企業(yè)太需要高性能HBM了,所以他們排隊來。供應方開始決定價格,這是范式的轉(zhuǎn)變。"
他還預期,未來HBM芯片內(nèi)將集成通信功能,實現(xiàn)"HBM之間相互通話",形成類似聯(lián)盟的結(jié)構:"我們自己溝通,誰對我們更好,就給誰更多內(nèi)存;不聽話的GPU,就不分配。"
這進一步抬升了內(nèi)存廠商的系統(tǒng)性地位。
六、三星、海力士是唯一能同時做兩件事的公司
金正浩在訪談中反復強調(diào),全球范圍內(nèi)能同時量產(chǎn)DRAM(HBM)和NAND閃存(HBF)的公司,目前只有三星電子和SK海力士。
"閃迪和鎧俠雖然股價沖天,但只能做HBF,做不了HBM。三星和SK海力士擁有引領未來最強大的工具。"
當被問及三星與SK海力士今年合計營業(yè)利潤500萬億至600萬億韓元的預測是否現(xiàn)實,金正浩回答:"現(xiàn)實的。" 他補充說,他經(jīng)常與兩家公司的高管進行技術交流,"他們的眼神越來越亮了。"
不過他也指出競爭壓力真實存在,美光、閃迪獲得來自英偉達和谷歌的訂單分流。
七、AI PC與AI手機:內(nèi)存決定設備價格
金正浩還將內(nèi)存需求的敘事延伸至終端設備。
他預測,未來AI PC要真正實現(xiàn)個人AI計算,所需內(nèi)存規(guī)模將使"一臺PC的價格達到1000萬韓元,內(nèi)存價格決定PC價格"。而AI智能手機售價300萬至500萬韓元中,200萬至300萬韓元將是內(nèi)存的價格。
"AI基礎設施、AI模型的持續(xù)進化,需要越來越多的內(nèi)存。AI PC和AI手機,是這個趨勢的另一條主線。"
八、Agentic AI與物理AI:內(nèi)存需求還將暴增1000倍
金正浩對AI演進方向的判斷同樣值得關注。他認為,隨著Agentic AI(智能體AI)和Physical AI(具身AI/物理AI)的到來,內(nèi)存使用量將比現(xiàn)在高出約1000倍。
"AI代理24小時工作,不像人類還要睡覺,工作量暴增,內(nèi)存需求自然跟著爆炸。那時候不是HBM,而是需要'超級HBM'的時代了。"
九、研究之路:50年積累,"運氣"說
金正浩在訪談結(jié)尾追溯了自己的學術路徑。他1993年獲得博士學位,研究方向是飛秒(femtosecond)級超快電信號測量,導師數(shù)年前獲得諾貝爾物理學獎。1994年他加入三星電子內(nèi)存事業(yè)部,1996年回到KAIST,此后持續(xù)深耕內(nèi)存與HBM基礎研究約10年,才形成商業(yè)產(chǎn)品。
2015年,他在一次校內(nèi)會議上第一次聽到"深度學習"這個詞,隨即意識到AI算法與HBM架構背后用的是同一套數(shù)學——線性代數(shù)和矩陣運算。"我在大學二年級特別喜歡矩陣,兩邊恰好用的是一樣的數(shù)學——這就是運氣。"
他笑言,當初做HBM時想的是用在電視機上讓畫面更生動,完全沒想到會成為AI時代的基礎設施:"那時候不知道,這也可以說是運氣。"
以下為訪談文字實錄有刪減(由AI協(xié)助翻譯)
金正浩: HBM、HBF、HBS將組成一棟百層大樓,GPU則位于最頂層,進行散熱等。我認為,這種3D半導體結(jié)構是未來AI計算機不可避免的架構。而其中最困難的技術之一,就是供電。需要供應數(shù)千安培的電流,因此電力供應網(wǎng)絡的設計將是最困難的。這將成為核心技術競爭力。
主持人: 被稱為“HBM之父”的KAIST金正浩教授來到了我們的節(jié)目。您好!
金正浩: 您好,很高興見到您。感謝您的邀請。
主持人: 謝謝您抽出時間。
金正浩: 不客氣。(笑聲)
主持人: 我們得先從HBM聊起。實際上,HBM真正開始量產(chǎn)和應用,也不過大概兩年的時間,對吧?HBM3是這樣。HBM1的話,從2010年代開始,我就和SK海力士一起參與了,當時GPU方面有NVIDIA和AMD。所以HBM1是在2010年代初期開始的,但那時它是用于顯卡的。
主持人: 教授您獲得博士學位是在1990年代,對吧?
金正浩: 是的。
主持人: 但您在2010年HBM最初被開發(fā)出來時,就早早地開始了相關研究。
金正浩: 是的。我在1993年獲得博士學位,當時的研究更偏向物理學。我制造了當時世界上最快的、用激光來測量電信號的示波器。我的導師幾年前獲得了諾貝爾物理學獎。當時我制造的設備可以觀測到飛秒(幾乎靜止的光)級別的極端時間現(xiàn)象。如今隨著AI的發(fā)展,需要處理海量數(shù)據(jù),數(shù)字電路的運行速度已經(jīng)達到了皮秒甚至飛秒級別。所以30年前博士期間的研究現(xiàn)在都派上了用場。
不過,當時研究的領域非常狹窄和深入,而我的性格更傾向于與社會交流和溝通。所以當時我就想,未來內(nèi)存會變得很重要。抱著這個想法,我在1994年加入了三星電子的內(nèi)存事業(yè)部。從那時起,我就一直在學習和研究內(nèi)存。1996年我來到KAIST,大約到2010年,HBM前期的基礎研究持續(xù)進行了大約10年,然后才作為產(chǎn)品應用到了HBM上。
HBM所需的各種技術,如量子力學、半導體物理、數(shù)學等,其實都是大學二、三年級時學過的科目。特別是需要大量的線性代數(shù)知識,那是我在1981年學習的,能一直應用到現(xiàn)在。HBM不斷推陳出新,我們實驗室甚至提出了到HBM8為止、為期30年的路線圖。這么算下來,從最初研究到現(xiàn)在,差不多有50年了。
主持人: 您在最初研究和思考HBM概念時,就預料到人工智能時代會到來,并且HBM會成為其核心嗎?
金正浩: 沒有,當時AMD和NVIDIA是打算把它用在顯卡上。顯卡所需的數(shù)學和人工智能所需的數(shù)學是一樣的。所以HBM后來成了AI的核心部件,但最初NVIDIA方面認為它只是用在顯卡上。而我當時想,韓國電視產(chǎn)業(yè)很發(fā)達,所以想把這種芯片放進電視里,讓電視畫面更華麗、更生動、更逼真,因此我最初是考慮用在電視上的。
大約2015年,在大學里和一些年輕教授開會時,他們用到了“深度學習”這個詞,那是AI的早期階段。當時我只是覺得“哦,還有這種技術啊”,半開玩笑地聊著,只有我沒聽懂。所以從那時起,大概2015年,我實際上就把專業(yè)方向轉(zhuǎn)向了AI。雖然表面上是研究HBM的實驗室,但我個人從2015年開始完全轉(zhuǎn)向了AI研究。研究幾年后發(fā)現(xiàn),AI算法和HBM簡直是天作之合。我當時就覺得,這會在AI領域得到爆發(fā)式應用。
那時候主要用在CNN(攝像頭物體識別)上,稍后是強化學習(比如下圍棋),這些應用都需要大量矩陣運算,所以需要HBM。但像現(xiàn)在這樣徹底爆發(fā),大概是在2020年代初ChatGPT出現(xiàn)的時候。未來AI將向Agentic AI發(fā)展,一部分也會走向Physical AI。從算法上看,Agentic AI或Physical AI的內(nèi)存使用量可能會比現(xiàn)在增加1000倍。那樣的話,就需要HBM的升級版“Ultra HBM”的時代了。所以我們也有一些其他的想法。總之,一開始我并不知道會這樣,可以說是一種運氣。因為我大學二年級時就非常喜歡線性代數(shù),而兩者用的數(shù)學是相同的。
主持人: 我理解HBM就是將多個DRAM堆疊起來,我的理解正確嗎?
金正浩: 是的,正確。無論是顯卡還是AI,在進行計算時,都需要快速從內(nèi)存中讀取數(shù)據(jù)。HBM之所以必要,有兩個原因。第一是容量要大。特別是AI正在向上下文工程、多模態(tài)、Physical AI發(fā)展,需要在內(nèi)存中累積的數(shù)據(jù)量越來越大。可能每年翻一番,十年就是1000倍。要增加內(nèi)存容量,就需要不斷縮小晶體管或存儲單元,但由于單元間的干擾和漏電現(xiàn)象,我們已經(jīng)接近了量子力學的極限,難以再縮小。所以容量很難增加。
因此我在2000年代初就認為,未來的內(nèi)存必須堆疊起來。從那時起,我們就主張“堆疊”而非“平面”。當時大多數(shù)人都設計單層半導體,而我們的設計方向是堆疊。當然我們側(cè)重設計,三星和SK海力士負責具體實現(xiàn),但最終產(chǎn)品化的結(jié)果就是HBM。第二個原因是,即使容量大,也必須能快速將數(shù)據(jù)傳輸給GPU。這樣才能快速響應我們,處理文檔、文字,甚至最近需要制作電影。要提高速度,需要并行傳輸數(shù)據(jù)的技術。就像高速公路從8車道變成了1024車道,最近是2048車道,幾年后可能變成百萬車道。
所以HBM的核心是:通過堆疊增加容量,同時通過安裝“電梯”和“高速公路”結(jié)構,以光速(比傳統(tǒng)內(nèi)存快千倍、百萬倍)傳輸數(shù)據(jù),這就是所謂的并行結(jié)構。
主持人: 提到HBM,也常聽到HBF。HBF是什么,和HBM有何不同?
金正浩: 通用內(nèi)存主要有兩種:DRAM和NAND Flash。DRAM速度快但無法長期存儲;而NAND Flash容量大(大約是DRAM的10倍),速度慢一些,但能長期保存,主要用于相機等設備。但剛才提到的HBM雖然堆疊了,容量仍然不足。最近因為上下文工程,向AI輸入時不僅用文本,還附帶參考文件、YouTube視頻等,視頻圖像文件暴增,內(nèi)存容量需求比現(xiàn)在更大。計算過程中的中間結(jié)果(KV Cache)也需要全部存儲。
進入Agentic AI時代,我可能會雇傭10個或100個AI替我工作,AI的工作量是我的100倍,而且它們24小時工作,不像我們會睡覺休息,所以工作量劇增,內(nèi)存需求也隨之增加。即便堆疊了DRAM,容量還是不夠,所以想到了堆疊NAND Flash,這就是HBF。目前開發(fā)HBF的公司有SK海力士、Sandisk、三星電子,日本的Kioxia可能也在開發(fā)。最近Kioxia的市值甚至超過了豐田,成為日本股市第一。美國制造NAND Flash或HBF的Micron和Sandisk股價也持續(xù)上漲,韓國制造這些的三星和SK海力士市值排名前列。
緊挨著GPU的內(nèi)存有兩種:HBM和HBF,也叫“熱內(nèi)存”;而用于長期記錄AI關于用戶信息的設備叫“冷內(nèi)存”,兩者需求都在增長。長遠來看,大約10年后,NAND Flash和HBF的市場需求增長可能會超過HBM。所以現(xiàn)在雖然是HBM時代,但三星、SK海力士也要為HBF時代做好準備,這是我的主張。
主持人: 您曾提到2038年左右HBM可能會發(fā)展到第八代。
金正浩: 是的。
主持人: 那時HBM和HBF都將進入商業(yè)化階段,兩者是互補關系,還是競爭關系?
金正浩: 兩者是互補的。HBM4今年推出,幾年后HBM5會出來,大約每三年換一代,10年后會到HBM8。那時HBM和HBF將一起使用。HBM容量雖小但速度快,HBF速度稍慢,也有一些物理局限性,但容量巨大。如果HBM容量不夠,旁邊會配上HBF,兩者并非單一存在,而是類似公寓樓群:中心有百貨商店(HBM),周圍有公寓樓群(HBF)。各種形態(tài)的HBM和HBF會組成一個綜合體,相互連接,為用戶提供數(shù)據(jù)。總?cè)萘糠矫妫琀BF可能比HBM更大。
主持人: 歸根結(jié)底,就是堆疊DRAM還是NAND Flash的區(qū)別,兩者缺一不可。
金正浩: 是的,全球能同時做這兩種的公司只有三星電子和SK海力士。Sandisk和Kioxia雖然股價飆升,但它們只能做HBF(或堆疊NAND的ESSD技術),無法做HBM。所以我認為三星電子和SK海力士擁有引領未來的最強大工具。
主持人: 那么可以說三星電子和SK海力士擁有絕對的領先優(yōu)勢嗎?
金正浩: 可以這么說。今天早上的股價不就突破9000了嗎?雖然預測股價不是我的領域,但從根本趨勢看,世界正走向AI霸權時代,而AI的能力,我認為是由內(nèi)存能力決定的。直到去年,我還以為AI能力源自數(shù)學(比如注意力機制),但要實現(xiàn)它離不開內(nèi)存。最終,內(nèi)存的性能就是AI的性能。所以我定義“AI = 內(nèi)存”。AI企業(yè)、AI國家,或者用半導體建設數(shù)據(jù)中心,都必須依靠內(nèi)存公司。這是格局轉(zhuǎn)變的時代。
更驚人的是,HBM和HBF用于建設AI數(shù)據(jù)中心,現(xiàn)在也叫“AI工廠”——制造AI的工廠。我稱之為“內(nèi)存工廠”,AI工廠的核心是內(nèi)存,擁有多少內(nèi)存決定了AI國家霸權和AI企業(yè)的競爭力。谷歌、Gemini、OpenAI、Anthropic Claude誰更好?我的主張是,這由內(nèi)存決定。
最近為了保護個人信息,出現(xiàn)了在自己的電腦上直接計算AI的動向,這叫AIPC。NVIDIA也想做這個,和臺積電合作制造PC,里面裝有128GB的LPDDR之類,內(nèi)存非常大。要真正做好可能需要TB級內(nèi)存,那PC價格就得1000萬韓元,內(nèi)存價格決定了PC價格。未來智能手機也會變成AI智能手機,屏幕上可能只留一個窗口,其他都由AI代勞,甚至會出現(xiàn)AI眼鏡。我主張一臺AI手機價格的一半以上會是內(nèi)存價格,比如300萬、500萬韓元的手機,其中200萬、300萬是內(nèi)存成本。AI基礎設施和AI模型越發(fā)展,內(nèi)存需求越大,而AI PC和AI手機是另一大增長軸。
主持人: 當前全球科技巨頭中,NVIDIA展現(xiàn)壓倒性性能,它保持最強地位的最大秘訣是什么?
金正浩: 直到去年,AI的“學習”(訓練)更為重要,學習能力就是AI能力。在學習中,Transformer模型的編碼器部分主要進行反向傳播計算,涉及微分,能做好這個的是GPU。所以訓練時代是GPU的時代,因為做AI必須有GPU,所以大家搶著高價購買。但從去年夏天開始,“推理”變得更重要。僅靠訓練無法克服“幻覺”問題,給出荒謬錯誤答案就無法使用。要實現(xiàn)個人化AI,推理變得重要,而對推理更重要的半導體是內(nèi)存。所以進入推理時代,內(nèi)存會比GPU更貴、需求量更大。
另一個原因是,要提高GPU性能,必須增大GPU面積(放入更多計算器)。一種方法是像Cerebras公司那樣,讓整個12英寸晶圓成為一個GPU。但這樣制造難度大,一個缺陷就要扔掉整個晶圓,不經(jīng)濟,用途受限。但即便如此,Cerebras也離不開HBM和HBF,沒有內(nèi)存,在推理時代就會很弱。那么NVIDIA能否堆疊GPU呢?不能,因為太熱了,后面得裝冷卻器,無法堆疊。所以GPU有些被困住了的感覺。最近黃仁勛坐立不安,來韓國上電視、扔棒球、吃炸雞喝啤酒、見很多人,說明他并不安逸。其中一個原因就是,我認為GPU的技術成長幾乎停滯了。相反,AI計算機的成長和進化取決于內(nèi)存。
主持人: 有說法是,實際運行的GPU只有10%?
金正浩: 是的。即使安裝了100萬個GPU,實際工作時間可能只有20%,甚至10%。為什么?因為GPU需要從內(nèi)存獲取數(shù)據(jù)才能計算并返回結(jié)果,但數(shù)據(jù)從內(nèi)存(HBM/HBF)傳輸不過來。當ChatGPT快速吐出單詞時,每個瞬間都需要從HBM/HBF讀取數(shù)據(jù)、計算、再寫入,幾乎全部時間都花在讀寫上,GPU在等待。所以關鍵在于能否快速讀取、讀取多少,這就是需要HBM和HBF的原因。無論如何改進算法,GPU實際工作可能最多只有30%,其余時間在空轉(zhuǎn)。
主持人: 所以教授您主張,未來HBM或HBF內(nèi)部會集成GPU功能,開啟新時代?
金正浩: 是的。既然HBM/HBF的數(shù)據(jù)讓GPU在等待,那不如我們自己計算。就好比在公寓一樓安裝GPU,數(shù)據(jù)坐電梯下來計算,整棟樓里解決所有事,不用去別的地方,省去了奔波時間。所以主張在HBM里放入CPU/GPU功能,甚至讓GPU“靠邊站”。當然不能讓GPU完全沒事做,要適當分工,讓它“一直保持渴求狀態(tài)”。這就是我所說的“Memory-Centric Computing”(以內(nèi)存為中心的計算)。從HBM4開始,已經(jīng)在朝這個方向做了。
主持人: 即使HBM/HBF里集成了GPU功能,因為沒有堆疊多個GPU,散熱問題應該不存在吧?
金正浩: 還是會有一點散熱問題。所以從HBM4開始,SK海力士和三星制造的產(chǎn)品性能可能會有差異,這和散熱有關——能否有效排出熱量。因為在一樓(內(nèi)存層)集成了部分GPU功能,那里太熱,內(nèi)存就像坐在“暖炕”上,性能會下降,必須給暖炕降溫。誰能更好地冷卻,將決定HBM4及以后產(chǎn)品的性能差異,GPU也是如此。所以我們實驗室的想法是,既然一層太熱,不如把部分功能移到“屋頂”(頂層),在上面加裝冷卻塔,從頂部直接冷卻。這是我們的核心架構之一,目前在HBM5相關研究中,碩博士們正在進行這項研究,希望能大獲成功。
我們發(fā)表這些論文后,NVIDIA、AMD、三星、海力士都會看到,起初可能排斥,但發(fā)現(xiàn)沒有別的辦法,最終會采納。
主持人: 如果教授所說的HBM/HBF內(nèi)部集成GPU的未來到來,甚至以后集成CPU,那三星電子和SK海力士應該會發(fā)展得更好吧?
金正浩: 是的,機會正在到來。“發(fā)展得更好”意味著掌握更多主導權,甚至可能超越NVIDIA。但要實現(xiàn)這一點,需要技術開發(fā)、投資、人才培養(yǎng),以及良好的政策判斷和經(jīng)營管理層的開放思維和正確判斷。管理層的判斷最重要。
主持人: 教授主張“即將進入內(nèi)存時代而非GPU時代”,這似乎已經(jīng)開始了。另外,最近GPU勢頭很猛,但也出現(xiàn)了NPU,NPU是什么?
金正浩: 都是處理器,用于矩陣計算,都用于AI。GPU原本是GPGPU,TPU里也包含HBM,所以都離不開HBM、離不開內(nèi)存。Gemini能寫文章、處理語言模型、畫畫,功能多樣;而有些芯片只擅長寫文章,為特定目的簡化,就是NPU。也有人叫LPU。它們都是AI所需的計算器,根據(jù)特殊用途做得更小、功耗更低、成本更低。國內(nèi)有Rebellions、FuriosaAI、HyperExcel等公司,全球大約有十幾家做NPU的,但無論Rebellions還是FuriosaAI,為了高性能都必須使用HBM。
主持人: 最近FuriosaAI和Rebellions獲得了國民成長基金的大規(guī)模投資,這是要讓它們真正和NVIDIA一較高下。這兩家公司真有全球競爭力嗎?
金正浩: 我當時是評審委員之一。這個決策有這樣的考量:NVIDIA無法掌控全世界所有領域,NPU、TPU等肯定存在利基市場。比如沙特阿拉伯建數(shù)據(jù)中心,如果全部用美國產(chǎn)品,依賴度太高,所以可能將其中10%采用其他解決方案,韓國NPU企業(yè)可以成為候選。另外,韓國國內(nèi)建設AI數(shù)據(jù)中心(可能需要百萬臺設備),如果100%都用NVIDIA芯片,我們對海外的依賴度太高,需要培育本土企業(yè)。所以決定投資以培育國內(nèi)企業(yè)。總體概括就是這樣。技術上也有其優(yōu)點。
主持人: 教授您最近的研究中提出了“高帶寬SRAM(HBS)”的概念?
金正浩: 是的,這是我最近提出的新概念。像之前提到的,我提出概念,但要實現(xiàn)需要三星、SK海力士等公司的大量努力。這些概念往往在10年、20年后會產(chǎn)生重大影響。我提到過Cerebras,有巨大的GPU,美國也有叫LPU的芯片。它們?yōu)榱俗宰鹦幕驕p少對HBM的依賴,在GPU內(nèi)部集成了SRAM作為內(nèi)存。SRAM比DRAM快約1000倍,但容量小。我研究了一下,無論是Cerebras還是LPU,都面臨SRAM容量不足的問題。據(jù)我了解,整個12英寸晶圓做成的Cerebras芯片,SRAM也只有44GB,而我認為至少需要400到440GB才有意義。
所以我的想法是:制造一個將整個12英寸晶圓鋪滿SRAM的芯片,然后再把它堆疊10層、12層或16層。這樣100GB就能變成1600GB,容量驚人。然后在這個晶圓級SRAM堆疊體上再放置GPU。速度是千倍之快,容量又足夠,這主意聽起來可行。所以我把這個晶圓級SRAM稱為HBS。我未來的夢想是:HBM、HBF、HBS都變成100層高的大樓,GPU放在最頂層,冷卻系統(tǒng)等也集成在一起,這種3D半導體結(jié)構將不可避免地成為未來AI計算機的架構。
這可能需要10年、20年甚至30年。其中最困難的技術之一就是供電。在HBS、HBM上面堆疊GPU,需要供應數(shù)千安培電流,電力供應網(wǎng)絡設計將是最困難的,這將成為技術核心競爭力。SK海力士、三星、Micron、TSMC都一樣,其次是如何散熱,這是實現(xiàn)過程中的障礙。目前人們關注TSMC和三星誰在幾納米工藝上做得好、良率如何,但未來,對于包含HBS在內(nèi)的3D AI計算機,如何供電、如何冷卻,將決定企業(yè)的生存。
主持人: HBS簡直是內(nèi)存半導體領域的“黃政民”(比喻大腕)。
金正浩:是“黃政民”沒錯。我10年前就聽說Cerebras用12英寸晶圓做GPU,當時心想“什么?這能用在哪兒?”大概是國防AI吧。當時我還挺自大。但兩周前,這家公司在納斯達克IPO了,讓我改變了想法。還是有用途的。既然Cerebras芯片最大的弱點是內(nèi)存不足,那就把它也堆疊起來。有一天早上我有了這個想法,讓學生畫了圖。最近開始談論HBF,等今年碩士新生入學,我打算讓他們開始以HBS作為碩博士論文研究方向。
主持人: 那SRAM由誰制造?
金正浩: 由代工廠制造,TSMC和三星電子都會做。
主持人: 今年三星和SK海力士的合計營業(yè)利潤據(jù)說在500到600萬億韓元之間,這是現(xiàn)實的目標還是過于樂觀的展望?
金正浩: 我認為是現(xiàn)實的。我經(jīng)常與三星和海力士的高管進行技術會議,感覺他們的眼神越來越亮。雖然他們不和我談具體的銷售額。現(xiàn)在HBM、HBF的一個重要特點是“定制化HBM”。以前是制造標準化產(chǎn)品,大量生產(chǎn),客戶買多買少,價格波動,這叫“周期”。內(nèi)存廠商不主導,而是由CPU廠商、微軟或電腦廠商決定購買數(shù)量,我們只能多生產(chǎn)一些觀望,如果客戶不買,庫存壓力就在我們身上,這就是“內(nèi)存周期”。
但從HBM4開始,不僅集成GPU功能,另一個重要功能是HBM之間可以相互通信。以前只做GPU指令的事,現(xiàn)在主張它們之間也要溝通。未來,HBM之間可以競爭,把更多內(nèi)存分配給表現(xiàn)更好的HBM。也就是說,它們內(nèi)部形成組合,不給表現(xiàn)差的HBM向GPU傳遞數(shù)據(jù)的機會。總之,隨著這些算法、通信功能、GPU功能的加入,每個公司(谷歌、AMD、NVIDIA)對HBM的設計要求都不同,這就是定制化HBM。這樣在開發(fā)初期就簽訂了長期供貨協(xié)議(LTA),沒有訂單就不開始開發(fā)。
現(xiàn)在AI企業(yè)極度需要高性能HBM,所以排隊求購,市場變成了賣方市場,供方定價。這是一種范式轉(zhuǎn)變。
主持人: 到現(xiàn)在為止,我們與KAIST金正浩教授就半導體生態(tài)進行了對話。感謝您今天的分享。
金正浩: 謝謝。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.