AI推理對昂貴DRAM的依賴正在松動。AMD宣布收購內存優化公司MEXT,將AI驅動的閃存優化技術引入數據中心。這標志著AI存儲架構正在經歷一場結構性遷移,而核心驅動力只有一個數字:閃存成本僅為DRAM的1/55。
周一,AMD宣布以未披露金額完成對MEXT的收購。MEXT開發的AI驅動預測內存技術,旨在讓閃存的行為更接近DRAM,在維持性能與效率的同時擴展可用內存容量。AMD表示,此次收購將擴充其AI產品組合,幫助數據中心客戶提升性能、降低總擁有成本并加速工作負載部署。"對內存的需求正在企業計算的每個品類中增長,"AMD在聲明中稱。
![]()
收購消息刺激AMD股價周一上漲7.7%至550.75美元,市值逼近9000億美元關口,當日S&P 500指數整體上漲1.8%。AMD今年以來累計漲幅已達323%。花旗上周五將AMD評級從中性上調至買入,目標價從460美元上調至575美元。
![]()
值得注意的是,蘋果早在2024年就開始推進"LLM in a Flash"端側方案。這一布局背后,是愈演愈烈的DRAM供給危機。據TrendForce數據,高帶寬內存(HBM)已占全部DRAM晶圓產能的約四分之一,DRAM合約價格在2026年第一季度單季環比暴漲約90%。Citrini Research指出,AI存儲需求已大到需要多層架構共同承接,閃存并非取代HBM,而是在容量維度承接溢出需求——這場架構重構正在重新定價整條AI存儲產業鏈。
![]()
內存稅危機:瓶頸從AI蔓延至全經濟
據摩根士丹利分析師Shawn Kim團隊本月早些時候的判斷,內存價格飆升和供應稀缺正演變為數字經濟的全面風險,"從AI基礎設施的瓶頸,蔓延至硬件利潤率、設備可負擔性、云成本、通脹乃至政策層面。"這一壓力已有具體案例佐證:Xbox首席執行官Asha Sharma上周表示,內存成本在過去兩年間上漲了約五倍,導致公司無法生產消費者所需數量的游戲主機。
HBM對DRAM產能的持續蠶食是這場危機的核心驅動。據TrendForce及三星、SK海力士、美光等廠商的披露數據,HBM在DRAM晶圓產能中的占比已從2020年的2%攀升至2026年預估的25%。超大規模云廠商以多年期合同預購未來晶圓產出,進一步壓縮了面向手機和PC的標準芯片可用產能。
新增DRAM產能的建設同樣面臨結構性制約。擴產依賴EUV光刻機印制更精細線寬,每臺EUV設備售價高達約2億美元,一座新晶圓廠的投資動輒數百億美元,建設周期在順利情況下也需數年。這一供給剛性,正是本輪短缺具備持續性的根本原因。
55倍成本差:閃存替代的經濟邏輯
據Citrini Research測算,閃存的每比特成本約為DRAM的1/55——QLC NAND約為每GB 0.05美元,DDR5 DRAM約為2.75美元,HBM3E則高達15美元。這一價差的可利用空間,在于AI推理中最大的單一內存消耗——KV緩存(記錄模型每次生成步驟中所有先前標記的上下文,長對話中可增長至數百GB)——對讀取速度的要求遠低于模型權重的解碼路徑。對于此類順序讀取數據,DRAM的速度優勢大幅收窄,而閃存的容量優勢則充分體現。
![]()
閃存的擴容路徑也與DRAM存在本質區別。閃存通過垂直堆疊更多單元層來增加容量,依賴現有工廠已有的沉積和刻蝕工藝,無需新的光刻節點,不占用EUV資源。閃存控制器基于成熟的6/7納米制程生產,遠離正在制約先進制程的瓶頸節點。
蘋果研究人員此前發表的論文"LLM in a Flash"提供了方法論支撐:通過將大語言模型參數存儲于設備閃存、按需調取至DRAM的方式,可在DRAM容量受限的設備上運行超出其容量上限的模型,并在CPU和GPU上分別實現比樸素加載方式快4至5倍和20至25倍的推理速度。
![]()
兩條路徑:數據中心與端側同步演進
AMD的收購聚焦數據中心場景。通過將MEXT技術整合至AMD數據中心產品組合,AMD尋求幫助企業客戶在AI工作負載部署中提升資源利用效率并壓縮成本。摩根士丹利Shawn Kim團隊認為,盡管內存短缺持續,AMD在云端市場競爭格局上仍具結構性優勢——"代理式AI驅動的CPU需求在結構上有利于AMD在云端市場份額的擴張。"花旗對AMD的樂觀預判則更多基于其GPU銷售與英偉達的正面競爭態勢。
蘋果的路徑則落子端側。"LLM in a Flash"方案將模型推理對昂貴云端內存的依賴部分轉移至設備本地閃存,在降低云端運算成本的同時,為端側AI應用提供可行的內存架構支撐。
據Citrini Research,兩大路徑共同指向同一結論:AI推理的內存層級正在重構,低頻KV緩存、模型權重及端側數據,將逐步從高價的HBM/DRAM下沉至NAND Flash/SSD層,形成多層次存儲架構。
這一架構轉變正沿產業鏈形成多層次的傳導效應。據Citrini Research梳理,最直接的受益層是NAND原廠,高容量NAND、企業級SSD及QLC NAND為最純粹的方向,包括SanDisk、西部數據、美光及鎧俠。
SSD控制器層被認為持續性最強——讓閃存真正接近內存體驗的核心在于控制器、固件與NVMe架構優化,涉及Silicon Motion、Marvell等。CXL/PCIe高速互聯層亦受益。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.