![]()
“全球半導(dǎo)體存儲(chǔ)器的市場(chǎng)規(guī)模預(yù)估將突破6000億美元。”
MemoryS 2026上,深圳市閃存市場(chǎng)資訊有限公司總經(jīng)理邰煒拋出這一數(shù)字,彰顯著存儲(chǔ)行業(yè)的底層邏輯已悄然改變:周期性行情退場(chǎng),AI主導(dǎo)的新范式降臨。
引爆這場(chǎng)變革的,是AI推理對(duì)存儲(chǔ)的指數(shù)級(jí)需求:?jiǎn)握?qǐng)求情況下,若上下文從4K Token擴(kuò)展至128K Token,KV緩存會(huì)膨脹32倍,若是100個(gè)并發(fā)請(qǐng)求,緩存需求則達(dá)TB級(jí)。
面對(duì)這種需求量,HBM已無(wú)力承載,這就決定了KV緩存開(kāi)始大規(guī)模向企業(yè)級(jí)SSD遷移。
疊加NL HDD產(chǎn)能缺口帶來(lái)的替代效應(yīng),多重變量共振,企業(yè)級(jí)SSD正在成為2026年NAND閃存最大的應(yīng)用市場(chǎng)。
“企業(yè)級(jí)SSD不再只是容量載體,而成了整個(gè)算力架構(gòu)里突破性能瓶頸的關(guān)鍵。”邰煒說(shuō)到。
變局之下,AI對(duì)企業(yè)級(jí)SSD的標(biāo)準(zhǔn)無(wú)限拔高,高可靠性、低時(shí)延、高壽命既是定價(jià)標(biāo)尺,也是廠商廝殺的核心戰(zhàn)場(chǎng)。
誰(shuí)能破解“AI時(shí)代數(shù)據(jù)搬運(yùn)的功耗與延遲”,誰(shuí)就將定義下一個(gè)十年。
超級(jí)周期已啟幕,存儲(chǔ)廠商各有出招。
不做GPU的「配角」,SSD開(kāi)始介入AI計(jì)算
當(dāng)AI推理規(guī)模化爆發(fā),存儲(chǔ)與計(jì)算的關(guān)系正在被重新定義:SSD不再只是數(shù)據(jù)的“倉(cāng)庫(kù)”,而是影響Token生成效率的關(guān)鍵變量。
這種定位的躍遷,正在倒逼存儲(chǔ)廠商重新思考自身的技術(shù)縱深。
以大普微為例,為了實(shí)現(xiàn)更快的Token生成與響應(yīng),其通過(guò)Fast SSD與TLC SSD的產(chǎn)品組合,打造高IOPS和低時(shí)延的數(shù)據(jù)供給能力,從而節(jié)省算力和成本。
更深一層的變化在于,存儲(chǔ)開(kāi)始介入計(jì)算的數(shù)據(jù)流調(diào)度。
大普微通過(guò)透明壓縮技術(shù)實(shí)現(xiàn)將KV Cache的數(shù)據(jù)無(wú)損壓縮21%以上,從而等效提升27%的帶寬,帶來(lái)直接的性能與用戶容量收益。
與此同時(shí),F(xiàn)DP(靈活數(shù)據(jù)放置)技術(shù)的引入,讓SSD可以根據(jù)數(shù)據(jù)生命周期進(jìn)行分組管理,從而降低寫(xiě)放大與延遲波動(dòng),為GPU提供可預(yù)期的數(shù)據(jù)供給節(jié)奏。
這些技術(shù)點(diǎn)的串聯(lián),勾勒出一個(gè)清晰的演進(jìn)方向:SSD正在從“存儲(chǔ)設(shè)備”進(jìn)化為“AI數(shù)據(jù)調(diào)度節(jié)點(diǎn)”,它不僅要存得快、存得多,還要存得“聰明”,能在正確的時(shí)間把正確的數(shù)據(jù)送到正確的位置。
更值得關(guān)注的是其產(chǎn)品節(jié)奏與AI算力迭代的同頻。
“目前,企業(yè)級(jí)SSD的市場(chǎng)大概能按照容量進(jìn)行劃分,4TB-32TB是TLC SSD的規(guī)模甜點(diǎn),30TB以上則是QLC SSD的主力區(qū)間,大普微今年推出245TB的產(chǎn)品,明年就會(huì)設(shè)計(jì)為512TB。”大普微董事長(zhǎng)楊亞飛對(duì)雷峰網(wǎng)表示。
這種“容量翻倍”的產(chǎn)品策略,與AI模型參數(shù)規(guī)模的增長(zhǎng)曲線形成了共振,為下一階段產(chǎn)品的放量埋下基礎(chǔ)。
![]()
SSD的競(jìng)爭(zhēng)核心是讓GPU「不空轉(zhuǎn)」
當(dāng)SSD開(kāi)始承擔(dān)KV Cache卸載、AI數(shù)據(jù)湖、推理緩存等任務(wù),它既要提供接近內(nèi)存級(jí)的延遲穩(wěn)定性,又要具備遠(yuǎn)高于內(nèi)存的容量密度和成本優(yōu)勢(shì)。
在這種變化下,SSD的評(píng)價(jià)體系也隨之重構(gòu)。
過(guò)去行業(yè)更強(qiáng)調(diào)帶寬、IOPS與壽命,在AI場(chǎng)景中,長(zhǎng)尾延遲控制、QoS一致性以及每瓦性能開(kāi)始變得同樣關(guān)鍵。
對(duì)大型算力集群來(lái)說(shuō),一塊SSD的價(jià)值不只是單盤(pán)性能有多高,而在于它能否在復(fù)雜負(fù)載下保持穩(wěn)定響應(yīng),避免GPU因等待I/O而“空轉(zhuǎn)”。
也正是在這樣的背景下,企業(yè)級(jí)存儲(chǔ)廠商開(kāi)始向系統(tǒng)能力延伸。
以憶恒創(chuàng)源為例,其核心策略并不是簡(jiǎn)單堆疊硬件參數(shù),而是通過(guò)固件算法和系統(tǒng)級(jí)調(diào)度,把不同來(lái)源的控制器與NAND顆粒調(diào)校成更適合AI負(fù)載的產(chǎn)品形態(tài)。
在大規(guī)模線上部署中,依托國(guó)內(nèi)大規(guī)模、高度復(fù)雜的AI與互聯(lián)網(wǎng)生態(tài),在極端且高頻的業(yè)務(wù)壓力下,其SSD的平均無(wú)故障時(shí)間(MTBF)已經(jīng)達(dá)到約1500萬(wàn)小時(shí),產(chǎn)品的穩(wěn)定性有可觀的場(chǎng)景及數(shù)據(jù)背書(shū)。
在AI負(fù)載環(huán)境下,通過(guò)固件調(diào)度優(yōu)化和延遲控制,其隨機(jī)讀延遲可以壓縮至50微秒級(jí),從而減少推理場(chǎng)景中GPU等待I/O的時(shí)間。
并且,通過(guò)對(duì)固件和硬件架構(gòu)的協(xié)同優(yōu)化,高密度QLC在AI數(shù)據(jù)湖和推理場(chǎng)景中既能提供更大的容量密度,也能維持穩(wěn)定的性能表現(xiàn)。
對(duì)于需要存儲(chǔ)海量訓(xùn)練數(shù)據(jù)或推理緩存的集群而言,這類(lèi)產(chǎn)品正在成為實(shí)現(xiàn)“全閃數(shù)據(jù)中心”的關(guān)鍵一步。
![]()
AI重構(gòu)存儲(chǔ)路徑:企業(yè)級(jí)SSD從「容量介質(zhì)」轉(zhuǎn)向「算力系統(tǒng)變量」
在這一輪由 AI 推動(dòng)的存儲(chǔ)重構(gòu)中,一個(gè)更清晰的共識(shí)正在形成:企業(yè)級(jí)SSD的價(jià)值錨點(diǎn),正在從“單點(diǎn)性能指標(biāo)”轉(zhuǎn)向“系統(tǒng)確定性”。
無(wú)論是KV Cache大規(guī)模卸載帶來(lái)的架構(gòu)遷移,還是QLC在高密度存儲(chǔ)中的重新定位,抑或是固件層對(duì)延遲、QoS 與功耗的持續(xù)壓縮,本質(zhì)上都在指向同一個(gè)問(wèn)題:存儲(chǔ)不再只是容量與帶寬的提供者,而是決定算力是否能夠被穩(wěn)定釋放的基礎(chǔ)變量。
在這個(gè)意義上,行業(yè)的競(jìng)爭(zhēng)邊界也在悄然上移。
單一硬件能力的差異正在被系統(tǒng)級(jí)能力所稀釋,真正拉開(kāi)差距的,是誰(shuí)能更早理解AI工作負(fù)載的變化,并將其轉(zhuǎn)化為可規(guī)模化、可持續(xù)優(yōu)化的工程體系。
當(dāng)算力、存儲(chǔ)與網(wǎng)絡(luò)進(jìn)一步融合,數(shù)據(jù)中心的邏輯也將從“資源堆疊”走向“效率組織”。
而存儲(chǔ),正站在這一輪重構(gòu)的交匯點(diǎn)上。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.