无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

當英偉達開始補存儲的課,華為已經給出了中國的答案

0
分享至



文 | 智能相對論

作者 | 陳泊丞

數十億建成的萬卡GPU集群,實際利用率不足40%。

這不是某個智算中心的個例。在過去兩年里,中國涌現了大大小小幾十個智算中心項目,GPU買了一批又一批,但真正跑滿的時候不多。問題不在芯片本身——而在數據供給跟不上。

GPU在空轉,等存儲喂數據。這件事說起來簡單,但背后卻是一筆巨大的“沉沒成本”:花了幾十億建算力,最后發現瓶頸卡在存儲上。

事實上,整個行業都在討論“算力瓶頸”,但真正拖慢中國AI落地節奏的,很可能是存儲。

有意思的是,正是在這屆GTC上,英偉達第一次把“存儲”放到了與“算力”并列的位置。它在超節點中內置獨立的存儲柜,定義新的AI存儲參考架構(STX/CMX),并聯合12家存儲廠商發布解決方案——這不是英偉達的常規操作。



一家靠GPU起家的公司,為什么突然對存儲這么上心?這背后,是AI產業底層邏輯的一次根本性轉變。

英偉達在GTC上給全行業補了一堂存儲課

要理解英偉達在GTC上的動作,先得回答一個問題:為什么它要在這個節點做這件事?

答案的背后是一個正在發生的大趨勢:從“訓練為王”到“推理為王”的階段性轉變。

過去幾年,AI行業的主要矛盾是“模型不夠大、訓練不夠久”。那時候存儲是配角,GPU喂飽了數據就行。但是,當大模型開始大規模落地,推理變成了主戰場,整個故事的底層邏輯就變了。

推理需要什么?實時、低延遲、海量隨機讀寫的數據訪問。這跟訓練階段完全不同——訓練可以批處理,而推理必須秒級響應;訓練可以提前準備好數據,而推理得隨時待命。

黃仁勛在CES和GTC上都說過一句話:“KV Cache的激增足以催生一個全新的存儲市場”。這話聽著像營銷,但仔細想想,GPU廠商第一次公開承認“計算不再是最稀缺的資源,數據供給才是”,這本身就是信號。



基于這個認知,英偉達在GTC上直接打出了三張關鍵牌,分別為CMX、AIDP和SCADA,對應回答的是不同層次的問題。

首先,CMX也就是G3.5層,回答“推理太貴”的問題。當KV Cache從顯存溢出到存儲池,推理成本的核心矛盾從“算力貴”變成“數據供給貴”。英偉達用CMX架構把存儲性能與GPU計算進行了深度綁定,這套玩法本質上是“極致協同設計”——存儲不再是外掛硬盤,而是GPU系統的延伸。

其次,AIDP回答“數據不敢動”的問題。深入行業真實需求來看,企業不是沒有數據,而是數據不敢搬、不能搬。譬如,金融客戶的數據出不了機房,政務系統的數據有合規要求,醫療數據碰都不能碰。因此,英偉達提出“Data-in-Place”(數據就地處理),本質是讓AI能力下沉到存儲里,減少數據的搬運。

最后,SCADA 回答“GPU吃不飽”的問題。在推薦系統、圖神經網絡這些場景,GPU需要從海量數據中隨機讀取極小粒度的數據。然而,傳統I/O路徑太重,GPU經常“餓著肚子等數據”。為此,SCADA允許GPU繞過了CPU直接訪問存儲,帶寬接近HBM,支持EB級數據集——很顯然,這是為未來的實時決策場景鋪路。

三張牌,三層問題,從眼前到當下再到未來,構成了英偉達對AI存儲的完整判斷。也正是在這個判斷下,英偉達喊出了“2026 is the year of AI storage”。

中國市場的“冰與火”:最旺盛的需求與最普遍的誤判

把視線拉回中國。

事實上,中國是全球AI存儲需求最旺盛的市場——這話不算夸張。智能客服、RAG知識中臺、代碼生成、自動駕駛仿真、智能制造......這些場景的落地速度實實在在走在了全球前列。

在政策層面,“人工智能+”全面鋪開,數據要素×三年行動計劃啟動,“東數西算”2.0推動算電協同——從合規、基建到成本,政策紅利也在多個維度拉動了高質量存儲建設。

客觀而言,需求是真的。但這枚硬幣還有另一面。

多數智算中心的存儲投入占比不足10%,剩下的錢幾乎全砸進了GPU服務器。結果呢?GPU集群利用率普遍低于40%,“算力過剩與存儲瓶頸并存”成了一種荒誕的現實。花了幾十億買算力,最后發現卡脖子的不是芯片,是數據供給。



這不是技術問題,是認知問題。整個行業的注意力都被“算力”兩個字吸走了,沒人認真想過,卡能跑滿嗎?

更棘手的是,冰層之下還有結構性掣肘,不是喊兩句口號就能解決的。

比如標準缺失。面向昇騰、海光這類國產算力的存儲架構和評測標準幾乎空白,廠商各自為戰,集成成本高企。再比如生態碎片化。國內存儲產業硬件能力強,但核心軟件能力比如KV Cache調度算法、數據就地處理引擎——與英偉達的“極致協同設計”相比,還有肉眼可見的差距。

中國有最大的市場需求,但缺乏把需求轉化為產品的生態協同能力。這個矛盾不解決,需求旺盛就只是數字好看,落不了地。

最核心的問題,可能要靠存儲廠商來回答

那么,這個局怎么破?

回歸一個樸素的問題:誰最懂數據?

當整個行業都在討論“用更多GPU訓練更大模型”時,做存儲的人在琢磨另一件事:數據從哪來、如何治理、怎么讓AI用得上——這是兩種完全不同的視角。算力廠商看的是“模型需要多少Flops”,存儲廠商看的是“模型需要多少數據、怎么高效喂進去”。

這個視角差異,在AI大規模落地的階段,變得前所未有的重要。

英偉為什么要定義AIDP參考架構并交給存儲廠商推出解決方案在企業落地?因為越來越多的廠商意識到,數據供給的入口正在成為AI基礎設施的核心卡口。存儲不再是配角,它可以是主角,是AI系統的“數據中樞”。

正是基于這個判斷,華為打破了傳統存儲的煙囪式結構,用一套底座即AIDP(AI Data Platform)架構覆蓋了三大場景。



這套架構的核心邏輯其實很樸素:客戶不需要為KV Cache、AIDP、SCADA分別建三套系統,這不是成本問題,是現實不允許。舉個例子,一個智算中心可能有昇騰和海光的卡要兼顧,一個金融機構的數據不能出域但又要支撐實時推理——這些矛盾不是買更多GPU能解決的,需要的是一套能統一調度、分層處理、漸進演進的存儲架構。

圍繞這個邏輯,華為在每一層都埋了具體的能力。

G3.5層,UCM(統一緩存管理器)實現顯存與存儲間的秒級熱遷移,推理并發能力提升數倍——這解決的是“推理貴”的問題,讓PB級KV Cache不再必須駐留在昂貴的HBM顯存里。

企業AI層,VSS向量檢索和RAG能力直接內嵌到存儲系統,數據不用搬出去就能被調用——這解決的是“數據不敢動”的問題,合規要求不是束縛,而是架構設計的起點。

SCADA層,預留GPU Initiate IO接口,支持未來GPU直接訪問超大規模數據集——這一步是面向未來的,目前能落地的場景有限,但架構要提前站位。

三層能力對應三層價值:眼前的降本、當下的合規、未來的擴展。這不是功能堆砌,是有優先級判斷的演進路線。

落地層面,基于OceanStor A800高性能AI存儲和OceanStor Dorado全閃存存儲,華為提供了一體化和獨立式兩種交付模式——前者面向新建場景,后者面向存量系統的漸進式改造。不同客戶的現實處境不同,解法也不同,這本身就是務實的體現。

說到底,中國AI存儲市場需要的不是“英偉達的中國版”,而是一條適配本土需求的務實路徑。華為在做這件事,不代表它是唯一答案,但這條路線的核心判斷——統一底座、平滑演進、數據安全內生,確實回應了當前市場最真實的痛點。

結語

GTC 2026或許只是起點。

英偉達在補課,存儲廠商在解題,中國市場的需求在倒逼整個行業重新審視這個問題。當“算力”不再是稀缺資源的代名詞,數據供給的效率正在成為下一階段AI競爭的關鍵變量。

當然,“重算力、輕存力”的慣性思維不會自動消失。它需要有人指出這個問題,需要有人用實際案例證明:存儲投入的ROI,可能比追加GPU更能提升整個系統的效率。

這不是華為一家公司的事。這是整個行業都需要回答的問題。

*本文圖片均來源于網絡

聲明:個人原創,僅供參考

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
上海奪冠后大白邊最新動態!已成功簽約下家:盧偉這下真被打臉了

上海奪冠后大白邊最新動態!已成功簽約下家:盧偉這下真被打臉了

籃球快餐車
2026-06-12 15:22:04
美方宣布對9個駐香港的中國籍個人和實體實施制裁,外交部回應

美方宣布對9個駐香港的中國籍個人和實體實施制裁,外交部回應

新京報
2026-06-12 16:00:07
非法入境!砸護欄偷渡,印度人放話“死都不回”

非法入境!砸護欄偷渡,印度人放話“死都不回”

李云飛Afey
2026-06-11 19:37:53
CCTV5直播中國男籃VS澳大利亞!楊瀚森領銜,郭士強為世預賽布局

CCTV5直播中國男籃VS澳大利亞!楊瀚森領銜,郭士強為世預賽布局

老葉評球
2026-06-11 22:15:58
谷歌實時翻譯模型上線,支持70種語言

谷歌實時翻譯模型上線,支持70種語言

字節漫游指南
2026-06-10 10:05:15
9歲男孩吃了夜市提拉米蘇,全麻開腹手術進了ICU:你的那口隨便的甜,可能要了孩子的命!

9歲男孩吃了夜市提拉米蘇,全麻開腹手術進了ICU:你的那口隨便的甜,可能要了孩子的命!

消化石醫生
2026-06-09 20:08:20
鬧心!奧迪純電SUV,提車三天“故障頻發”!上海車主7個月報修10次,結果更鬧心

鬧心!奧迪純電SUV,提車三天“故障頻發”!上海車主7個月報修10次,結果更鬧心

新民晚報
2026-06-12 19:26:49
為期4個月,全城嚴查!

為期4個月,全城嚴查!

臺州交通廣播
2026-06-12 20:21:26
馬刺1-3危機四伏!米奇該不該下課?波波維奇在下一盤大棋

馬刺1-3危機四伏!米奇該不該下課?波波維奇在下一盤大棋

世界體育圈
2026-06-12 18:27:08
“人生第一次被槍頂著腦門!”中國球迷講述驚魂一刻:到墨西哥看世界杯,剛出機場就遇飛車黨,“槍頂在我們頭上,搶完坐摩托就跑了……”

“人生第一次被槍頂著腦門!”中國球迷講述驚魂一刻:到墨西哥看世界杯,剛出機場就遇飛車黨,“槍頂在我們頭上,搶完坐摩托就跑了……”

大風新聞
2026-06-12 15:44:04
董潔陰間造型炸上熱搜!網友:賠她點錢吧

董潔陰間造型炸上熱搜!網友:賠她點錢吧

李東陽朋友圈
2026-06-09 21:48:18
百姓躺平擺爛,食稅群體怎么辦?

百姓躺平擺爛,食稅群體怎么辦?

律法刑道
2026-06-03 09:30:48
就喝了兩次!周身淤堵通了,暗黃全褪,臉色紅潤透亮到發光

就喝了兩次!周身淤堵通了,暗黃全褪,臉色紅潤透亮到發光

白米飯怎么吃
2026-06-11 13:11:05
河南“零分女生”蔣多多:因不滿高考制度,在試卷上寫8000字長文

河南“零分女生”蔣多多:因不滿高考制度,在試卷上寫8000字長文

混沌錄
2026-06-09 22:03:13
一張圖引爆虎撲:你們歡迎她再來中國嗎?

一張圖引爆虎撲:你們歡迎她再來中國嗎?

熱搜摘要官
2026-06-12 01:17:39
開完850公里我才敢說實話:小米YU7和Model Y,真不是一個路子

開完850公里我才敢說實話:小米YU7和Model Y,真不是一個路子

小怪吃美食
2026-06-10 16:13:54
扎心啊!女方直言不愿婚后成家中免費保姆,被男友怒斥是“巨嬰”

扎心啊!女方直言不愿婚后成家中免費保姆,被男友怒斥是“巨嬰”

火山詩話
2026-06-12 06:43:48
湖北能源集團原總經理文振富被開除黨籍:搞權色交易、錢色交易;貪欲膨脹,非法收受巨額財物!曾任武漢市副市長、湖北省國資委主任

湖北能源集團原總經理文振富被開除黨籍:搞權色交易、錢色交易;貪欲膨脹,非法收受巨額財物!曾任武漢市副市長、湖北省國資委主任

大風新聞
2026-06-12 11:19:09
釣魚島爆發激烈對峙,日艦艇囂張挑釁查船,中國海警當即警告回擊

釣魚島爆發激烈對峙,日艦艇囂張挑釁查船,中國海警當即警告回擊

共工之錨
2026-06-10 14:39:09
癌癥的源頭被查出,燒烤沒上榜,第1名大家可能每天都在吃!

癌癥的源頭被查出,燒烤沒上榜,第1名大家可能每天都在吃!

路醫生健康科普
2026-06-12 16:23:10
2026-06-12 21:04:49
智能相對論 incentive-icons
智能相對論
智能和車,邊評邊測;未來和家,且品且鑒
2559文章數 2412關注度
往期回顧 全部

科技要聞

鴻蒙7發布,余承東:首個完成AI化改造系統

頭條要聞

國內最大黃金盜竊案告破:價值2700萬 兩主犯身份披露

頭條要聞

國內最大黃金盜竊案告破:價值2700萬 兩主犯身份披露

體育要聞

歐洲恐韓?肉德維德?

娛樂要聞

一天4個瓜,肖戰熱巴最意外

財經要聞

萬億美元順差背后,透露這些信號

汽車要聞

BJ30旅行家高光版正式上市 超級置換價8.29萬起

態度原創

親子
藝術
家居
數碼
軍事航空

親子要聞

給孩子報個幼兒園還要工資流水?難道這就是傳說中的“因財施教”

藝術要聞

這部章草口訣歌,干貨滿滿,建議全文背誦!

家居要聞

空間微調 移形換境

數碼要聞

1182萬塊!2026Q1全球獨顯出貨量公布:英偉達壟斷90%市場

軍事要聞

伊朗媒體:已故最高領袖葬禮推遲舉行

無障礙瀏覽 進入關懷版