无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

揭Blackwell機密計算傷疤:禁NVLink組播讓大模型性能暴降61%

0
分享至

一個GitHub工單,撕開了英偉達最新Blackwell架構在安全與性能之間難以兩全的傷口。用戶@verdacloud提交的issue顯示,當開啟機密計算(Confidential Computing)后,Blackwell直接禁用了NVLink組播,這項硬件級閹割令SGLang引擎上Qwen3.5 397B大模型的推理速度驟降61%。消息經由SemiAnalysis跟進放大,迅速在AI基礎設施圈炸開了鍋——畢竟在多數人的認知里,安全不該讓性能倒退回上一代的水平,而這恰恰發(fā)生了。

要理解這61%的殺傷力,得先看清NVLink組播在大模型分布式推理中的角色。在張量并行方案里,一個巨大的模型矩陣被切分到多張GPU上,每張卡完成局部計算后,需要立即把結果共享給其他所有卡進行下一步匯總。NVLink組播的精髓在于,一塊GPU只需要把一份數據丟到鏈路上,它就能自動廣播到所有參與通信的GPU,就像群聊里@所有人一次把話說完。一旦失去組播,變成了點對點逐個發(fā)消息,原本N張卡只需1次廣播,現在就要進行N-1次點對點拷貝,通信量呈倍數膨脹,推理延遲成倍拉長。SGLang作為主流的大模型推理引擎,嚴重依賴這種廣播機制來壓低多卡協(xié)同的通信開銷,當廣播管道被硬生生切斷,吞吐與延遲的雙重災難就來了。61%的性能回退,直接將397B參數的千問模型拖到了商用可接受門檻之下,更不用說那些對實時性毫秒必爭的金融交易或在線客服場景。


諷刺的是,這一刀本不該砍得如此深,源頭還要追溯到上一代Hopper的“半吊子”安全。英偉達官方白皮書《NVIDIA Secure AI with Blackwell and Hopper GPUs》不經意間揭了短:Hopper的機密計算其實從未對NVLink鏈路進行加密,也就是說,它的“機密”模式是漏風的,GPU之間的高速通信鏈路仍在裸奔,組播自然暢通無阻。Blackwell為了彌補這個安全窟窿,不得不把內存加密與隔離推到NVLink層面,代價就是硬件級的組播功能必須關閉。這不是一個可以通過補丁修復的軟件缺陷,而是一道硅片設計之初就寫死的選擇——你要真正的全棧機密,就告別NVLink組播;你要極限性能,就繼續(xù)承受前代未加密鏈路帶來的潛在竊聽風險。對于追求零信任環(huán)境的企業(yè)用戶,這成了一記悶棍。

受影響最深的當屬金融、醫(yī)療、政府等受監(jiān)管行業(yè),它們部署大模型時必須通過機密計算來阻止特權管理員或云廠商側窺探敏感數據。Qwen3.5 397B這類巨量模型在內部知識檢索、合規(guī)審計、病歷分析等任務中恰好扮演著核心角色,但61%的性能回歸意味著,原本能在幾百毫秒內給出答案的服務,現在要以秒為單位拖延,交互流暢度被直接碾碎。客戶被迫陷入二選一的囚徒困境:要么為了硬性合規(guī)吞咽性能劣化,要么選擇裸金屬推理而擔上數據泄露風險。某種意義上,Blackwell并沒有降低機密計算的門檻,反而讓門檻升高了,因為過去Hopper的用戶至少能在未加密的狀態(tài)下享受無損性能,而現在性能打折成了一項不可協(xié)商的條款。

這并非孤例。今年早些時候,英偉達的Grace Hopper超級芯片就因機密計算模式下內存帶寬不足而招致批評,如今Blackwell在NVLink上的讓步讓這個模式更加清晰:英偉達似乎更在意搶先將機密計算作為市場賣點推出去,而非在所有維度上做到萬無一失。從Hopper的不完全加密,到Blackwell的完整加密卻自斷組播臂膀,兩代產品的安全故事彼此矛盾,暴露出快速迭代中對技術取舍的粗糙縫合。對于依賴英偉達全棧方案的云廠商和超大規(guī)模算力中心,這意味著它們在規(guī)劃多租戶安全推理集群時,要被迫預留出巨額的性能冗余,甚至可能推遲Blackwell的部署進程,等待下一代架構或競品的回應。

值得深思的是,機密計算本身背負的期待與它帶來的折損之間,橫亙著一條整個行業(yè)都還沒跨過去的鴻溝。61%的數字是個極端場景的明證,但背后揭示的是任何高性能互聯(lián)與全面加密之間的天然排斥。在分布式大模型推理成為常態(tài)的今天,NVLink組播這類高效通信原語一旦被安全策略抹掉,無異于給現代GPU集群做了一次神經阻斷手術,帶來的疼痛會從單次推理蔓延到整個集群的成本模型中。@verdacloud提交的這張工單,或許只是個開頭,它撕開的不僅是Blackwell的一個缺口,更是整個加速計算行業(yè)要對機密計算“性能代價”重新標價的信號。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
1-0爆冷!天津津門虎掀翻中超第3名,于根偉把4隊拖入保級軍團

1-0爆冷!天津津門虎掀翻中超第3名,于根偉把4隊拖入保級軍團

何老師呀
2026-05-31 21:04:48
最強一戰(zhàn)!張鎮(zhèn)麟23+9+6導大勝奪賽點 距生涯第4冠僅差1勝

最強一戰(zhàn)!張鎮(zhèn)麟23+9+6導大勝奪賽點 距生涯第4冠僅差1勝

醉臥浮生
2026-05-31 21:13:54
僅出戰(zhàn)16分鐘,正負值就達到+25!上海男籃想建立王朝必須留下他

僅出戰(zhàn)16分鐘,正負值就達到+25!上海男籃想建立王朝必須留下他

弄月公子
2026-05-31 23:48:39
上海博物院的水平比臺北博物院差了100倍

上海博物院的水平比臺北博物院差了100倍

回旋鏢
2026-05-31 16:52:14
2026款吉利牛仔上新,武士黑限時7.59萬值不值

2026款吉利牛仔上新,武士黑限時7.59萬值不值

野生運營
2026-05-31 01:25:54
敦促平臺立即糾正處置“耿同學”的錯誤行為

敦促平臺立即糾正處置“耿同學”的錯誤行為

不主流講話
2026-05-30 18:55:08
鬧笑話了!黃仁勛攤牌:看不上華為韜定律,卻被業(yè)內專家說不專業(yè)

鬧笑話了!黃仁勛攤牌:看不上華為韜定律,卻被業(yè)內專家說不專業(yè)

兵鑒史
2026-05-30 14:32:11
6月這些地區(qū)或發(fā)生超警以上洪水 相關預防舉措已部署

6月這些地區(qū)或發(fā)生超警以上洪水 相關預防舉措已部署

新華社
2026-05-31 14:23:26
2-0晉級!中國女網18歲1米81新星崛起:鄭欽文王欣瑜后繼有人

2-0晉級!中國女網18歲1米81新星崛起:鄭欽文王欣瑜后繼有人

李喜林籃球絕殺
2026-05-31 21:00:21
央媒調查稻城亞丁“道路設卡擺渡收費”:收的什么費?景區(qū)有權設卡嗎?

央媒調查稻城亞丁“道路設卡擺渡收費”:收的什么費?景區(qū)有權設卡嗎?

澎湃新聞
2026-05-31 07:54:04
消息稱尊界S800成功后,華為在幫助國產供應商發(fā)展高端子品牌

消息稱尊界S800成功后,華為在幫助國產供應商發(fā)展高端子品牌

IT之家
2026-05-31 12:33:24
貴陽花果園閃婚騙局調查:娶妻流水線,女子上午離婚下午結婚

貴陽花果園閃婚騙局調查:娶妻流水線,女子上午離婚下午結婚

上游新聞
2026-05-31 14:46:25
48小時6連殺!伊朗直接封神

48小時6連殺!伊朗直接封神

深度報
2026-05-31 22:41:28
極端大風突襲哈爾濱:過山車停擺倒掛半空,游客步行下撤;體育場頂棚被刮散,張信哲、張韶涵巨星演唱會緊急延期

極端大風突襲哈爾濱:過山車停擺倒掛半空,游客步行下撤;體育場頂棚被刮散,張信哲、張韶涵巨星演唱會緊急延期

極目新聞
2026-05-31 22:48:44
87分鐘絕殺歐洲隊!日本劍指世界杯8強,韓國5-0狂勝,孫興慜雙響

87分鐘絕殺歐洲隊!日本劍指世界杯8強,韓國5-0狂勝,孫興慜雙響

侃球熊弟
2026-05-31 20:31:27
成都多家茶館被同一個號碼舉報“無證泡茶” 商家懷疑遭“職業(yè)索賠”報警獲受理

成都多家茶館被同一個號碼舉報“無證泡茶” 商家懷疑遭“職業(yè)索賠”報警獲受理

封面新聞
2026-05-31 18:34:39
7年敗光2個億,鄒市明冉瑩穎共同發(fā)文,終究還是踏出了這一步

7年敗光2個億,鄒市明冉瑩穎共同發(fā)文,終究還是踏出了這一步

林輕吟
2026-02-11 11:29:40
俄烏戰(zhàn)爭一旦結束,最先“倒下”的可能是這五個國家

俄烏戰(zhàn)爭一旦結束,最先“倒下”的可能是這五個國家

民間胡扯老哥
2026-05-31 09:40:36
江蘇太倉一飛行營地墜機致死案續(xù):獲賠256.8萬元,家屬稱將上訴

江蘇太倉一飛行營地墜機致死案續(xù):獲賠256.8萬元,家屬稱將上訴

澎湃新聞
2026-05-31 13:40:27
最近倆月,形勢大變

最近倆月,形勢大變

明人明察
2026-05-31 19:46:13
2026-06-01 06:15:00
我是一個養(yǎng)蝦人
我是一個養(yǎng)蝦人
有態(tài)度網友ytd
4260文章數 40關注度
往期回顧 全部

科技要聞

戴爾諾基亞又回來了!AI重估老牌科技公司

頭條要聞

特朗普生日白宮辦格斗賽 近距離觀賽花超100萬美元

頭條要聞

特朗普生日白宮辦格斗賽 近距離觀賽花超100萬美元

體育要聞

阿森納用最悲壯的方式,成就了巴黎王朝

娛樂要聞

朱軍退休,正義雖遲但到,女方受懲

財經要聞

醫(yī)學首席轉崗搞科技,A股科技股遭遇巨震

汽車要聞

900V+3.2秒破百 領克10+&領克10上市16.99萬元起

態(tài)度原創(chuàng)

教育
房產
數碼
本地
公開課

教育要聞

跟以前相比,文光成績斷崖式下跌的原因是多方面的,其中最主..

房產要聞

紅動五月!全國搶入核心資產,廣州盯緊凱旋新世界!

數碼要聞

蘋果眼鏡最新爆料:多款式設計,內部代號N50,延期2027年底發(fā)布

本地新聞

用剪紙的方式,打開江蘇揚州

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版