一個GitHub工單,撕開了英偉達最新Blackwell架構在安全與性能之間難以兩全的傷口。用戶@verdacloud提交的issue顯示,當開啟機密計算(Confidential Computing)后,Blackwell直接禁用了NVLink組播,這項硬件級閹割令SGLang引擎上Qwen3.5 397B大模型的推理速度驟降61%。消息經由SemiAnalysis跟進放大,迅速在AI基礎設施圈炸開了鍋——畢竟在多數人的認知里,安全不該讓性能倒退回上一代的水平,而這恰恰發(fā)生了。
要理解這61%的殺傷力,得先看清NVLink組播在大模型分布式推理中的角色。在張量并行方案里,一個巨大的模型矩陣被切分到多張GPU上,每張卡完成局部計算后,需要立即把結果共享給其他所有卡進行下一步匯總。NVLink組播的精髓在于,一塊GPU只需要把一份數據丟到鏈路上,它就能自動廣播到所有參與通信的GPU,就像群聊里@所有人一次把話說完。一旦失去組播,變成了點對點逐個發(fā)消息,原本N張卡只需1次廣播,現在就要進行N-1次點對點拷貝,通信量呈倍數膨脹,推理延遲成倍拉長。SGLang作為主流的大模型推理引擎,嚴重依賴這種廣播機制來壓低多卡協(xié)同的通信開銷,當廣播管道被硬生生切斷,吞吐與延遲的雙重災難就來了。61%的性能回退,直接將397B參數的千問模型拖到了商用可接受門檻之下,更不用說那些對實時性毫秒必爭的金融交易或在線客服場景。
![]()
諷刺的是,這一刀本不該砍得如此深,源頭還要追溯到上一代Hopper的“半吊子”安全。英偉達官方白皮書《NVIDIA Secure AI with Blackwell and Hopper GPUs》不經意間揭了短:Hopper的機密計算其實從未對NVLink鏈路進行加密,也就是說,它的“機密”模式是漏風的,GPU之間的高速通信鏈路仍在裸奔,組播自然暢通無阻。Blackwell為了彌補這個安全窟窿,不得不把內存加密與隔離推到NVLink層面,代價就是硬件級的組播功能必須關閉。這不是一個可以通過補丁修復的軟件缺陷,而是一道硅片設計之初就寫死的選擇——你要真正的全棧機密,就告別NVLink組播;你要極限性能,就繼續(xù)承受前代未加密鏈路帶來的潛在竊聽風險。對于追求零信任環(huán)境的企業(yè)用戶,這成了一記悶棍。
受影響最深的當屬金融、醫(yī)療、政府等受監(jiān)管行業(yè),它們部署大模型時必須通過機密計算來阻止特權管理員或云廠商側窺探敏感數據。Qwen3.5 397B這類巨量模型在內部知識檢索、合規(guī)審計、病歷分析等任務中恰好扮演著核心角色,但61%的性能回歸意味著,原本能在幾百毫秒內給出答案的服務,現在要以秒為單位拖延,交互流暢度被直接碾碎。客戶被迫陷入二選一的囚徒困境:要么為了硬性合規(guī)吞咽性能劣化,要么選擇裸金屬推理而擔上數據泄露風險。某種意義上,Blackwell并沒有降低機密計算的門檻,反而讓門檻升高了,因為過去Hopper的用戶至少能在未加密的狀態(tài)下享受無損性能,而現在性能打折成了一項不可協(xié)商的條款。
這并非孤例。今年早些時候,英偉達的Grace Hopper超級芯片就因機密計算模式下內存帶寬不足而招致批評,如今Blackwell在NVLink上的讓步讓這個模式更加清晰:英偉達似乎更在意搶先將機密計算作為市場賣點推出去,而非在所有維度上做到萬無一失。從Hopper的不完全加密,到Blackwell的完整加密卻自斷組播臂膀,兩代產品的安全故事彼此矛盾,暴露出快速迭代中對技術取舍的粗糙縫合。對于依賴英偉達全棧方案的云廠商和超大規(guī)模算力中心,這意味著它們在規(guī)劃多租戶安全推理集群時,要被迫預留出巨額的性能冗余,甚至可能推遲Blackwell的部署進程,等待下一代架構或競品的回應。
值得深思的是,機密計算本身背負的期待與它帶來的折損之間,橫亙著一條整個行業(yè)都還沒跨過去的鴻溝。61%的數字是個極端場景的明證,但背后揭示的是任何高性能互聯(lián)與全面加密之間的天然排斥。在分布式大模型推理成為常態(tài)的今天,NVLink組播這類高效通信原語一旦被安全策略抹掉,無異于給現代GPU集群做了一次神經阻斷手術,帶來的疼痛會從單次推理蔓延到整個集群的成本模型中。@verdacloud提交的這張工單,或許只是個開頭,它撕開的不僅是Blackwell的一個缺口,更是整個加速計算行業(yè)要對機密計算“性能代價”重新標價的信號。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.