快科技4月25日消息,DeepSeek V4正式發布當天,華為昇騰CANN官方隨即通過直播宣布V4已在昇騰平臺完成首發,國產模型與國產算力的組合首次進入實戰部署階段。
消息傳出的同一天,英偉達官方技術博客緊急發文,宣布DeepSeek V4已在Blackwell平臺完成適配,并曬出實測數據——GB200 NVL72上每用戶推理速度超過150 tokens/秒。
![]()
這份同日官宣,措辭專業、數據齊全,但發布節點之急迫,將焦慮暴露無遺。
更戲劇性的是,黃仁勛10天前才說過一句話。他在一檔播客中直言,如果頂尖AI模型被優先優化用于華為芯片而非英偉達平臺,這對我們而言將是災難性的。
事實上,英偉達并非沒有技術底牌。V4-Flash采用FP4+FP8混合精度,FP4目前僅Blackwell及之后的高端芯片原生支持。
值得一提的是,只靠Blackwell才能跑V4的壁壘,發布當天就被國產方案繞了過去。
智源FlagOS同日宣布實現了FP4到BF16的精度路徑轉換,將V4-Flash適配到了海光、沐曦、華為昇騰、摩爾線程、昆侖芯、平頭哥真武、天數等8款以上國產芯片上,把適配周期從數周壓縮至數天。
華為昇騰Atlas 350加速卡是國內目前唯一支持FP4低精度的推理產品,單卡算力達到英偉達H20的2.87倍。
DeepSeek官方也在定價說明中透露,預計下半年昇騰950超節點批量上市后,Pro版價格將大幅下調。
目前英偉達的NVIDIA NIM微服務已上線DeepSeek V4,SGLang和vLLM同步提供部署方案。從首日表現看,英偉達即便仍是主角,但不再是唯一的主角。
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.