文/王新喜
梁文鋒的歷史性的一刻,今天DeepSeek放出了兩個新產品,一個叫V4 Flash,一個叫V4 Pro。它們都開源了,號稱是目前最強的開源AI。這兩個產品出來之后,意味著DeepSeek已無法阻擋,黃仁勛發飆被理解了。
距離去年1月的大版本更新已經過去了15個月,DeepSeek這次在海內外全網發布大更新后,熱度飆升。
![]()
為什么飆升,因為它的推理性能全面超越所有已知開源模型,成績直接比肩世界頂級閉源模型(GPT/Gemini)。知識儲備與Google的Gemini Pro只差一丟丟,屬于開源模型天花板。
其次是,其Agent能力史上最強。內部員工已用它來AI編程,體驗直接超過了Claude Sonnet 4.5,交付質量已經接近Opus 4.6的非思考模式。DeepSeek V4和GPT-5.5誰更強?哪些領域哪個更領先?從目前公開信息和基準來看,兩者各有側重,沒有絕對碾壓。
![]()
而DeepSeek的1.6萬億參數,只用了同業大概四分之一的GPU,以及10%的存儲。
海外社媒有不少網友也第一時間關注了DeepSeek的更新,在DeepSeek 評論區,大家紛紛表示,“鯨魚回來了”“便宜又強大”“這太震撼了,如果那些效率突破成立的話”。
![]()
值得一提的是,業界一直在關注DeepSeek-V4是否會使用國產算力,從推文來看確實是與華為昇騰合作。DeepSeek V4 在芯片選擇上做出了一個非常具有戰略意義的決定:它在推理部署方面主要使用了華為的昇騰系列國產芯片,并全面轉向華為的 CANN 架構。
所以說這一次V4的發布可以看作是中國AI的一場生死戰,V4的發布,讓所有人都明白了,為何前段時間黃仁勛公開罕見發飆,怒噴美國對中國的芯片封鎖。
DeepSeek已無法阻擋,終于明白黃仁勛為何發飆了
就在近期一檔Dwarkesh Patel的播客專訪中,英偉達首席執行官黃仁勛明確表示,若中國AI初創公司DeepSeek將其新模型優化適配至華為芯片,對美國而言將是“一個可怕的結果”。
![]()
這句話出自全球最重要的AI芯片供應商之口,分量不輕,背后的信號很微妙。因為就在這場訪談的前一周,多家媒體已經爆料DeepSeek下一代旗艦模型V4全面遷移至華為昇騰950PR,底層代碼從CUDA重寫為華為自研的CANN框架。也就是說,黃仁勛之所以會有這樣的結論,其實已經知道DeepSeek V4的發布,這件事已經在路上了。
![]()
DeepSeek是開源的,理論上可以跑在任何加速器上,即便它在華為昇騰上首發,在英偉達GPU上同樣能跑,區別到底在哪里?黃仁勛的回答泄露了真正讓他介意的東西——
“假設它是針對華為優化的,針對他們的架構化了,那就會讓我們處于劣勢”。
為什么?因為這意味著Deepseek將對英偉達GPU硬件與CUDA軟件,都將產生沖擊力。
首先,從硬件層面來看,DeepSeek在2025年初橫空出世,以極低的訓練成本實現了接近頂尖水準的模型性能,震動全球。
它證明了堆算力這條路并不是唯一解,足夠聰明的算法工程師依然能訓練出令人生畏的模型。如今DeepSeek V4再次證明了這一點。
華為計算發文表示,昇騰一直同步支持DeepSeek系列模型,本次通過雙方芯模技術緊密協同,實現昇騰超節點全系列產品支持DeepSeek V4系列模型。
![]()
昇騰950通過融合kernel和多流并行技術降低Attention計算和訪存開銷,大幅提升推理性能,結合多種量化算法,實現了高吞吐、低時延的DeepSeek V4模型推理部署。
從價格看,DeepSeek 提到,V4-Pro每百萬tokens輸入是1元,輸出是12元,V4-Flash每百萬tokens輸入是0.2元,輸出是2元。“太普惠了,還是那個DeepSeek。”有網友感慨。
![]()
DeepSeek在小字中表示,受限于高端算力,目前Pro的服務吞吐十分有限,預計下半年昇騰950超節點批量上市后,Pro的價格會大幅下調。
DeepSeek再一次示范了:用更少的算力,做出不差的模型,并擁有更具性價比的價格優勢,如果這套方法論能在華為芯片平臺上進一步打磨成熟,美國通過硬件封鎖建立的護城河,就會比想象中淺得多。
此外是,隨著DeepSeek那套極致壓縮算力需求的技術,與華為不斷成熟的本土芯片生態深度綁定,中國的AI產業鏈就有可能在不依賴任何美國硬件的前提下,實現自給自足的高速發展。
目前這個勢頭正在起來,DeepSeek V4帶動了從芯片、服務器到云服務的全鏈條需求,中國AI周調用量已達美國的4倍多。
這就對英偉達的真正護城河CUDA產生了沖擊效應。
英偉達真正的護城河從來不是GPU本身的算力,而是CUDA作為“事實標準”的軟件生態位。過去近二十年里,幾乎所有主流AI框架、算子庫、開源模型的首發優化,都把CUDA作為默認起點。英偉達的CUDA就跟當年的Windows一樣,軟件、工具、教程、開發者全圍著它轉。
![]()
你要是一直用CUDA,越用依賴越深。但對于中國市場的大模型來說,過度依賴CUDA,等于把自己的命根子交給英偉達——它一漲價、一斷供,你就直接傻眼。再加上美國一制裁,高端卡不賣給你,你就算會CUDA也沒用,也就是說,DeepSeek如果沒有擺脫對CUDA的依賴,那么它會發展到什么高度,命運始終是掌握在別人手里的。
所以DeepSeek要掌握自己的生存權與主導權,必須擺脫對CUDA的依賴,如今,DeepSeek事實上已經成為全球第一個不依賴英偉達的前沿AI大模型。
英偉達的CUDA護城河開始漏水
過去十幾年,全球AI都被CUDA鎖死,DeepSeek把這堵墻撞開了一個大口子,DeepSeek在昇騰上發布,驗證了至少存在一條真實、可運行、被頂級模型驗證過的非CUDA路徑,并且這條路徑上會沉淀下一批熟練的工程師、一套可復制的優化經驗、以及第一批用戶信心。
這才是黃仁勛那句“災難性”的真實分量:不怕某一款芯片被替換,但怕“開源模型必須以CUDA為首要優化目標”這條默認規則出現反例,而中國已經走出了不依賴美國的另一條路,只要DeepSeek徹底擺脫對英偉達的依賴,那么DeepSeek未來走到什么高度,是美國無法阻擋的。
黃仁勛的警告拋出了一個美國一個非常糾結的戰略困境:繼續收緊出口管制,短期內能延緩中國獲取頂尖硬件,但長期可能加速中國本土替代生態的成熟,放松管制,則意味著直接為潛在競爭對手輸送核心工具。
但是DeepSeek已經不糾結了,已經下決心把這條路跑通。這對國產芯片公司+被卡算力的國內互聯網巨頭,具有歷史性意義,國產芯片+國產AI生態適用成熟后,AI服務的成本大幅降低,企業部署成本較海外方案降低70%以上,為產業鏈上下游硬件、軟件、工具、開發者創造海量就業機會,并且將主導權掌握在自己手里。
DeepSeek官方公眾號最后一段說:“不誘于譽,不恐于誹,率道而行,端然正己。我們將始終秉持長期主義的原則理念,努力向實現AGI的目標不斷靠近。”
長期主義,不執著于一時的勝負,愿Deepseek的這句話引領所有想要改變世界的中國科技行業從業者前行,攀登科技之巔。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.