![]()
"一旦DeepSeek率先在華為平臺上發布,對美國而言將是災難性的結果"。
這里的"我國"指美國
![]()
這不是托尼說的,而是英偉達黃仁勛在某個播客上的原話。如今DeepSeek V4的出現,讓老黃的預言成真了?
作為大家苦等了一年多的 DeepSeek 大版本迭代,只看性能差友們可能會略有失望。但 DeepSeek V4 是真便宜,價格對比國外模型直接腰斬屬于是。
![]()
關于模型的具體內容,在白天的文章中已經提到,就不重復了。
但托尼覺得,隨著這次發布,意義更重大的,是深度求索選擇在華為昇騰平臺上進行首發,結合下午的直播,這意味著 DeepSeek 完成了在國產硬件上的訓練適配。
根據網友爆料,這次最先支持國產硬件訓練的是 DeepSeek V4 Flash 的后訓練過程,基于國產硬件的預訓練也有望在今年下半年實現。
換句話說,從今天開始,大家嚷嚷了很久的 AI 全流程使用國產硬件,一下子就實現了!
大家可以把華為的昇騰平臺理解為連 AI 芯片都是國產的 AI 計算平臺。
![]()
假如一年以前有人跟我說,純國產的AI平臺能夠支撐一款旗艦模型的全鏈路研發,托尼我也不敢相信。
但現在它就是成了,這對于國產AI的發展影響是很深遠的。
之前老黃沒少拿這個事兒游說美國政府 讓自己賣貨 ,按照老黃的意思,在 AI 軍備競賽中,從底層的電力,冷卻,消防這些基礎設施,到芯片、服務器等算力設施,再到軟件生態和模型的架構演進,這些要素都缺一不可,樣樣都贏才能贏麻到最后。
AI 是一塊“五層蛋糕” - NVIDIA 博客- 英偉達
![]()
而咱們的優勢,無疑是祖國強大的基建能力,以及充足的人才儲備。這些能讓我們打造出很多高性價比的模型。
但不得不承認,我們的芯片制程離世界頂端,確實有些差距。好在 AI 需要的芯片,打的是規模戰、集群戰。所以工程師們想了些辦法,來解決制程上的不足。
一來,雖然制程工藝有限制,但芯片可以在不計成本的情況下,通過暴力堆規模,來提升算力。而在配套的內存上,國產也有自研 HBM(高帶寬內存),來保證帶寬沒有瓶頸。
![]()
二來,雖然單顆芯片性能有限,但架不住量大管飽啊,把大量的芯片利用起來,組合成一個"計算中心",塞進機柜里,其實就是這兩年火熱的超節點。
![]()
超節點的概念就是英偉達提出的,老黃也做了相應的布局,NVL72 系統把 72 個Blackwell GPU 集成到一個液冷機柜中,達成了約 180 PFLOPs 的 FP16 算力。
而國產芯片們想要堆出近似算力,就需要拿出更多的芯片。所以去年華為昇騰拿出了 384 超節點,通過 12 個機柜,每個機柜 32 張卡,硬是堆出 300 PFLOPs 算力,接近 NVL72 的兩倍了。而今年差評更是在 MWC 現場看到了華為最新的 Atlas 950,也就是 8192 卡互聯的超節點。
![]()
可最嚴重的一環,其實是生態。
托尼不得不承認,老黃是真有遠見的。20年前,英偉達就開始為了 CUDA 生態埋伏筆,甚至犧牲掉了 GeForce 游戲顯卡的利潤,導致有一段時間差點在和 ATi/AMD 的競爭中死掉。
但英偉達成功熬到了黎明。所以差友們能看到,現在幾乎所有 AI 相關的基礎模型和優化都基于 CUDA 來運轉、后起的 GPU、TPU 等 AI 計算生態都要向它低頭。
![]()
甚至包括之前 DeepSeek 親手打造的護城河之一:PTX 底層語言優化,也是為了把NVIDIA GPU 的性能榨干,讓模型效率更高,從而讓 DeepSeek 模型更有性價比。
也因此,對于國內來說,在制裁的大背景下,不論是華為昇騰的 CANN,還是摩爾線程的 MUSA,目前還要做對 CUDA 的兼容性支持,來讓開發者能更快適應自家芯片。
但咱們也不能一直活在別人屋檐下。構建屬于自己的軟件生態,迫在眉睫。所以最近幾年托尼也開始看到像 TileLang 這類由中國主導的生態項目,嘗試在不同的方向構建出屬于自己的護城河。
![]()
就是這些項目對于 CUDA 生態來說,并沒有什么傷筋動骨的攻擊性。
直到這次的 DeepSeek V4 更進一步,直接拒絕了英偉達和AMD的提前適配,而是選擇華為昇騰和國產 CANN 軟件生態。
![]()
也就是說,這次DeepSeek想要表達的其實是:不用美國的芯片和技術,我們自己也能做出足夠先進的大模型。
托尼不得不感慨深度求索的這波操作:一方面是真的爭氣,另一方面,其實也是在把 DeepSeek 變成一個標桿,向其他國產大模型喊話:全國產鏈路已經跑通了,你們都可以來試試。
除此之外呢?還有什么理由讓國產模型擁抱國產 AI 硬件生態嗎?
最近一個月大家應該有感知,大模型的能力越來越強,強到已經不只是能對話的程度了。
前段時間 Anthropic 發布的 Mythos 模型,就號稱"強到不敢直接發布",而是首先交給蘋果、英偉達、微軟等巨頭,用來檢測安全漏洞,加強網絡防御。
![]()
也就是說,AI 已經不僅僅是一個對話窗口,一個效率工具,一個智能助手。未來甚至現在的模型,已經進化到可以在網絡安全層面進行攻防了。這意味著 AI 已經從普通人使用的工具,成長為國家之間攻防的矛與盾。
不論如何,從硬件到軟件,從模型到生態,全鏈路國產化,是必須要做的。這樣才能真正不被英偉達等國外公司卡脖子。
當英偉達的GPU不再是唯一選擇,當CUDA 護城河不再牢固,當咱們的AI人才越來越多,生態越來越繁榮,產業界的底氣自然也會越來越足。
回頭看DeepSeek V4發布通告的結束語:不誘于譽,不恐于誹,率道而行,端然正己,這不僅是對國內AI公司應當腳踏實地的宣言,更是對國產AI硬件生態,這么多年一步一步走過來的肯定。
![]()
老黃的預言,或許已經成為現實。
撰文:洛洛
編輯:米羅 & 面線 & 結界
美編:煥妍
圖片、資料來源:
bilibili
英偉達官網
53ai.com
it之家
昇騰CANN
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.