就在最近,兩大國產AI巨頭DeepSeek和Kimi幾乎同時發力,向全球開源了他們的萬億參數大模型。
這不僅在性能上硬剛硅谷巨頭,更關鍵的是,它們實現了對國產芯片的深度適配。
一個容易被忽視卻至關重要的細節是,這兩個模型并非各自為戰。
![]()
DeepSeekV2在訓練中用上了此前由Kimi團隊驗證和改進過的優化器,而Kimi去年發布的模型也采用了DeepSeek的架構。
這背后,是中國AI開源生態的默契配合。
因為算力被“卡脖子”,中國的大模型早就告別了單打獨斗,走向了“抱團取暖、協同進化”的集體智慧模式。
![]()
靠著這種“神仙配合”,中國AI在算力被壓制的環境下,只用了美國頂尖公司不到十分之一的資源,就造出了能追平硅谷巨頭的模型。
賬單上的對比最為直觀:GPT-4的訓練成本高達7800萬美元,而DeepSeekV2只花了約557.6萬美元,KimiK2甚至只用了460萬美元。
![]()
反觀大洋彼岸,OpenAI和Anthropic等巨頭陷入了激烈的內耗。從公開嘲諷到商業互搏,為了爭奪有限的客戶預算和資本市場的青睞,它們消耗了大量精力。
美國的“閉源”陣營打的是壟斷和商業戰,而中國的開源陣營打的是效率戰和生存戰。
核心目標就是把每一份寶貴的算力、每一分錢都花在刀刃上,拼命壓低訓練和推理的成本。
更硬核的博弈,發生在國產芯片的突圍上。DeepSeekV2深度適配華為昇騰等國產芯片,實現了頂級開源模型與頭部國產芯片的強強聯手,硬是在英偉達的重重包圍中撕開了一道口子。
![]()
同時,Kimi的新研究也證明,模型訓練的不同階段可以使用不同類別的芯片,這為國產芯片的大規模入局打開了技術大門。
當然,必須承認,國產模型在綜合能力上可能仍與頂尖閉源模型存在差距。也有人指出,DeepSeek和Kimi的估值加起來,或許還不及對手的零頭。
但問題的關鍵已經變了。
![]()
現階段,底層模型的突破,早已超越了單純“賺錢”的商業范疇,它關乎的是技術自主,是“不被卡脖子”的底氣。
這就像當年的原子彈,不是為了主動攻擊誰,而是當別人想封鎖、想打壓我們的時候,我們手里有足夠分量的重器,腰桿能挺得筆直。
![]()
開源協同,高效務實,芯片突圍這就是當前中國AI面對壓制時,給出的集體答案。它或許不那么華麗,但足夠堅韌,也足夠有力量。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.