就在最近,兩大國(guó)產(chǎn)AI巨頭DeepSeek和Kimi幾乎同時(shí)發(fā)力,向全球開源了他們的萬億參數(shù)大模型。
這不僅在性能上硬剛硅谷巨頭,更關(guān)鍵的是,它們實(shí)現(xiàn)了對(duì)國(guó)產(chǎn)芯片的深度適配。
一個(gè)容易被忽視卻至關(guān)重要的細(xì)節(jié)是,這兩個(gè)模型并非各自為戰(zhàn)。
![]()
DeepSeekV2在訓(xùn)練中用上了此前由Kimi團(tuán)隊(duì)驗(yàn)證和改進(jìn)過的優(yōu)化器,而Kimi去年發(fā)布的模型也采用了DeepSeek的架構(gòu)。
這背后,是中國(guó)AI開源生態(tài)的默契配合。
因?yàn)樗懔Ρ弧翱ú弊印保袊?guó)的大模型早就告別了單打獨(dú)斗,走向了“抱團(tuán)取暖、協(xié)同進(jìn)化”的集體智慧模式。
![]()
靠著這種“神仙配合”,中國(guó)AI在算力被壓制的環(huán)境下,只用了美國(guó)頂尖公司不到十分之一的資源,就造出了能追平硅谷巨頭的模型。
賬單上的對(duì)比最為直觀:GPT-4的訓(xùn)練成本高達(dá)7800萬美元,而DeepSeekV2只花了約557.6萬美元,KimiK2甚至只用了460萬美元。
![]()
反觀大洋彼岸,OpenAI和Anthropic等巨頭陷入了激烈的內(nèi)耗。從公開嘲諷到商業(yè)互搏,為了爭(zhēng)奪有限的客戶預(yù)算和資本市場(chǎng)的青睞,它們消耗了大量精力。
美國(guó)的“閉源”陣營(yíng)打的是壟斷和商業(yè)戰(zhàn),而中國(guó)的開源陣營(yíng)打的是效率戰(zhàn)和生存戰(zhàn)。
核心目標(biāo)就是把每一份寶貴的算力、每一分錢都花在刀刃上,拼命壓低訓(xùn)練和推理的成本。
更硬核的博弈,發(fā)生在國(guó)產(chǎn)芯片的突圍上。DeepSeekV2深度適配華為昇騰等國(guó)產(chǎn)芯片,實(shí)現(xiàn)了頂級(jí)開源模型與頭部國(guó)產(chǎn)芯片的強(qiáng)強(qiáng)聯(lián)手,硬是在英偉達(dá)的重重包圍中撕開了一道口子。
![]()
同時(shí),Kimi的新研究也證明,模型訓(xùn)練的不同階段可以使用不同類別的芯片,這為國(guó)產(chǎn)芯片的大規(guī)模入局打開了技術(shù)大門。
當(dāng)然,必須承認(rèn),國(guó)產(chǎn)模型在綜合能力上可能仍與頂尖閉源模型存在差距。也有人指出,DeepSeek和Kimi的估值加起來,或許還不及對(duì)手的零頭。
但問題的關(guān)鍵已經(jīng)變了。
![]()
現(xiàn)階段,底層模型的突破,早已超越了單純“賺錢”的商業(yè)范疇,它關(guān)乎的是技術(shù)自主,是“不被卡脖子”的底氣。
這就像當(dāng)年的原子彈,不是為了主動(dòng)攻擊誰,而是當(dāng)別人想封鎖、想打壓我們的時(shí)候,我們手里有足夠分量的重器,腰桿能挺得筆直。
![]()
開源協(xié)同,高效務(wù)實(shí),芯片突圍這就是當(dāng)前中國(guó)AI面對(duì)壓制時(shí),給出的集體答案。它或許不那么華麗,但足夠堅(jiān)韌,也足夠有力量。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.