无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

熱點丨DeepSeek與Kimi“心有靈犀”,國產AI的突破與路線共識

0
分享至


·聚焦:人工智能、芯片等行業

歡迎各位客官關注、轉發

前言

4月的AI圈,月之暗面發布Kimi K2.6開源模型,將Agent集群能力推至300個子Agent并行協同的新高度。

深度求索DeepSeek V4如約而至,把百萬級上下文的推理成本壓縮至前代的27%。

一周之內,兩個總參數超萬億的開源模型先后落地,全球技術社區的討論熱度持續攀升。

過去15個月里,兩家公司在關鍵技術節點上的同步,已經到了讓人會心一笑的程度。

從同日發布推理模型、前后腳更新底層架構論文,到互相復用驗證過的核心技術、不約而同攻堅Transformer底層基石。

這種被網友戲稱[心有靈犀]的默契,早已不是簡單的巧合。

作者| 方文三

圖片來源 | 網絡


被精準對齊的技術節奏

兩家公司的技術演進路徑,每一個關鍵節點的同步,都指向行業最核心的技術命題。

2025年1月,DeepSeek-R1推理模型與Kimi K1.5多模態思考模型同日上線,相隔僅兩個小時。

二者均是國內最早復現OpenAI o1思維鏈技術的團隊,直接把國產大模型的復雜推理能力拉到了全球第一梯隊。

2025年7月,Kimi發布K2開源模型,被《自然》雜志稱為[又一個DeepSeek時刻]。

這個萬億參數模型的技術報告里,明確采用了DeepSeek-V3首創的MLA多隱頭注意力機制。

同時首次在萬億級規模上驗證了二階優化器Muon的可行性,替代了行業沿用十年的Adam優化器。

九個月后,DeepSeek V4正式官宣,絕大多數模塊改用Muon優化器,完成了對這項技術的進一步優化與落地。


在Transformer底層架構的重構上,兩家的動作同樣高度同頻。

2026年初,DeepSeek推出mHC流形約束超連接技術,改造深度學習網絡的殘差連接,將訓練效率提升30%。

僅兩個月后,Kimi發布的注意力殘差技術論文,同樣針對Transformer的核心結構實現突破。

甚至在長上下文這條核心賽道上,兩家也選擇了不同解法、同一目標。

Kimi深耕線性注意力機制,將長文本計算復雜度從O(n2)降至O(n),從理論層面實現極致優化。


DeepSeek則聚焦DSA稀疏注意力架構,把百萬級上下文的KV Cache顯存占用壓縮至原有10%。

這種同步沒有陷入同質化內卷,反而形成了清晰的能力互補。

DeepSeek始終聚焦模型底層的效率重構,把訓練與推理成本打到極致,用全棧開源建立開發者信任。

Kimi則從長文本能力出發,逐步向長程編碼、Agent集群、復雜工程任務落地延伸,解決模型如何真正融入工作流的核心問題。

一個筑牢底層技術底座,一個拓寬產業落地邊界,路線看似不同,卻共同撐起了國產開源模型的全球競爭力。


默契背后的國產AI路線共識

DeepSeek與Kimi的技術同頻,是行業浪潮奔涌到臨界點時,技術規律與時代大勢共同書寫的答案。

經過三年多的摸石過河,中國AI終于走出了一條區別于硅谷的、屬于自己的發展道路。

開源生態的正向循環,是這份默契形成的核心基石。

開源從來不是簡單的代碼開放,而是一套[創新-驗證-復用-再創新]的飛輪機制。

當DeepSeek將驗證成熟的MLA注意力機制開源,Kimi便跳過了無數試錯的深坑,直接在萬億級模型上完成規模化驗證。

當Kimi分享Muon優化器的萬億級落地經驗,DeepSeek又能在此基礎上迭代優化,適配更多產業場景。


與OpenAI、Anthropic等海外巨頭將技術鎖在閉源黑箱中不同,中國的頭部玩家選擇把創新變成全行業的公共財富,讓單點突破快速裂變成為集體躍遷。

如今,二者已是中國唯二總參數超萬億、權重完全公開的模型,連英偉達GTC大會都用它們來演示下一代芯片性能,這正是開源生態贏得的全球尊重。

行業核心命題的轉變,讓所有真正的探索者走向了同一條賽道。

當[堆參數]的內卷走到盡頭,行業的終極考題變成了:如何在有限的算力約束下,實現模型能力的持續突破,讓技術真正轉化為生產力。

這個命題直接決定了技術路線的收斂,用更低的成本,造更強的模型,做更實的落地。

DeepSeek與Kimi的同頻,本質上是兩家都精準擊中了行業的核心矛盾。

他們沒有滿足于在海外巨頭劃定的框架里做微創新,而是不約而同地扎進了大模型最硬核的根技術:優化器、注意力機制、殘差連接。


選擇重構底層框架這條路注定艱難,但正是這份對底層創新的執念,讓國產AI第一次擁有了和海外巨頭掰手腕的底氣。

海外持續升級的算力管制,則是這份路線共識形成的最強外部推力。

無限堆砌高端算力的路徑早已被堵死,中國AI必須在算法創新與工程優化上殺出一條血路,用更少的算力,實現更好的效果。

Kimi直言不具備無限算力的條件,因此始終死磕算法與系統效率。

DeepSeek則用極致的工程優化,將模型推理成本降到了行業頂尖水平,V4-Flash的API價格僅為海外同類產品的百分之一。


真正的技術普惠,從來不是喊出來的口號,而是用極致的工程創新,把AI的門檻踩到泥土里,讓千行百業都能輕松踏上去,用得起、用得好。

站在行業的坐標系中回望,DeepSeek與Kimi雖選擇了不同的突圍路徑,卻正奔赴同一個終點,而中國AI的三大核心共識已清晰成型。

①全面擁抱開源,與美國[閉源為主+高定價]的模式形成鮮明對比。

②錨定自主可控的算力底座,模型的能力上限,終究取決于算力體系的可控底線。

③讓應用需求重新定義技術方向,徹底脫離[為參數而參數]的內卷,回歸[為價值而創新]的本質。

硅谷在[造墻],中國在[修路]。

墻的核心是控制與壟斷,試圖用技術壁壘守住先發優勢。

路的核心是連接與開放,用生態的繁榮撬動更長遠的未來。

從DeepSeek為華為昇騰重寫200多個核心算子,到Kimi K2.6在昇騰、壁仞等國產芯片上快速跑通......

黃仁勛那句[如果DeepSeek先在華為平臺發布,對美國將是可怕的結果],恰恰印證了這條路的力量。

這條路是被逼出來的,但歷史無數次證明,被迫的創新往往能打開全新的天地。


全球AI格局發生微妙的變化

2026年一季度,OpenRouter官方數據顯示,Kimi K2.6在調用量榜單上沖到全球第一,DeepSeek V3.2排名第四。

這個平臺是全球最大的AI API聚合市場,調用量排名反映的是真實的市場選擇。

更耐人尋味的是下游應用的變化,Cursor Composer 2發布時,對外宣稱是[自研]。

但很快被技術社區扒出底座是Kimi K2.5,不是簡單調用API,是直接拿K2.5微調出來的。

Cursor創始人后來接受采訪時承認:[Kimi K2.5是我們測試過的最強基座模型]。

日本樂天Rakuten的AI助手也用上了DeepSeek V3作為底座,當一個開源模型的性能足以對標閉源頂級選手時,理性的選擇就是用它。

斯坦福大學的一份報告顯示,中美頂級AI大模型性能差距已從2024年的17.5%,縮小到2025年的0.3%。這個數字可能有些理想化,但趨勢是明確的。

中國AI的新敘事,正在從Copy to China變成Copy from China。


結尾:

十四個月前,梁文鋒說:中國AI最需要證明的是[能不能做出一款世界級的基礎模型]。

十四個月后,楊植麟說:問題已經變成[在被封鎖的算力生態里,能不能持續地做、一起做,讓基礎能力的躍遷變成常態]。

現在,DeepSeek和Kimi,兩個廣東年輕人,正在用萬億參數的開源模型,把這句話翻譯成現實。

部分資料參考:字母榜:《這一次,梁文鋒和楊植麟隔空握手》,機器之心:《翻完DeepSeek報告,我們發現了中國AI的默契》,APPSO:《扒完 DeepSeek V4 報告,我翻出了這個隱藏彩蛋》,鳳凰網科技:《兩個廣東人的五次撞車,撞出最強開源雙雄的底氣?》,騰訊科技:《中國芯片,DeepSeek與Kimi的隱秘交點》

本公眾號所刊發稿件及圖片來源于網絡,僅用于交流使用,如有侵權請聯系回復,我們收到信息后會在24小時內處理。

請務必注明:

「姓名 + 公司 + 合作需求」

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
1-0!3-0!隨著韓國隊“爆冷”輸球,亞洲首支晉級32強賽球隊誕生

1-0!3-0!隨著韓國隊“爆冷”輸球,亞洲首支晉級32強賽球隊誕生

童叔不飆車
2026-06-26 00:56:19
公然侮辱張桂梅、惡意挑起地域歧視 一女子被云南警方行拘

公然侮辱張桂梅、惡意挑起地域歧視 一女子被云南警方行拘

新京報
2026-06-26 07:31:07
全網暴怒!球迷狂批美國女主裁:水平太差 錯誤多于正確 令人失望

全網暴怒!球迷狂批美國女主裁:水平太差 錯誤多于正確 令人失望

風過鄉
2026-06-26 06:13:44
阿森納后悔嗎!8000 萬棄將世界杯封神!含金量完爆德羅巴

阿森納后悔嗎!8000 萬棄將世界杯封神!含金量完爆德羅巴

瀾歸序
2026-06-26 07:50:44
厄瓜多爾2比1德國:足球沒有理所當然!

厄瓜多爾2比1德國:足球沒有理所當然!

張佳瑋寫字的地方
2026-06-26 06:32:00
0-3,將歐洲球隊臉都丟光了,水平和國足差不多,怎么進世界杯的

0-3,將歐洲球隊臉都丟光了,水平和國足差不多,怎么進世界杯的

我就是一個說球的
2026-06-25 19:03:20
“多人將兩女子關鐵籠游街”?湖南汨羅:擺拍,策劃組織者何某被刑拘,龔某某等8人被行拘

“多人將兩女子關鐵籠游街”?湖南汨羅:擺拍,策劃組織者何某被刑拘,龔某某等8人被行拘

環球網資訊
2026-06-26 07:37:06
世界杯最幸運球隊誕生:3輪1勝,以小組第3晉級32強,創造了歷史

世界杯最幸運球隊誕生:3輪1勝,以小組第3晉級32強,創造了歷史

球場沒跑道
2026-06-25 09:41:06
沒想到,這部12年前的劇,口碑也翻車了!

沒想到,這部12年前的劇,口碑也翻車了!

劇芒芒
2026-06-24 18:09:23
小組賽還沒結束,已經有第三名出線了

小組賽還沒結束,已經有第三名出線了

澎湃新聞
2026-06-25 20:44:14
超巴西獨享第1!薩內處子球 德國1-2厄瓜多爾時隔12年重返淘汰賽

超巴西獨享第1!薩內處子球 德國1-2厄瓜多爾時隔12年重返淘汰賽

釘釘陌上花開
2026-06-26 05:58:42
一個重卡司機換電車的糾結與煩惱

一個重卡司機換電車的糾結與煩惱

經濟觀察報
2026-06-25 17:26:16
美軍震不震驚不清楚我反正挺震驚

美軍震不震驚不清楚我反正挺震驚

阿亮評論
2026-06-25 18:51:44
會發生嗎?給凱恩下咒的加納巫師:C羅將會在今年奪得世界杯冠軍

會發生嗎?給凱恩下咒的加納巫師:C羅將會在今年奪得世界杯冠軍

全景體育V
2026-06-26 05:43:36
出差北京發現個奇怪現象:很多四五十歲的人不上班,就吃白菜豆腐

出差北京發現個奇怪現象:很多四五十歲的人不上班,就吃白菜豆腐

據說說娛樂
2026-06-26 01:36:11
給韓國隊算分!世界杯小組第3最新形勢:6隊同分,比利時無緣前8

給韓國隊算分!世界杯小組第3最新形勢:6隊同分,比利時無緣前8

球場沒跑道
2026-06-25 12:07:52
香港演員苗金鳳去世,享年81歲!《女人俱樂部》成最后作品

香港演員苗金鳳去世,享年81歲!《女人俱樂部》成最后作品

TVB劇評社
2026-06-25 21:39:08
中國菲律賓在黃巖島發生武裝對峙

中國菲律賓在黃巖島發生武裝對峙

鳳眼論
2026-06-25 18:45:27
開場7分鐘2-0!荷蘭殺瘋了,要親自送日本遇巴西,瑞典打平就出線

開場7分鐘2-0!荷蘭殺瘋了,要親自送日本遇巴西,瑞典打平就出線

侃球熊弟
2026-06-26 07:29:34
Here we go!羅馬諾:森林中場埃利奧特-安德森1.3億鎊加盟曼城

Here we go!羅馬諾:森林中場埃利奧特-安德森1.3億鎊加盟曼城

懂球帝
2026-06-26 05:10:11
2026-06-26 08:59:00
AI芯天下 incentive-icons
AI芯天下
從芯出發,用心服務
6794文章數 170關注度
往期回顧 全部

科技要聞

美國政府要求OpenAI分批發布GPT-5.6

頭條要聞

牛彈琴:委內瑞拉強震或致10萬人死亡 美歐被指負主責

頭條要聞

牛彈琴:委內瑞拉強震或致10萬人死亡 美歐被指負主責

體育要聞

世界杯最動人一吻:我若離世 你就改嫁吧

娛樂要聞

這國產劇太裝了,居然還熱播第一?

財經要聞

懸在科技頭上的達摩克利斯之劍

汽車要聞

老板們的新座駕!65萬元起,尊界V800/V680開啟預訂

態度原創

教育
時尚
手機
游戲
數碼

教育要聞

高考志愿怎么填?黃仁勛說:孩子學什么專業并不重要?看教育部38個新專業就懂了

本科畢業后,我花15萬上大專

手機要聞

REDMI K90至尊版再曝:165Hz屏,8550mAh電池

《零度空間》PC配置需求公布 3060Ti就能爽玩

數碼要聞

iPad/Mac等漲價只是開始?蘋果聲明暗示后續還有新一輪調價

無障礙瀏覽 進入關懷版