網易首頁 > 網易號 > 正文 申請入駐

深度丨K2.5 180億美元,DeepSeek 200億美元,接下來輪到K2.6出牌

0
分享至


DeepSeek的V4還沒等到,Kimi K2.6先來了。

發布之后,最先被點燃的,依舊是 X上的全球開發者圈。

Artificial Analysis 的榜單很快有了新的變化,Kimi K2.6 已強勢重奪全球開源模型的第一的寶座。


硅谷對這款模型的反應已經從早期的“禮貌圍觀”變成了某種帶著急迫感的“硬核審視”。Ruby on Rails 之父 DHH 公開宣稱自己從 K2.5 開始就是其超級粉絲,并用“不可思議”來形容 K2.6 表現出的各項指標 。


緊接著,Abacus AI 首席執行官 Bindu Reddy 更是直截了當地給出了定性判斷:Kimi K2.6 在 agentic coding 方面的表現已達到 Opus 4.7 的水準。


Notion 團隊在評估后發現,Kimi K2.6 在某些子類任務中的表現甚至超越了 GPT-5.2;為此,團隊通過全員沖刺,在發布首日便實現了 K2.6 在 Notion 產品中的正式上線。


更具戲劇性的一幕發生在硬件市場。由于開發者們急于在本地部署并跑通這個能夠對標頂級閉源智能的模型,海外甚至出現了 Mac Studio 和 Mac Mini 全線斷貨的奇觀,測評人 Alex Finn 預言,人們正見證著將私有化超級智能搬上辦公桌的智能爆炸時刻。


這種性能的爆發,本質上是中國大模型正在用極致的工程重構,去對沖算力封鎖帶來的物理上限。這不再僅僅是關于“誰的模型更聰明”,而是在資源受限的特定賽道上,利用更廉價的推理成本——比 Opus 4.7 便宜約 5 到 6 倍的價格——去交付更重、更復雜的業務邏輯 。

在這個節點上,Kimi 的高頻迭代與 DeepSeek V4 呼之欲出的傳聞再次“撞車”。但這絕非簡單的檔期沖突,而是一次關于底層基礎設施的戰略匯流。

水面之下,兩家最具代表性的中國 AI 實驗室正共同面對一個終局命題:在算力紅利邊際遞減的時代,如何通過模型與芯片的垂直咬合,建立中國 AI 的生態王國。

K2.6,不止于代碼

如果只看發布信息,Kimi K2.6的小版本號很容易被歸類為一次“標準升級”,涵蓋了更強的代碼能力、更穩定的執行以及對 Agent 框架的適配。

但在前沿模型集體“卷”基礎能力的背景下,Kimi 的迭代節奏反映出一條清晰的技術路徑:讓模型從“會回答問題”,徹底走向“可以持續執行任務”。


這種提升首先體現在“長程執行”上。官方數據與海外實測均顯示,K2.6 能連續執行超過12小時。

更代差級的形態在于 Kimi 將Agent 集群(Agent Swarm)能力推向了極限。K2.6 不再只是一個執行單元,而進化為一個調度系統,支持多達 300 個子 Agent 同時協作。這意味著模型不再直接給出答案,而是組織一組能力去解決問題。

這也解釋了為何 Notion 團隊會反復強調“工作流(Workflow)”一詞:開發者關注的不再是單個函數的優劣,而是模型能否自主接管從調試到迭代的整個閉環。代碼能力的提升只是副產品,真正被放大的是模型組織生產力的能力。


當模型真的開始大規模干活,另一個根本命題隨之浮現:它要如何“跑得起”?在英偉達 GTC 演講中,楊植麟曾指出舊有的技術路徑正逐漸成為 Scaling Law 持續演進的瓶頸 。這一判斷預示著,現有的技術范式正在限制大模型擴展的經濟性。

Kimi 過去幾個月的技術探索——從 MuonClip 到 Kimi Linear,再到 Attention Residuals——都在指向同一個目標:在不無限堆砌算力的前提下實現持續擴展。

上周末,Kimi發布了一篇新論文《Prefill-as-a-Service: KVCache of Next-Generation Models Could Go Cross-Datacenter》,通過 Prefill(預填充)與 Decode(解碼)的深層解耦,Kimi 打破了物理空間的限制。


傳統的解耦大多局限在單一數據中心,而 Kimi 借助混合模型架構壓縮 KV Cache 體積,使得計算密集的 Prefill 可以放在遠端高算力集群,而帶寬密集的 Decode 則放在近端。這一變化的深遠意義在于,它打破了大模型推理必須綁定在同一種高端 GPU 上的隱含前提。

這種重構直接重寫了大模型推理的經濟學。Kimi 強調的“Token 降本”不再單純來自模型微調,而是源于模型結構、推理流程與硬件資源重新分配的三重疊加。這是一個關于在受限算力條件下如何繼續擴展的“系統故事”。

中國模型正為國產芯片定制入場券

在 PrfaaS 的演進中,最極具產業殺傷力的詞其實是異構硬件。一旦推理流程實現“分權”,大模型推理就不再必須死磕在某種特定的高端 GPU 上。這意味著高算力芯片負責 Prefill,高帶寬芯片負責 Decode,國產芯片不再只是性能不足時的無奈替代,而是可以在特定環節中成為系統最優解的一部分。

進入 2026 年,約束條件發生了劇變。一方面,高端芯片供給側持續收緊,“有沒有卡”已經壓倒了“好不好用”;另一方面,當 Agent 集群和長程任務成為主流,推理不再是一次性請求,而是持續的系統行為,天然適合通過異構方式分攤壓力。國產算力正從“可選項”迅速轉變為“必選項”。

Kimi 通過重構推理系統,讓使用不同芯片在工程上變得既合理又必要。正如開發者在 X 上驚嘆,Kimi 通過 Zig 語言重寫推理過程等硬核優化,在特定硬件上跑出了遠超主流方案的吞吐量 。這種通過系統工程改變問題、再順勢給出答案的做法,為國產芯片的規?;雸鐾崎_了大門。

至此,Kimi 與 DeepSeek 的交匯變得清晰。表面上是跑分與產品節奏的競爭,深層里則是被推理成本、算力缺口和系統效率等宏觀約束所塑造。

無論是 Kimi 的工業級 Agent 協作,還是 DeepSeek 呼之欲出的新架構,最終都要進入“自主算力”這條河流。模型與芯片不再是簡單的上下游買賣,而是共同決定系統能否成立的命運共同體。

在物理極限下,完成模型與芯片的咬合

Kimi K2.6 的發布,實質上劃定了一道分水嶺:大模型正式從單一的“對話框”,跨向工業級的“生產系統” 。

而今天,K2.6 所展現的架構創新——從PD 分離異構算力的深度協同——其背后蘊含的商業想象空間,顯然比單純的能力提升更為巨大。這不再只是一個更聰明的模型,而是一套更高效的生產組織方式 。

這種長程執行力將原本隱藏在跑分背后的成本壓力,徹底推向了臺前 。Kimi 正在通過底層的系統重構證明:在算力受限的真實環境下,通過架構層面的創新,依然能實現對頂級閉源模型的性價比壓制 。這不僅是技術的勝利,更是對大模型推理經濟學的重新定義。

這正是中國 AI 突圍的真實底色:不再單純追趕參數規模,而是在主動重構系統去適配底座算力。芯片不再是可有可無的背景板,而是決定系統生死的一號工程。

就在今天傍晚,據外媒報道,阿里等大廠正以超過200億美金的估值投資DeepSeek,而這一數字據稱是參考了Kimi當前的180億美金?;乜磧蓚€月前,K2.5的橫空出世憑借落地能力的質變,讓Kimi估值在短短 60 天內飆升了 4 倍,接下來,又輪到K2.6出牌的節奏。

加入ZF討論群,請先添加小助手微信

我們相信認知能夠跨越階層,

致力于為年輕人提供高質量的科技和財經內容。

稿件經采用可獲邀進入Z Finance內部社群,優秀者將成為簽約作者,00后更有機會成為Z Finance的早期共創成員。

我們正在招募新一期的實習生

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
明明有133套湯臣一品的房子,卻過得想自殺,一個月才花一萬塊錢

明明有133套湯臣一品的房子,卻過得想自殺,一個月才花一萬塊錢

人生錄
2026-05-08 19:07:58
我50歲才悟出一個道理:凡是從不參加同學聚會、不愛發動態、不混圈子的人,十有八九在這兩個方面遠超常人,觀察了身邊上百人屢試不爽

我50歲才悟出一個道理:凡是從不參加同學聚會、不愛發動態、不混圈子的人,十有八九在這兩個方面遠超常人,觀察了身邊上百人屢試不爽

心理觀察局
2026-05-08 10:35:21
價格敲定!巴薩7500萬歐元可拿下英超全能前鋒,性價比拉滿

價格敲定!巴薩7500萬歐元可拿下英超全能前鋒,性價比拉滿

夜白侃球
2026-05-08 09:02:06
建議大家:馬桶沖水時,不能做這3個動作,危害很大,可別大意!

建議大家:馬桶沖水時,不能做這3個動作,危害很大,可別大意!

家居設計師蘇哥
2026-05-08 13:03:44
雷霆被炮轟!不被吹犯規且假摔頻頻!雷迪克撕破遮羞布,怒噴裁判

雷霆被炮轟!不被吹犯規且假摔頻頻!雷迪克撕破遮羞布,怒噴裁判

聽我說球
2026-05-09 07:30:10
國乒如何能贏法國?王楚欽與林詩棟的場次是關鍵,小心法國出黑馬

國乒如何能贏法國?王楚欽與林詩棟的場次是關鍵,小心法國出黑馬

聊體育的小哥
2026-05-09 06:55:45
曝王暖暖凌晨被送往醫院搶救!全身浮腫、滿臉脹紅,昏迷原因曝光

曝王暖暖凌晨被送往醫院搶救!全身浮腫、滿臉脹紅,昏迷原因曝光

動物奇奇怪怪
2026-05-08 17:16:36
卡西利亞斯向弗洛倫蒂諾放話:“我會再次簽下哈維·阿隆索”

卡西利亞斯向弗洛倫蒂諾放話:“我會再次簽下哈維·阿隆索”

綠茵情報局
2026-05-08 19:49:44
隨著菲律賓0-0,韓國0-3,女足亞洲杯八強對陣出爐:中國PK弱旅

隨著菲律賓0-0,韓國0-3,女足亞洲杯八強對陣出爐:中國PK弱旅

側身凌空斬
2026-05-08 21:27:26
終身告別胰島素?央視點贊糖尿病新療法,干細胞開啟“根治”時代

終身告別胰島素?央視點贊糖尿病新療法,干細胞開啟“根治”時代

科學認識論
2026-05-08 16:00:31
充電6分鐘續航2000公里!國產固態電池大突破,寧德時代或將量產

充電6分鐘續航2000公里!國產固態電池大突破,寧德時代或將量產

胖福的小木屋
2026-05-06 18:47:23
名嘴:國際足聯應求著央視轉播世界杯 倒貼中國13億+保送國足出線

名嘴:國際足聯應求著央視轉播世界杯 倒貼中國13億+保送國足出線

念洲
2026-05-09 07:11:33
三星也被“打跑了” 但先別急著慶祝

三星也被“打跑了” 但先別急著慶祝

看看新聞Knews
2026-05-07 23:16:11
所有實驗室都怕字節,所有人都在夸DeepSeek!美國研究員中國AI行

所有實驗室都怕字節,所有人都在夸DeepSeek!美國研究員中國AI行

量子位
2026-05-08 12:25:08
向佑南昌酒吧包場!新女友滿身紋身8顆大金牙,向太放話死都不認

向佑南昌酒吧包場!新女友滿身紋身8顆大金牙,向太放話死都不認

橙星文娛
2026-05-08 17:01:23
兒魔夢!英超王牌松口愿投曼聯,紅魔 3 億鋒線要來了?

兒魔夢!英超王牌松口愿投曼聯,紅魔 3 億鋒線要來了?

瀾歸序
2026-05-09 06:05:59
國乒男團為何能進4強?王皓尊重林詩棟想法,梁靖崑幫王勵勤減壓

國乒男團為何能進4強?王皓尊重林詩棟想法,梁靖崑幫王勵勤減壓

體育大學僧
2026-05-08 23:02:39
夢鴿心中永遠的痛:如今60歲的她,已為兒子改名,鋪好下一條路

夢鴿心中永遠的痛:如今60歲的她,已為兒子改名,鋪好下一條路

仙味少女心
2026-05-08 05:51:48
光地皮就值2個億的美國駐華大使館,為何修成一座封閉式碉堡?

光地皮就值2個億的美國駐華大使館,為何修成一座封閉式碉堡?

賤議你讀史
2026-05-07 14:58:39
保住納稅人的錢!美國防部長宣布采購革命:企業自己掏錢建廠,交不出貨就換人

保住納稅人的錢!美國防部長宣布采購革命:企業自己掏錢建廠,交不出貨就換人

爆角追蹤
2026-05-08 08:22:25
2026-05-09 08:43:01
ZFinance
ZFinance
Z世代的一站式AI、科技和財經資訊
177文章數 16關注度
往期回顧 全部

科技要聞

美國政府強力下場 蘋果英特爾達成代工協議

頭條要聞

媒體:特朗普若順利來華 將是美總統時隔十年再訪中國

頭條要聞

媒體:特朗普若順利來華 將是美總統時隔十年再訪中國

體育要聞

他把首勝讓給隊友,然后用一年時間還清賬單

娛樂要聞

古天樂被曝隱婚生子,新娘竟是她

財經要聞

白宮:特朗普計劃5月14日至15日訪問中國

汽車要聞

MG 4X實車亮相 將于5月11日開啟盲訂

態度原創

數碼
親子
游戲
本地
公開課

數碼要聞

極摩客推出NucBox M3 Pro迷你主機:13500H,DDR4,2280+2242

親子要聞

小銳銳會走路后笑得很開心

《生化危機9》為何不做極致恐怖 卡普空道出了原因

本地新聞

用蘇繡的方式,打開江西婺源

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版