![]()
2024
或許你還記得,在并不遙遠(yuǎn)的2024 年,Kimi是中國(guó)AI當(dāng)紅炸子雞:10億美金融資、Kimi概念股多次漲停、200萬(wàn)字輸入碾壓GPT、激進(jìn)的投流推廣策略。
但他們當(dāng)時(shí)獲得的曝光度,遠(yuǎn)超自己的技術(shù)影響力。
事實(shí)上,那個(gè)200萬(wàn)字的模型,后來(lái)能用到的人微乎其微。后來(lái)了解到,那是個(gè)實(shí)驗(yàn)性模型,每次運(yùn)行成本接近 3 位數(shù),完全不具備大規(guī)模服務(wù)用戶的可能性。
那時(shí)的技術(shù)圈,對(duì) Kimi 是不屑一顧的。
但是靠著200萬(wàn)字的噱頭,Kimi還是站住了「長(zhǎng)文本」標(biāo)簽和用戶心智。
2025
2025 年初,DeepSeek 橫空出世,真正靠技術(shù)實(shí)力成為中國(guó)AI技術(shù)的代言人。
到了 2025年中,Kimi 已快一年沒任何融資的消息。被「唱衰」成為主旋律,員工開始流失,業(yè)內(nèi)基本給這個(gè)創(chuàng)業(yè)項(xiàng)目判了死刑。
如果你從2025年年中開始,閉關(guān)了 9 個(gè)月,到2026年3月看到新聞:
Kimi 最新估值 1200 億;
Kimi 20 天收入超過(guò)去一年;
Kimi的模型被3500億估值的最火AI編程工具Cursor套殼并實(shí)錘(你閉關(guān)了9個(gè)月,所以不知道最火的AI編程工具已經(jīng)是 Claude Code了,Cursor已成老二);
Kimi新模型被承載了互聯(lián)網(wǎng)20%流量、市值超過(guò) 5000 億Cloudflare引入為主力模型;
Kimi新模型成為全球最大獨(dú)立AI搜索應(yīng)用Perplexity唯一引入的開源模型和中國(guó)模型;
Kimi新技術(shù)「注意力殘差」開始改造深度學(xué)習(xí)架構(gòu)10多年來(lái)的地基,并得到前OpenAI的聯(lián)合創(chuàng)始人Andrej Karpathy、OpenAI推理模型之父 Jerry Tworek 以及馬斯克稱贊;
楊植麟成為英偉達(dá)2026 GTC年度大會(huì)唯一受邀做演講的全球獨(dú)立大模型公司代表……
你很可能會(huì)驚掉下巴。
大家說(shuō)「AI 一天,人間一年」,AI 領(lǐng)域 9 個(gè)月確實(shí)發(fā)生了很多事情。
但歸根結(jié)底是一件事情,AI技術(shù)的范式發(fā)生了變化。這個(gè)變化最常見、最偷懶的概括是從 Chat 到 Agent。
對(duì)全世界的 3000萬(wàn)程序員來(lái)說(shuō),變化是,最受推崇的工具從Cursor 變成 Claude Code。
對(duì)總是率先擁抱新技術(shù)的 early adopter 來(lái)說(shuō),變化是更頻繁地打開那個(gè)類似 DOS 系統(tǒng)的黑白命令行終端……
對(duì)AI公司來(lái)說(shuō),變化是大家陸續(xù)發(fā)現(xiàn):更會(huì)聊天的模型,遠(yuǎn)不如會(huì)寫代碼和調(diào)用工具的模型有價(jià)值。
最酷的產(chǎn)品從ChatGPT變成Claude Code,最酷的創(chuàng)業(yè)公司也從 OpenAI 變成了 Anthropic。
回到 2025 年初的中國(guó)市場(chǎng)。
DeepSeek R1 因?yàn)閺?fù)刻并開源了 OpenAI o1 的「深度思考」能力爆火,另一個(gè)「通用 Agent」產(chǎn)品 Manus 也橫空出世……
彼時(shí)的中國(guó)AI公司,大多數(shù)在忙著復(fù)現(xiàn) DeepSeek R1,推出能「深度思考」的新模型。少數(shù)公司意識(shí)到 Manus 背后的那個(gè)模型,才是更值得花資源「復(fù)現(xiàn)」的東西。或者意識(shí)到了,但沒有分配到足夠的資源,或找到方法。
Manus的一個(gè)很大的價(jià)值,就是可視化呈現(xiàn)了Claude模型的多輪工具調(diào)用能力。正如一位大模型公司的技術(shù)專家在自己的博客中寫到,「絕大多數(shù) Agent 產(chǎn)品,離了 Claude 以后,什么都不是。」
直到 2025年7月,中國(guó)第一個(gè)主打Agent能力的模型才悄然出現(xiàn)。7月11日,Kimi K2 發(fā)布,喊的是 Open Agentic Intelligence。這里顯然藏著他們的野心:復(fù)現(xiàn) Claude 模型的 Agent 能力,并開源出去。就像 DeepSeek R1 復(fù)現(xiàn) OpenAI o1并開源出去。
發(fā)布 5 天后,7月16日,英國(guó)的 Nature 自然雜志發(fā)現(xiàn)了這個(gè)模型的價(jià)值,用「另一個(gè)DeepSeek時(shí)刻」來(lái)形容。
發(fā)布10天后,7月21日,Anthropic聯(lián)合創(chuàng)始人Jack Clark在自己的博客中介紹了 K2,評(píng)價(jià)稱:
在我看來(lái),Kimi 是一款還不錯(cuò)的模型,落后美國(guó)最前沿幾個(gè)月,延續(xù)了 DeepSeek 的軌跡。其編碼和工具調(diào)用分?jǐn)?shù)已足夠高,我預(yù)計(jì)現(xiàn)實(shí)中會(huì)有人真正用它,因此觀察其采用率能折射競(jìng)爭(zhēng)力。
7 月底,楊植麟在播客專訪中,解釋了 K2 為什么沒有先做「深度思考」,而是在 Agent 需要的編程和工具調(diào)用能力上發(fā)力。他用「缸中之腦」來(lái)形容主打深度思考的模型。對(duì)了,楊植麟這篇采訪值得多看幾遍,他講了很多技術(shù)層面更本質(zhì)的東西,比如編程和Agent的關(guān)系,思考和工具調(diào)用的關(guān)系。
因?yàn)?K2 和后續(xù) K2 Thinking 模型的表現(xiàn),Kimi 的融資在年底終于續(xù)上了,5 億美金,IDG和幾家老股東繼續(xù)加持。
2026
2026 年春節(jié)前后,這個(gè)瘋狂的大模型發(fā)布季,Kimi 是第一個(gè)交卷的選手。可能也是讓同行們最難受的一個(gè),因?yàn)?K2.5萬(wàn)億參數(shù)、圖片和視頻的多模態(tài)理解能力,支持思考和非思考模式。其他創(chuàng)業(yè)公司同行發(fā)布的都是純文本模型。有實(shí)力把多模態(tài)能力融入旗艦?zāi)P偷模挥写髲S的閉源模型。
3月16號(hào),Kimi團(tuán)隊(duì)發(fā)布了Attention Residuals的技術(shù)論文,挑戰(zhàn)已有 10 年歷史的神經(jīng)網(wǎng)絡(luò)底層殘差連接機(jī)制。OpenAI的聯(lián)合創(chuàng)始人Andrej Karpathy銳評(píng)Kimi「讓我們意識(shí)到根本沒有把Attention is All You Need理解透徹」,要知道,Attention is All You Need就是開啟大模型時(shí)代的圣杯,哪怕考慮到AI圈的通詞膨脹,這個(gè)評(píng)價(jià)也是前所未有的高。據(jù)說(shuō),論文第一作者是一位僅 17歲的高中生,天才出少年,真是令人感慨。
3月17號(hào),Kimi 模型繼年初的 CES 2026 之后,在黃仁勛的 GTC 2026 主旨演講中再度成為英偉達(dá)展示下一代芯片和推理性能的御用模型。
![]()
3月18號(hào),作為英偉達(dá)的GTC年度大會(huì)唯一受邀的中國(guó)獨(dú)立大模型公司代表,楊植麟的現(xiàn)場(chǎng)演講全是干貨,上來(lái)就把優(yōu)化器、注意力機(jī)制、殘差連接三大核心模塊比作有8-11年歷史的陳舊技術(shù)標(biāo)準(zhǔn),是繼續(xù)Scaling的障礙,用新的技術(shù)突破表明「每一項(xiàng)基礎(chǔ)技術(shù)都值得重新思考」。
然后是這幾天人盡皆知的「Cursor丑聞」,誰(shuí)能想到,估值500億美金的全球最大編程助手Cursor,重磅推出的新一代編程模型Composer 2——跑分超過(guò)Claude Opus 4.6——竟然是套的Kimi K2.5的殼??
身為Token中介定位的Cursor之所以要發(fā)力「自研」,主要還是為了擺脫它對(duì)Anthropic和OpenAI的高度依賴,卡脖子這事兒可不分國(guó)界,Anthropic也真的曾經(jīng)斷供Windsurf這類編程工具,在既當(dāng)裁判員又當(dāng)運(yùn)動(dòng)員的環(huán)境下,Cursor希望獨(dú)立自主的心情,完全可以理解。
只是能力和愿景之間的巨大鴻溝,讓Cursor選擇了抹掉來(lái)自Kimi的底座模型名字,靠代筆求融資,事情最后也算是體面收?qǐng)觯珻ursor的聯(lián)合創(chuàng)始人公開道歉,在技術(shù)報(bào)告中給除了選擇 Kimi K2.5 作為底座模型的詳細(xì)理由,而Kimi官方也回應(yīng)表示,很高興Cursor使用Kimi K2.5作為基座,雙方通過(guò)推理服務(wù)商 Fireworks AI 做了技術(shù)授權(quán)。
根據(jù)小道消息, 2026 年春節(jié)前后,Kimi 陸續(xù)以投前 48 億美元、60 億美元、100億美元的估值完成總額近 20 億美元的融資,3月份開啟的 180 億美元輪次份額也要排隊(duì)才能拿到。
這當(dāng)然也受益于兩個(gè)同行在港股的超常表現(xiàn),但更重要的還是靠自己的 K2和后續(xù)的模型實(shí)際表現(xiàn),包括前文題庫(kù)的 Cursor、Cloudflare、Perplexity、黃仁勛、馬斯克、馬克·安德森、查馬斯等不斷發(fā)來(lái)的「金水」,以及K2.5發(fā)布后20天收入超過(guò)過(guò)去一年的財(cái)務(wù)表現(xiàn)。
一位 Kimi 的朋友在私下聊天里說(shuō),制約業(yè)務(wù)發(fā)展的只有算力,現(xiàn)在至少還有 10 倍的需求沒有滿足。有多少卡,就能有多少收入。據(jù)我跟另一個(gè)大廠工作的朋友了解,現(xiàn)在有些大廠在編程工具中接入的Kimi模型,甚至要通過(guò)預(yù)購(gòu)才能拿到足夠的額度。
這 9 個(gè)月,Kimi 算是完成了一次逆天改命。
DeepSeek V3不是一天煉成的。其背后的幻方量化基因,決定了他們從 2023 年起就走上了一條與硅谷截然不同的極致能效比之路。在 2023 到 2024 年的大部分時(shí)間里,他們游離于主流敘事之外,潛心自研 MLA(多頭潛在注意力機(jī)制) 與 DeepSeekMoE 架構(gòu),試圖在有限的算力下壓榨出超越物理極限的性能。直到 2025 年成就自己,也給其他AI創(chuàng)業(yè)公司帶來(lái)信心。
所有人都在期待 DeepSeek 的下一代模型繼續(xù)驚艷全場(chǎng),但媒體上三番五次的「狼來(lái)了」把戲只會(huì)消磨大家的注意力。技術(shù)突破,哪是那么容易的事情,我們完全有理由更有耐心地等待 DeepSeek 團(tuán)隊(duì)的下一個(gè)作品。
Kimi K2 也不是一天煉成的。他們實(shí)際上跟 DeepSeek R1同一天發(fā)布了無(wú)人問(wèn)津的K1.5模型,被OpenAI官方認(rèn)為是率先復(fù)現(xiàn)o1的兩個(gè)公司之一。他們?cè)诒怀プ顓柡Φ?025年初發(fā)布了Moonlight系列小型MoE模型,用來(lái)驗(yàn)證下一代二階優(yōu)化器技術(shù),并且最終應(yīng)用到萬(wàn)億的K2模型上。現(xiàn)在Muon已取代已經(jīng)用了10年的標(biāo)準(zhǔn)技術(shù)Adam,成為Kimi、GLM-5、DeepSeek Engram在內(nèi)的新模型都開始采用的新標(biāo)準(zhǔn)。
正所謂,「出來(lái)混,總要還的。」Kimi 在2024年提前享受了C位和曝光,2026年沒再?gòu)?fù)現(xiàn)該屬于自己的流量。
各有各的命。
作為兩家?guī)缀跬瑫r(shí)起步的創(chuàng)業(yè)公司,我佩服他們那種從來(lái)不認(rèn)為市場(chǎng)格局已定、相信技術(shù)才是最大變量、敢于追逐AGI 的勇氣和年輕生猛、戰(zhàn)績(jī)可查、永遠(yuǎn)相信細(xì)水長(zhǎng)流的力量。
即使站在 2026年3月底這個(gè)時(shí)間節(jié)點(diǎn)看,2022年底開始的這場(chǎng)AI革命也才進(jìn)行了3年半的時(shí)間,一切才剛剛開始。為什么下一個(gè) OpenAI 和 Anthropic 不能是一家中國(guó)公司?
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.