網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

知春路最有AGI理想的兩個(gè)男人

2026-04-29 21:10:54　來(lái)源: 白鯨實(shí)驗(yàn)室one

北京舉報(bào)

分享至

深度求索（北京子公司）和月之暗面都位于海淀區(qū)知春路一帶，相距僅1.4公里，步行只需十幾分鐘。站在其中一家公司的會(huì)議室里，能隔空望見另一家公司的辦公樓。或許在某些時(shí)刻，它們的研究員會(huì)隔著一片樓宇對(duì)望，腦海里浮現(xiàn)的盡是關(guān)于AGI藍(lán)圖的構(gòu)想。

物理空間的接近，讓這兩家公司員工氣質(zhì)多有相像：低調(diào)，純粹，專注AGI。在社交媒體里，你能看到幾乎每位DeepSeek研究員的關(guān)注列表里都會(huì)有Kimi研究員，而Kimi研究員的關(guān)注列表里也躺著不少DeepSeek研究員。

過(guò)去一年，Kimi研究員對(duì)DeepSeek幾乎不吝贊美。我們?nèi)ツ?月和Kimi的人士有過(guò)短暫交流，當(dāng)時(shí)他就直言“感謝DeepSeek”。本月初，《人物》雜志詳細(xì)報(bào)道了月之暗面這家公司，同樣指出“你能夠感受到公司中蔓延的對(duì)DeepSeek的尊重”。

正是DeepSeek R1的出現(xiàn)教育了市場(chǎng)，硬實(shí)力就是最好的推廣。去年Kimi也選擇了DeepSeek敲開的推理路線，并一路在agent能力上實(shí)現(xiàn)超越。

這種惺惺相惜，也體現(xiàn)在DeepSeek的研究員身上。一位DeepSeek研究員非常直白地告訴我們，他個(gè)人比較看好Kimi，這兩家公司有著相似的技術(shù)理想，也更純粹，但在管理上略有不同。DeepSeek做事慢一點(diǎn)，會(huì)做得更細(xì)致一點(diǎn)，“如果Kimi老板看對(duì)了方向，可能比DeepSeek更快接近AGI。”

相似的技術(shù)氣質(zhì)，讓這兩家公司更愿意押注那些成本高、周期長(zhǎng)、不確定性強(qiáng)的方向，也因此更有機(jī)會(huì)觸發(fā)范式級(jí)的能力躍遷。

它們同樣是資本熱衷的對(duì)象。一位去年參與Anthropic融資的國(guó)內(nèi)一線投資機(jī)構(gòu)人士告訴我們，國(guó)內(nèi)模型公司里，如果能閉著眼選兩家直接打錢，一個(gè)是DeepSeek，另一個(gè)就是Kimi。

從投資人、大模型科學(xué)家到行業(yè)內(nèi)部從業(yè)者，都在不約而同地將這兩家公司放在同一坐標(biāo)系中審視。審視公司，也是審視兩位創(chuàng)始人梁文鋒和楊植麟。他們同樣信仰Scaling Law的底層力量，堅(jiān)持“模型即產(chǎn)品”的極簡(jiǎn)邏輯，在互聯(lián)網(wǎng)大廠的流量圍剿中守住了C端用戶基本盤，也同樣在海外市場(chǎng)撕開了中國(guó)大模型的品牌缺口。

海淀區(qū)知春路一向被認(rèn)為是創(chuàng)業(yè)者的福地。張一鳴曾于2012年在知春路的一處民宅中創(chuàng)立今日頭條，開啟了他的創(chuàng)業(yè)歷程。當(dāng)前AI時(shí)代，這兩個(gè)扎根知春路一帶的AI創(chuàng)業(yè)新星，在技術(shù)迭代、戰(zhàn)略選擇甚至一些心境上，都愈加同頻。

一種默契

4月的倒數(shù)第二周，Qwen、Kimi、DeepSeek、小米、騰訊的新模型扎堆發(fā)布。4月20號(hào)，Kimi發(fā)布了Kimi2.6并開源，該模型在多項(xiàng)編碼基準(zhǔn)測(cè)試中超越GPT-5.4和Claude Opus 4.6等閉源模型，大幅增強(qiáng)了Agent自主化執(zhí)行能力，長(zhǎng)程編碼能力也得到顯著提升。

僅僅4天后，DeepSeek V4也終于在外界的關(guān)注下姍姍來(lái)遲。DeepSeek官方同樣稱，相比前代模型，DeepSeek-V4-Pro的Agent能力顯著增強(qiáng)，在Agentic Coding評(píng)測(cè)中，V4-Pro已達(dá)到當(dāng)前開源模型最佳水平，并在其他Agent相關(guān)評(píng)測(cè)中同樣表現(xiàn)優(yōu)異。

此時(shí)距離上一代V3發(fā)布已經(jīng)過(guò)去了484天，這期間DeepSeek從爆紅到幾乎隱身，用戶數(shù)也一度大幅下滑，甚至被指責(zé)只是曇花一現(xiàn)。梁文鋒團(tuán)隊(duì)承受巨大壓力。在官方公眾號(hào)發(fā)布V4新模型的文章里，梁文鋒引用了荀子的名言：“不誘于譽(yù)，不恐于誹，率道而行，端然正己。”這是他的自勉，也是對(duì)過(guò)去一年最好的回應(yīng)。

沒(méi)人比楊植麟更懂這種被全世界冷落的感受。去年年初DeepSeek爆紅時(shí)，作為創(chuàng)業(yè)明星的楊植麟默默承壓。外界紛紛詬病月之暗面陷入流量依賴的路徑陷阱，基座模型進(jìn)展遲緩，在萬(wàn)億參數(shù)競(jìng)賽、推理能力突破、開源生態(tài)布局上，全面落后于橫空出世的DeepSeek。

楊植麟對(duì)此從未回應(yīng)，只是帶領(lǐng)團(tuán)隊(duì)埋頭研發(fā)新模型。直到2025年7月11日，Kimi K2發(fā)布，總參數(shù)達(dá)到萬(wàn)億，并采用Muon二階優(yōu)化器訓(xùn)練，也是國(guó)產(chǎn)大模型首次大規(guī)模用二階優(yōu)化。

一時(shí)間Kimi K2震動(dòng)全球，《自然》雜志稱：“另一個(gè)DeepSeek時(shí)刻”。楊植麟用新模型回應(yīng)過(guò)去的一切。

去年8月，楊植麟接受媒體人采訪時(shí)說(shuō)：“這也是Kimi跟我講的——任何中間狀態(tài)都有可能成為被批評(píng)的對(duì)象。你總是會(huì)有這個(gè)時(shí)代的局限性。”這種豁達(dá)的價(jià)值觀，與梁文鋒引用荀子的名句所表達(dá)的價(jià)值觀幾乎一致。

梁文鋒與楊植麟的相似性，根植于對(duì)AGI的共同信仰。他們都堅(jiān)信，大模型的能力上限由基礎(chǔ)架構(gòu)與參數(shù)規(guī)模的持續(xù)突破定義，所有的產(chǎn)品體驗(yàn)與商業(yè)價(jià)值，都要建立在基座模型能力領(lǐng)先之上。這種信仰，讓兩家公司在技術(shù)路線上走出了罕見的協(xié)同進(jìn)化軌跡。

從去年至今，媒體關(guān)于DeepSeek與Kimi敘事都是“撞車”，包括發(fā)新論文和新模型的架構(gòu)和參數(shù)量。例如DeepSeek V4采用MoE混合專家架構(gòu)，總參數(shù)規(guī)模達(dá)到1.6萬(wàn)億，激活參數(shù)約370億。而Kimi K2系列同樣采用萬(wàn)億級(jí)MoE架構(gòu)，總參數(shù)1萬(wàn)億，激活參數(shù)320億。

類似的“撞車”太多。事實(shí)上它們遠(yuǎn)不止“撞車”這么簡(jiǎn)單，而是已經(jīng)形成了互相驗(yàn)證乃至彼此復(fù)用的默契。

2025年年初，DeepSeek在V3模型中推出的MLA多頭潛在注意力機(jī)制，通過(guò)壓縮KV緩存大幅降低了大模型推理成本，成為萬(wàn)億參數(shù)模型落地的核心架構(gòu)創(chuàng)新。而Kimi在后續(xù)的K2系列模型中，直接沿用了這一架構(gòu)，為其超長(zhǎng)上下文與Agent能力的落地掃清了工程障礙。

到了2025年7月，Kimi在萬(wàn)億參數(shù)MoE模型K2中，率先規(guī)模化驗(yàn)證自研Muon二階優(yōu)化器，官方論文與技術(shù)報(bào)告確認(rèn)，其token效率達(dá)AdamW的2倍，訓(xùn)練成本降低50%以上，成為全球首個(gè)在萬(wàn)億級(jí)別落地的二階優(yōu)化方案。

而這次DeepSeek V4的技術(shù)報(bào)告里顯示，也跟進(jìn)采用了Muon，成為其1.6萬(wàn)億參數(shù)模型訓(xùn)練的核心底座。

兩家公司形成的默契，背后是兩個(gè)創(chuàng)始人的精神共振。梁文鋒從量化投資起家，帶著“用極致工程能力實(shí)現(xiàn)模型效率革命”的底色，DeepSeek從成立之初就堅(jiān)持用自有資金支撐底層研發(fā)，只為不受短期商業(yè)目標(biāo)干擾。

楊植麟出身清華與卡內(nèi)基梅隆大學(xué)，是NLP領(lǐng)域的頂尖學(xué)術(shù)人才。從創(chuàng)立月之暗面之初，他就定下了“用長(zhǎng)上下文能力突破AGI邊界”的核心路線，即便在行業(yè)流量戰(zhàn)最激烈的階段，也堅(jiān)持將核心資源投入基座模型研發(fā)。

這兩個(gè)在知春路一帶相距1.4公里的男人，忙得也許很少能見到面，但他們可能又是神交已久且最了解對(duì)方的那個(gè)人。

海外影響力

DeepSeek和Kimi另一個(gè)共同點(diǎn)，是在海外的口碑，這也是它們能夠吸引投資的重要原因之一。一家一線投資機(jī)構(gòu)在Kimi估值60億美金的時(shí)候進(jìn)入，后續(xù)兩輪都選擇了跟進(jìn)。

“模型好，產(chǎn)品好，認(rèn)知好，全球化做得好，團(tuán)隊(duì)反應(yīng)速度也快。”這家機(jī)構(gòu)參與投資的人士舉例稱，全球化上最明顯的案例就是今年3月國(guó)外產(chǎn)品Cursor套殼Kimi。

3月20日，Cursor正式發(fā)布新編程模型Composer 2，官方博客全程強(qiáng)調(diào)，自研，持續(xù)預(yù)訓(xùn)練+大規(guī)模強(qiáng)化學(xué)習(xí)，并宣稱超越Claude Opus 4.6，價(jià)格僅為其1/10。

幾個(gè)小時(shí)后，一位開發(fā)者調(diào)試Cursor API時(shí)，截獲內(nèi)部模型ID：kimi-k2p5-rl-0317-s515-fast。直譯為，Kimi K2.5 +強(qiáng)化學(xué)習(xí)（RL）+3.17版本+快速推理。馬斯克下場(chǎng)回復(fù)帖子下評(píng)論：“Yes, Kimi 2.5!”，全球輿論引爆。

“你就從Cursor訓(xùn)了它的模型就能看出來(lái)，Kimi的全球的認(rèn)知肯定是很好的。”上述投資人說(shuō)。

自去年發(fā)布Kimi K2以來(lái)，Kimi幾乎每隔兩個(gè)月就有一次重大發(fā)布。同年11月，Kimi推出萬(wàn)億參數(shù)的K2 Thinking大模型，在智能體工具調(diào)用能力測(cè)試中93%的得分位居全球第一，超過(guò)OpenAI、Anthropic 等海外閉源旗艦?zāi)Ｐ停蔀楫?dāng)時(shí) “最大最好的開源模型”。

今年1月推出的K2.5，在多模態(tài)、長(zhǎng)記憶和智能體上全方位升級(jí)，隨后借助小龍蝦的火熱，在技術(shù)社區(qū)走紅。2月登頂海外模型聚合平臺(tái)OpenRouter，成為周榜調(diào)用量冠軍。

同樣在3月，Kimi發(fā)布重磅技術(shù)報(bào)告，被認(rèn)為挑戰(zhàn)了Transformer沿用11年的殘差連接機(jī)制，前OpenAI研究副總裁Jerry Tworek也評(píng)價(jià)其為“深度學(xué)習(xí)2.0”的開端。馬斯克轉(zhuǎn)發(fā)評(píng)論：“Impressive work from Kimi”（Kimi 的工作令人印象深刻）。

DeepSeek的海外影響力自不必多說(shuō)。去年年初DeepSeek R1就是率先在海外走紅的，在一些海外開發(fā)者和創(chuàng)業(yè)者心中，DeepSeek被奉為開源之神的存在。

本月DeepSeek V4發(fā)布后，再次在海外掀起巨量討論。憑借極致性價(jià)比，《彭博》把DeepSeek V4寫成對(duì)OpenAI和Anthropic的有力挑戰(zhàn)。盡管也有不少聲音認(rèn)為，V4的聲量完全不如V3帶來(lái)的沖擊。

“對(duì)開發(fā)者而言，國(guó)產(chǎn)開源模型DeepSeek、Kimi和智譜雖然和海外閉源模型相比仍有幾個(gè)月的差距，但這些模型憑借性價(jià)比依然是最能打的。”上述投資人士稱。

資本市場(chǎng)對(duì)DeepSeek的興趣也已經(jīng)達(dá)到前所未有的程度。DeepSeek融資，相關(guān)報(bào)道滿天飛，官方一直未回應(yīng)。

我們獨(dú)家獲悉，DeepSeek融前估值是3000億人民幣，約合440億美元。DeepSeek計(jì)劃增資500億，內(nèi)部增資200億，對(duì)外募資300億。這次投資非常隱秘，屬于定向邀約，要求也極高。一家一線投資機(jī)構(gòu)因?yàn)槟假Y的基金里有許多個(gè)人投資人未達(dá)標(biāo)，也被拒之門外。

融資在某種程度上是為了留住人才。此前，DeepSeek多位核心技術(shù)人員被高薪挖走。上述DeepSeek人士表示，獲得融資對(duì)DeepSeek最大好處之一，或許就是人員被挖走的概率降低了。

Kimi同樣重視人才。去年12月楊植麟在內(nèi)部信里稱，Kimi賬上現(xiàn)金超過(guò)100億元人民幣，短期內(nèi)并不著急上市。他還說(shuō)，融資是為了更加激進(jìn)地?cái)U(kuò)充顯卡（GPU）儲(chǔ)備，加速下一代K3模型的訓(xùn)練與研發(fā)，并將部分資金用于大幅提高員工激勵(lì)，以吸引和保留頂尖人才。

據(jù)今年4月初晚點(diǎn)報(bào)道，Kimi將推出一項(xiàng)新的頂尖人才校招計(jì)劃，擬授予尚未畢業(yè)的實(shí)習(xí)生公司期權(quán)，在實(shí)習(xí)生通過(guò)月之暗面為期3到6個(gè)月的考察后，計(jì)劃入選者將被直接授予期權(quán)股數(shù)，即使本人尚未正式畢業(yè)。

大模型的競(jìng)賽，是一場(chǎng)資本、人才和算力的全方位比拼。DeepSeek從不融資到宣布融資，Kimi從宣布不著急上市，到賬面資金闊綽、到融資數(shù)十億人民幣，都反映資本市場(chǎng)已經(jīng)形成的共識(shí)——大模型底層能力躍遷帶來(lái)的生產(chǎn)力巨量提升，已經(jīng)非常明確。

大模型投資依舊熱

去年9月的外灘大會(huì)上，朱嘯虎公開演講稱：“大模型已經(jīng)變成水電煤，是基礎(chǔ)設(shè)施，沒(méi)有超額利潤(rùn)，真正的機(jī)會(huì)在應(yīng)用。”

目前來(lái)看，事情并沒(méi)有沿著那個(gè)方向發(fā)展。尤其當(dāng)智譜和MiniMax上市后，模型熱一直持續(xù)，兩家公司市值一度達(dá)到三千多億和四千多億港元。

今年以來(lái)大模型投資的熱度繼續(xù)高漲，尤其從DeepSeek V4的融資門檻，以及Kimi連續(xù)融資并且估值翻了四倍來(lái)看。就連大模型存在感不強(qiáng)的階躍星辰，也在2026年1月26日宣布完成超50億元人民幣B+輪融資。

視頻大模型和世界模型同樣迎來(lái)投資熱潮。生數(shù)科技在4月完成近20億元B輪融資，估值120億元，阿里、中網(wǎng)投領(lǐng)投。極佳視界單月融資25億元，估值破100億元。

相比海外，國(guó)內(nèi)這些融資顯得小情小調(diào)的。OpenAI2026年3月完成高達(dá)1220億美元融資，投后估值8520億美元，亞馬遜、英偉達(dá)、軟銀入局。Anthropic2026年2月完成300億美元G輪融資，估值3800億美元，新加坡GIC、Coatue領(lǐng)投。

投資的熱潮背后更直觀的反應(yīng)是，模型公司收入增速表現(xiàn)非常樂(lè)觀。截至4月7日，Anthropic對(duì)外披露的ARR是超過(guò)300億美元，較2025年底的收入增長(zhǎng)了3倍有余。上述參投Anthropic的投資人告訴我們，“Anthropic的2026年ARR收入預(yù)計(jì)會(huì)突破1000億美元”。

“大模型作為底層設(shè)施，可能會(huì)吞噬所有行業(yè)的價(jià)值黑洞。”上述投資人稱，過(guò)去一年她頻繁的見許多全球最優(yōu)秀的一批研究員，他們無(wú)一例外都向她展示了模型涌現(xiàn)能力已經(jīng)出現(xiàn)。

看到模型收入增速以及智譜二級(jí)市場(chǎng)的暴漲反應(yīng)，更多的投資人是一種FOMO心理。

據(jù)我們了解，最近幾個(gè)月，Kimi的股權(quán)一直很搶手，一家美元基金猶豫了幾天名額就滿了。

不過(guò)，錢對(duì)兩家公司來(lái)說(shuō)從來(lái)都不是目的。梁文鋒唯一一次接受采訪是在2024年7月，當(dāng)時(shí)他說(shuō)過(guò)這句話：“我們的出發(fā)點(diǎn)，就不是趁機(jī)賺一筆，而是走到技術(shù)的前沿”。這與楊植麟所說(shuō)的：“不急于短期變現(xiàn)，專注技術(shù)前沿與長(zhǎng)期AGI目標(biāo)。”不謀而合。

這份可貴的純粹，也正是他們持續(xù)吸引外界關(guān)注的原因。

知春路的風(fēng)永不停歇，吹過(guò)一代代創(chuàng)業(yè)者。從PC互聯(lián)網(wǎng)到移動(dòng)互聯(lián)網(wǎng)，中國(guó)的科技行業(yè)從來(lái)不乏流量明星與商業(yè)神話，但在AI這條關(guān)乎未來(lái)的賽道上，或許需要更多的時(shí)間來(lái)驗(yàn)證新的范式。

撰寫｜吳尋

編輯｜劉培

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.