網易首頁 > 網易號 > 正文 申請入駐

從現在開始,得像研究DeepSeek一樣嚴肅研究Kimi

0
分享至

我研究過世界上絕大多數的主流AI大模型公司,試用過它們的產品。我是ChatGPT, Gemini以及Grok的長期付費用戶,也經常使用國產的DeepSeek, Qwen, 混元和豆包。雖然我日常較少編程或使用Agent,但是對于文本會話以及圖片、視頻等多模態功能,我可是不折不扣的重度用戶,經常在新版本模型發布之后一口氣聊到大半夜。至于編程與應用開發,我在朋友圈密切關注幾位程序員朋友的分享,對于Claude Gode和ChatGPT Codex之類的工具應該算不上文盲。

直到上個星期,我還對朋友說:“對于AI行業,我應該沒有錯過什么值得深入了解的東西吧。”然而接下來的幾天,我先是在社交媒體,然后在自己加入的微信群,注意到了一件出乎意料的事情——Kimi的冉冉升起(盡管以前的地位就不低了)。3月16日和20日,馬斯克兩次贊揚了Kimi,第一次是為了一篇關于大模型注意力殘差(Attention Residuals)技術的論文,;第二次則是為了Cursor發布的新模型被證實是基于Kimi K2.5微調的成果。尤其是第二件事情,影響巨大,震動了全球的AI圈子,我們不妨先把此事的來龍去脈回顧一下:

  • Cursor是全球最流行的AI編程IDE,沒有之一。不過它主要是一個應用界面和工具箱,通過接入第三方大模型完成任務,例如Claude.
  • 今年3月初,Cursor發布了原生編程模型Composer 2,效果極佳,推理成本極低,立即引發了高度關注;但是一開始,Cursor并未提及外部合作伙伴,很多人都以為是完全自研。
  • 接下來兩個星期,很多開發者發現,Composer 2的API和模型ID含有Kimi K2.5的痕跡,很可能是基于K2.5開發的;互聯網口碑迅速反轉,媒體轉而指責Cursor抄襲Kimi。
  • 3月20日,Cursor創始人道歉并承認Composer 2是基于Kimi K2.5二次開發的結果,感謝了Kimi的貢獻;Kimi也大度的表示該模型通過合作伙伴獲得了授權。至此,這一風波基本圓滿解決。

說實話,這件事情給我帶來的震動很大。此前我一直認為,Claude Opus 4.6和GPT-5.4是全球最擅長編程的大模型;在國內,我對DeepSeek的新版本寄予厚望,因為梁文鋒此前發表的論文明顯很關注編程方向。我對Kimi以及月之暗面這家公司的認知,主要還停留在當年“擅長超長文本分析”的階段。我的那些資深程序員朋友比我還要震動——當Kimi K2.5成為全世界最流行編程工具的最受關注的“原生大模型”的基礎時,稍有技術常識的人就該明白其背后的分量。

Kimi K2.5的競爭力,不僅在于其推理能力強、成本低,還在于它是開源的。因此它成為了Cursor二次開發的基礎,還驅動了Cloudflare旗下新業務Workers AI的上線。在公告中,Cloudflare特別強調了K2.5的成本優勢,稱其為“性價比甜區”(Price-Performance Sweet Spot):“我們提供Kimi K2.5服務,一開始是個試驗,但是當我們看到它的表現以及性價比之后,這個試驗馬上就變得十分重要了。”

做個背景解釋:Workers AI是一個大模型聚合平臺,旨在為企業和個人客戶提供統一API,客戶不必擁有自己的硬件算力,就能選擇不同的大模型完成任務。Workers AI接入的主要是開源模型,包括Meta的LLaMA、阿里的Qwen、谷歌的Gemma以及DeepSeek,等等。然而,直到不久前,它提供的模型幾乎全是“小版本”,參數規模從幾十億到一兩百億,一般無法承擔深度推理、長文本以及高強度的Agent工作流任務。Kimi K2.5是它接入的第一個大規模(總參數1萬億)前沿模型,從現在開始,它可以驕傲地宣稱:“我們能幫助客戶完成各種復雜的高強度任務啦!”

這個世界上,有的是能力強、跑分高的大模型,但它們往往不具備推理成本優勢;具備成本優勢的,往往又不開源。此時此刻,我們遺憾地看到,硅谷的那些最先進的大模型生態,基本建立在閉源基礎上:

  • OpenAI的名字就代表著“開源”,但是自從GPT-3開始,前沿大模型就不再開源。2025年,才羞答答地發布了兩個GPT-OSS開源模型,顯然無法代表其最高水平。
  • 谷歌在2021年之前也秉承開源路線,但是目前的旗艦大模型Gemini從不開源,只有參數規模明顯較小的Gemma大模型是開源的。
  • Anthropic從成立之日起就沒有發布過任何開源模型,Claude系列是完全閉源的。
  • Grok最初的幾個版本曾經開源,但是自從Grok 3以來就不再開源。在連續兩次點贊Kimi之后,不知道馬斯克會不會重新考慮加入開源生態?

放眼全球,對開源生態最執著、貢獻最大的,早已變成了中國廠商。DeepSeek, Kimi, Qwen……各有擅長的領域,都在某個時期成為過人類最前沿的開源模型。我覺得Kimi尤其難得,其融資、估值和消耗的資源只有OpenAI等硅谷大廠的2%左右,而且也遠遠小于國內互聯網大廠的大模型部門。用這么少的資源,這么迅速的開拓AI基礎研發的邊疆,并毫不吝嗇地將前沿成果開源,不禁讓我想起了很多很多年以前的OpenAI。

除了中國之外,開源生態的旗手,基本僅剩LLaMA和Mistral了。LLaMA 1-3都是全球領先的開源模型,為生成式AI技術的傳播做出了不可磨滅的貢獻,奇怪的是LLaMA-4水平遠遠低于預期,扎克伯格若想重新接過火炬,恐怕得付出更多的努力。Mistral是法國乃至整個歐洲的獨苗,成立之初僅以幾十人的團隊規模就做出了當時世界上“第三先進”的大模型(前兩個是GPT和Claude),但是2024年以后其發展速度明顯放緩,從基礎模型的技術水平看,已經掉入了第二梯隊。這其實是AI創業公司的常態,畢竟誰都無法保證在資源有限的情況下一直保持在潮流前列。所以,我反而更加佩服月之暗面——從2024年初因為長文本功能而走紅,到現在以Kimi K2.5震驚世界,事實證明它絕不是曇花一現。



附帶說一句,Mistral的技術進步放緩,并沒有妨礙它在2025年9月完成估值140億美元的新一輪融資;微軟、Salesforce以及ASML(沒錯,就是荷蘭那家光刻機巨頭)都是它的重要股東。看到這一幕,你還覺得Kimi的180億美元估值太高了嗎?要知道,短短十幾天前,馬斯克的xAI剛剛以高達2500億美元的估值與SpaceX完成了合并。就算我是Grok的深度用戶,面對這個估值水平也得吐舌頭。馬斯克描繪的把數據中心發射到太空中的宏大愿景,讓我深感激動;不過我得公允地說,Grok離世界最前沿水平還是略遜一籌。

X平臺(原名推特)的著名AI博主、被諸多硅谷大佬關注的Tuki (TukiFromKL)說得好:“兩家中國實驗室的旗艦模型(注:DeepSeek和Kimi)都開源了,都用更少的資源做了更多的事情,挑戰美國公司收費數十億美元的產品。AI競賽不再是美國vs中國,而是閉源vs開源,而開源正在迅速跟上。”

Tuki的這段評論或許有點武斷,不過我贊成它的精神:在歷次計算機技術革命中,開源生態都發揮了舉足輕重的作用,AI革命也不例外。硅谷巨頭仍然掌握著可觀的技術和資源優勢,但是拒絕擁抱開源生態只會讓路子越走越窄。一個開源的、低成本的、持續更新的大模型,對應用層的意義怎么估計都不過分。就拿Kimi K2.5來說,Cursor用它做出了強大的Composer 2, Workers AI用它邁出了提供前沿大模型服務的第一步,我相信還有更多的應用商正在琢磨如何最大限度地利用它。這樣的技術進步會讓全人類受益,形成基礎研發層與應用層互相促進的良性循環。

或許會有人擔憂:“前沿技術開源了,那開發商怎么賺錢呢?”事實上這是最不需要擔心的問題。我們不妨看看全球最大的開源軟件生態——Linux,它從來不曾閉源,但是其生態系統每年創造著200-300億美元的收入,近年來還呈現攀升的態勢。這個數字還沒有包括從Linux基礎上生長出來的Android, 后者讓智能手機真正走進了千家萬戶,谷歌在盡力維持開源社區的同時,成功地從附加服務上賺到了很多錢。

生成式AI對人類社會的影響才走出了第一步。所有人最應該關心的話題是如何盡快把蛋糕做大、把門檻做低,AI技術的普惠效應越強,AI基礎模型及應用開發商的地位反而會越穩固。在這方面,以DeepSeek、Kimi為代表的中國廠商,反而比很多硅谷巨頭想的更清楚一點。我想這就是楊植麟成為在今年英偉達GTC上面唯一受邀演講的獨立大模型公司CEO的原因:老黃的眼光十分精準,一再證明了自己能在紛繁復雜的競爭格局中,看清真正有競爭力的路線。

我迫不及待想看到更多像DeepSeek和Kimi這樣的AI創業公司:開放的態度、短小精悍的團隊、銳意進取的精神;它們應該與大廠形成你追我趕的長期競爭格局。在這個過程中,誰能獲勝、誰受益最大,反而成了不太重要的事情,因為無論怎樣,最終受益的都是全人類。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
美日徹底慌了!日本軍艦闖臺海,中國解放軍把軍艦開到其家門口

美日徹底慌了!日本軍艦闖臺海,中國解放軍把軍艦開到其家門口

別吵吵
2026-04-21 09:55:48
太難了!貴州女子哭訴生意不好,想把女兒生活費2000降到1600遭拒

太難了!貴州女子哭訴生意不好,想把女兒生活費2000降到1600遭拒

火山詩話
2026-04-20 13:51:19
杜蘭特傷情進展!隊記近距離觀訓:KD無跛行或不適,G2復出穩了?

杜蘭特傷情進展!隊記近距離觀訓:KD無跛行或不適,G2復出穩了?

熊哥愛籃球
2026-04-21 13:20:54
狼隊超市正式開張:多名拉丁派國腳待出售,世預賽名將陣容受檢閱

狼隊超市正式開張:多名拉丁派國腳待出售,世預賽名將陣容受檢閱

五姑娘臺球
2026-04-21 09:10:09
更新大潮來了?中央發文定調:2026年起20年房齡老房子或又吃香了

更新大潮來了?中央發文定調:2026年起20年房齡老房子或又吃香了

專業聊房君
2026-04-18 16:45:50
3年前就戳穿西貝預制菜沒人信,如今被實錘!這個探店博主藏得太深了

3年前就戳穿西貝預制菜沒人信,如今被實錘!這個探店博主藏得太深了

馬蹄燙嘴說美食
2026-04-15 18:29:48
突發!340億開源巨頭徹底撤離中國,419名頂級工程師被瘋搶,18年深耕終落幕…

突發!340億開源巨頭徹底撤離中國,419名頂級工程師被瘋搶,18年深耕終落幕…

新浪財經
2026-04-20 04:31:06
沉默1天,中國準時發話,“高市下崗”傳遍全境,石破茂判斷沒錯

沉默1天,中國準時發話,“高市下崗”傳遍全境,石破茂判斷沒錯

動漫里的童話
2026-04-21 10:54:50
古今第一奇文,一千字寫盡五千年歷史,無一字重復

古今第一奇文,一千字寫盡五千年歷史,無一字重復

長風文史
2026-04-08 14:30:03
69年陳云下放江西,時任省委書記拒不見面,陳云:此人膽子很大

69年陳云下放江西,時任省委書記拒不見面,陳云:此人膽子很大

鑒史錄
2026-04-20 22:03:41
長期吃瑞舒伐他汀,需要明白的獲益與風險,避開誤區

長期吃瑞舒伐他汀,需要明白的獲益與風險,避開誤區

藥師華子
2026-04-20 21:16:17
退休阿姨說:和再婚老伴同居后才明白,男人老了還要找老伴的原因

退休阿姨說:和再婚老伴同居后才明白,男人老了還要找老伴的原因

熱心柚子姐姐
2026-04-20 10:15:40
喜訊!2026夏季這些生肖貴人相助,半點不窮,財神就守在身邊

喜訊!2026夏季這些生肖貴人相助,半點不窮,財神就守在身邊

毅談生肖
2026-04-21 12:59:51
國內或將逐漸停止腸鏡檢查?做檢查對身體有影響?醫生告訴您真相

國內或將逐漸停止腸鏡檢查?做檢查對身體有影響?醫生告訴您真相

健康科普365
2026-04-17 20:05:08
香蕉被點名!醫生:高血脂患者常吃香蕉,很快或迎來這些后果

香蕉被點名!醫生:高血脂患者常吃香蕉,很快或迎來這些后果

墜入二次元的海洋
2026-04-21 11:56:21
李想怒噴日產的背后,藏著“增程帝國”崩塌的無能為力

李想怒噴日產的背后,藏著“增程帝國”崩塌的無能為力

少數派報告Report
2026-04-19 09:17:16
從中國駛向伊朗的貨船,遭美軍開火截停,不到24小時,中方表態

從中國駛向伊朗的貨船,遭美軍開火截停,不到24小時,中方表態

諦聽骨語本尊
2026-04-21 13:30:55
山西長治萬達廣場一女子墜樓身亡,警方通報:張某(女,31歲)獨自進入商場到4樓,翻越欄桿后墜落,排除刑事案件

山西長治萬達廣場一女子墜樓身亡,警方通報:張某(女,31歲)獨自進入商場到4樓,翻越欄桿后墜落,排除刑事案件

揚子晚報
2026-04-21 09:21:30
兵敗如山倒!國產新能源或已證明:中國壓根不需要二線豪華品牌

兵敗如山倒!國產新能源或已證明:中國壓根不需要二線豪華品牌

青煙小先生
2026-04-21 09:44:04
35歲女子去做私處緊縮,縫針斷在肉里,醫生徒手掏了半小時沒找著

35歲女子去做私處緊縮,縫針斷在肉里,醫生徒手掏了半小時沒找著

網絡易不易
2026-04-21 12:45:10
2026-04-21 15:00:49
互聯網怪盜團丶 incentive-icons
互聯網怪盜團丶
互聯網行業觀察者
406文章數 375關注度
往期回顧 全部

科技要聞

重磅官宣:庫克卸任,特努斯接任蘋果CEO

頭條要聞

丈夫在海外做生意 妻子和兒子在家里充電經歷驚魂一夜

頭條要聞

丈夫在海外做生意 妻子和兒子在家里充電經歷驚魂一夜

體育要聞

“被優化”8年后,國乒方博決定換一條路重新上場

娛樂要聞

周潤發時隔16年再賣樓,變現數億資產

財經要聞

減速機訂單已排到明年!

汽車要聞

把天門山搬進廠?開仰望U8沖上45度坡的那刻 我腿軟了

態度原創

親子
手機
健康
藝術
本地

親子要聞

4歲女兒養的兔子,爸爸養夠了想給它送人,結果女兒的話讓人意外

手機要聞

Omdia:2026年智能手機AMOLED面板出貨下滑7%至7.78億件

干細胞抗衰4大誤區,90%的人都中招

藝術要聞

任伯年寫竹,真帶勁

本地新聞

春色滿城關不住|白鵑梅浪漫盛放,吳山藏了一片四月雪

無障礙瀏覽 進入關懷版