无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

吳恩達、Karpathy 天使輪,微軟、SpaceX搶購,這家初創(chuàng)公司到底什么來頭?

0
分享至


擴散模型殺進了文本生成的地盤,而巨頭們?yōu)榱藫屗呀洿蚱饋砹恕?/p>


作者|樺林舞王

編輯|靖宇

在 AI 瘋狂發(fā)展的當下,在一片狂熱之下,行業(yè)同樣在擔心一個根本問題——LLM 是否已經走到頭了?會不會有新的架構誕生,造就出新的 AI 王者。

5 月 13 日,外媒爆出一條消息,微軟正在和一家叫 Inception 的小公司談收購。就在同一天,馬斯克的 SpaceX,也在追求這家公司。

一家吳恩達、Karpathy 做天使投資人、種子輪才拿了 5000 萬美元的創(chuàng)業(yè)公司,現(xiàn)在開價超過 10 億美元——溢價 20 倍。微軟和 SpaceX 兩個萬億級巨頭同時下場爭搶,搶的不是什么成熟業(yè)務,是一支斯坦福教授團隊和一條幾乎沒人走過的技術路線。

這家和諾蘭的《盜夢空間》用一樣名字的初創(chuàng)團隊,到底有什么不同凡響之處?

01

三個教授和一個「異端」想法

Inception 的故事,要從它的創(chuàng)始人 Stefano Ermon 說起。

Ermon 是斯坦福大學計算機科學教授,但他更重要的身份是——擴散模型(Diffusion Model)的共同發(fā)明人。大家今天用的 Midjourney、Sora、Stable Diffusion,底層都跑著他幫助開創(chuàng)的技術。他關于文本擴散的論文拿過 ICML 2024 最佳論文獎。

2024 年中,Ermon 從斯坦福休假,拉上了兩個合作超過 10 年的老搭檔——UCLA 教授 Aditya Grover 和 Cornell 教授 Volodymyr Kuleshov,在 Palo Alto 創(chuàng)立了 Inception Labs。

這三個人有一個在當時看來相當「異端」的想法:把擴散模型從圖像領域搬到文本生成領域,徹底替換掉自回歸架構。

Andrej Karpathy 在 Inception 發(fā)布第一個模型時就在 X 上表達了興趣。他說,今天幾乎所有 LLM 在核心建模方法上都是「克隆體」,都是從左到右逐個預測 token。擴散模型完全不同——它不是從左到右生成,而是從噪聲中逐步去噪,最終得到一個完整的 token 序列。他覺得這個模型「有潛力展現(xiàn)全新的、獨特的能力特征」,鼓勵大家去試。

Karpathy 不只是嘴上說說。他和吳恩達(Andrew Ng)都以天使投資人身份參與了 Inception 的種子輪。

2025 年 11 月,Inception 完成了 5000 萬美元種子融資,Menlo Ventures 領投,NVIDIA 旗下 NVentures、微軟旗下 M12、Snowflake Ventures、Databricks 投資部門全部跟投。

當 Karpathy 和吳恩達同時押注一家公司,當 NVIDIA 和微軟的戰(zhàn)投基金同時出現(xiàn)在投資人名單上,這基本上是 AI 領域最頂級的背書組合了。

02

快 10 倍,便宜 10 倍

要理解 Inception 為什么值錢,得先理解它的技術路線為什么不一樣。

今天大家用的 ChatGPT、Claude、Gemini,底層全是自回歸模型(Autoregressive Model)。它們生成文本的方式是:一個 token 接一個 token,從左到右,串行輸出。每生成一個字之前,必須等前面所有字都生成完。

就像一個人寫文章,只能一個字一個字地往后寫,絕對不能跳著寫。

這個方法很可靠,但有一個結構性天花板——速度被串行生成鎖死了。你可以換更好的芯片,可以優(yōu)化推理框架,可以壓縮模型,但只要本質上還是逐 token 生成,速度就有上限。

Inception 選了一條完全不同的路。它用擴散模型做文本生成——不是逐字寫,而是先給出一個「粗略草稿」,然后通過神經網絡反復精煉,同時修改多個 token,并行輸出。

Ermon 的原話很直白:「這是一種根本不同的方法。所有現(xiàn)有的大語言模型都是自回歸的,一個接一個地從左到右生成文本或代碼,這非常慢,因為你不能在生成前面所有內容之前生成后面的東西?!?/p>


Mercury 2 模型在每秒 token 輸出上比流行的小模型更快|圖片來源:Inception

實際效果呢?Inception 推出的模型家族叫 Mercury。2026 年 2 月發(fā)布的 Mercury 2,根據第三方評測機構 Artificial Analysis 的測試,輸出吞吐量大約在每秒 1000 個 token。作為對比,Claude 4.5 Haiku 大約是每秒 89 個 token,GPT-5 Mini 大約是每秒 71 個 token。快了差不多 10 到 14 倍。

在質量上,Mercury 2 的 AIME 2025 得分 91.1,GPQA 得分 73.6,LiveCodeBench 得分 67.3。這些分數和 Claude 4.5 Haiku、GPT-5.2 Mini 在同一個競爭區(qū)間,但吞吐量是后者的 10 倍以上。

Ermon 對此也很坦誠——Mercury 2 對標的是 Haiku 和 Flash 這個級別的模型,不是 Claude Opus 或 GPT-4 這種旗艦。第三方分析也指出,在復雜推理任務上,擴散模型的質量大約是前沿自回歸模型的 85%-95%,但在結構化輸出和翻譯任務上基本持平。

但這恰恰是它最有想象力的地方。如果擴散模型的質量差距只有 5%-15%,而速度優(yōu)勢是 10 倍,那在大量對延遲敏感的場景里——實時語音交互、代碼自動補全、游戲對話、Agent 循環(huán)調用——擴散模型就是更實際的選擇。


代碼構建上 Mercury2 模型只用迭代 14 次,而其他模型要迭代 87 次|圖片來源:Inception

而且,擴散框架還帶來幾個自回歸模型做不到的結構性優(yōu)勢。

第一,輸出可控性更強。擴散模型能天然遵循特定的 schema 和語義約束,生成符合指定格式的 JSON 輸出,這在企業(yè)級應用里極其重要。

第二,天然支持多模態(tài)融合。擴散本來就是圖像和視頻生成的底層范式,現(xiàn)在把它擴展到文本,等于用一套統(tǒng)一框架處理語言、圖像、音頻、視頻,不用再拼接不同架構。

第三,內置糾錯能力。自回歸模型一旦前面寫錯了,后面很難糾正;擴散模型可以在精煉過程中反復修正,理論上能減少幻覺。

當然,這條路線也有明顯的不確定性。一些 AI 研究者指出,擴散方法讓輸出預測更加困難,它的 Scaling Law 還沒有被充分驗證——自回歸模型「參數越多、數據越多、效果越好」的規(guī)律花了好幾年才摸清,擴散模型是否遵循類似的規(guī)律,還是需要完全不同的優(yōu)化策略,目前沒有定論。

但正是這種不確定性,才讓它有可能成為下一個范式。

03

「后 OpenAI 時代」的軍備競賽

理解了 Inception 的技術,再來看為什么微軟和 SpaceX 同時搶它,邏輯就清楚了。

2026 年 4 月 27 日,微軟和 OpenAI 官宣了合作關系的重大調整。微軟對 OpenAI 模型的 IP 授權從獨家變成非獨家,有效期延到 2032 年。微軟不再向 OpenAI 支付收入分成。OpenAI 可以在 AWS、Google Cloud 等任何云平臺上提供服務。AGI 條款被徹底刪除。

這段曾經被稱為「科技界最佳 Bromance」的關系,實質上已經變成了「管理型競爭」。

微軟在 OpenAI 身上花了超過 130 億美元投資,還有大量 Azure 算力支持。但現(xiàn)在,OpenAI 不再是微軟的「獨家武器」,而微軟也在加速擺脫對 OpenAI 的依賴。據報道,微軟正在開發(fā)自己的通用 AI 模型,目標是 2027 年之前推出能和 OpenAI、Anthropic 正面競爭的前沿模型。

收購 AI 創(chuàng)業(yè)公司,就是這個戰(zhàn)略的一部分。

路透社的報道披露,微軟今年春天先看上了代碼生成公司 Cursor,但因為自己有 GitHub Copilot,內部擔心反壟斷審查過不了,主動放棄了。SpaceX 隨后立刻和 Cursor 簽了一份 600 億美元的收購期權協(xié)議——如果收購不成,SpaceX 也要付 100 億美元的合作費。

微軟放棄 Cursor 后,轉向了 Inception。但 SpaceX 也盯上了 Inception。Inception 已經聘請了投行來操盤交易談判,開價超過 10 億美元。

SpaceX 的介入讓整件事更有趣。

2026 年 2 月,SpaceX 以全股票交易方式收購了 Musk 的 xAI,兩家公司合并后估值 1.25 萬億美元。這是有史以來估值最高的商業(yè)并購。SpaceX 隨后又啟動了 Terafab 半導體工廠項目,與 Tesla 和 xAI 聯(lián)合建設。再加上收購 Cursor 的期權和對 Inception 的追求,Musk 顯然在用 SpaceX 作為平臺,系統(tǒng)性地構建一個從芯片到模型到應用的完整 AI 技術棧。

而微軟這邊,除了追求 Inception 之外,也在同時和多家 AI 創(chuàng)業(yè)公司接觸。路透社引述知情人士稱,AI 研究人員現(xiàn)在輕松就能拿到數千萬美元的薪酬,創(chuàng)業(yè)公司估值在投資者的瘋搶下飛速上漲。

Menlo Ventures 合伙人 Tim Tully 在 Inception 融資時說過一句話,放在今天的收購大戰(zhàn)背景下格外應景。他說,Inception 的團隊證明了擴散式 LLM 不只是一個研究突破,而是「一個可以構建可擴展、高性能語言模型的基礎,企業(yè)今天就能部署」。

這句話解釋了一切——巨頭們搶的不是一家公司,是一個可能改寫游戲規(guī)則的技術范式,以及掌握這個范式的那幾個人。

當微軟和 OpenAI 的「婚姻」走向開放式關系,當 SpaceX 從火箭公司變成 AI 收購機器,當一家種子輪公司被兩個萬億巨頭同時爭搶——這場「后 OpenAI 時代」的軍備競賽,才剛剛開始。

而 Inception 的命運,無論最終花落誰家,都已經證明了一件事:在 AI 的世界里,真正稀缺的從來不是資本,而是敢走不同路線的人。

*頭圖來源:豆瓣電影

本文為極客公園原創(chuàng)文章,轉載請聯(lián)系極客君微信 geekparkGO

極客一問

你覺得擴散模型有可能取代自回歸,

成為下一代 AI 的底層范式嗎?


特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
伊朗對美方目標發(fā)動襲擊!伊朗多地遭美軍空襲,儲水系統(tǒng)被炸,特朗普:行動“非常強硬”!伊方:美國已戰(zhàn)敗,若想安全最好離開

伊朗對美方目標發(fā)動襲擊!伊朗多地遭美軍空襲,儲水系統(tǒng)被炸,特朗普:行動“非常強硬”!伊方:美國已戰(zhàn)敗,若想安全最好離開

每日經濟新聞
2026-06-10 07:45:17
吳千語施伯雄在上海新家拍大片,4層別墅公開,老錢風裝修真高級

吳千語施伯雄在上海新家拍大片,4層別墅公開,老錢風裝修真高級

八怪娛
2026-06-09 11:03:36
排名158位!鄭欽文手握15項代言年入1.6億 博主建議:別接廣告了

排名158位!鄭欽文手握15項代言年入1.6億 博主建議:別接廣告了

風過鄉(xiāng)
2026-06-10 07:27:32
王菲最讓我破防的,不是愛情……

王菲最讓我破防的,不是愛情……

媽咪OK
2026-06-09 13:47:51
有高人預測:今明兩年,國內貶值最快的不是現(xiàn)金,而是這4樣東西

有高人預測:今明兩年,國內貶值最快的不是現(xiàn)金,而是這4樣東西

細說職場
2026-06-09 12:24:45
許可馨:曾揚言將全部資產捐給反華組織,如今下場簡直大快人心

許可馨:曾揚言將全部資產捐給反華組織,如今下場簡直大快人心

莫地方
2026-06-07 01:20:08
花旗警告:金價或跌至3500美元

花旗警告:金價或跌至3500美元

21世紀經濟報道
2026-06-10 16:11:41
化工專業(yè)真有這么恐怖?網傳中南大化工33人走了3人,6人確診癌癥

化工專業(yè)真有這么恐怖?網傳中南大化工33人走了3人,6人確診癌癥

慧翔百科
2026-06-08 11:28:13
如果布倫森帶領尼克斯奪冠并拿下FMVP,將會引發(fā)3大震撼反應!

如果布倫森帶領尼克斯奪冠并拿下FMVP,將會引發(fā)3大震撼反應!

田先生籃球
2026-06-07 21:44:26
湯恩伯倉皇逃往臺灣拋下發(fā)妻,馬阿謙找到新政府,僅提了一個要求

湯恩伯倉皇逃往臺灣拋下發(fā)妻,馬阿謙找到新政府,僅提了一個要求

磊子講史
2026-06-01 14:01:11
“保不住香港,我們以死謝罪!”,解密驚心動魄的香港經濟保衛(wèi)戰(zhàn)

“保不住香港,我們以死謝罪!”,解密驚心動魄的香港經濟保衛(wèi)戰(zhàn)

文史道
2025-02-18 20:31:56
戲混子又來嚯嚯央視???只會一個表情抿嘴干瞪眼,張嘉益都帶不動

戲混子又來嚯嚯央視?。恐粫粋€表情抿嘴干瞪眼,張嘉益都帶不動

不似少年游
2026-06-01 16:56:28
豐田全新發(fā)動機量產裝車,熱效率44.5%,一箱油跑1200公里

豐田全新發(fā)動機量產裝車,熱效率44.5%,一箱油跑1200公里

沙雕小琳琳
2026-06-09 00:39:53
小米正式回應SU7 Ultra起火事故!

小米正式回應SU7 Ultra起火事故!

新浪財經
2026-06-09 13:42:50
害怕美國人看到中國車,美國倆政客想出一個餿主意……

害怕美國人看到中國車,美國倆政客想出一個餿主意……

環(huán)球時報國際
2026-06-10 08:15:34
中國臺東執(zhí)法第3天!日本回應了:官木原稔表態(tài),小泉表態(tài)

中國臺東執(zhí)法第3天!日本回應了:官木原稔表態(tài),小泉表態(tài)

阿訊說天下
2026-06-10 11:47:57
田樸珺突然發(fā)聲!直言“積攢萬般無奈”,她與王石近況再登熱搜

田樸珺突然發(fā)聲!直言“積攢萬般無奈”,她與王石近況再登熱搜

火山詩話
2026-06-09 10:42:38
曝臺灣省歌手費玉清現(xiàn)狀曝光!無兒無女,和女閨蜜互相解決需求

曝臺灣省歌手費玉清現(xiàn)狀曝光!無兒無女,和女閨蜜互相解決需求

小徐講八卦
2026-04-02 07:51:08
沈伯洋稱若當選臺北市長最想拜會北京,國臺辦:自抬身價、嘩眾取寵,不值一評

沈伯洋稱若當選臺北市長最想拜會北京,國臺辦:自抬身價、嘩眾取寵,不值一評

京彩臺灣
2026-06-10 13:55:52
阿里釘釘副總裁已離職,他把話說的很直白,連說了三遍很心痛

阿里釘釘副總裁已離職,他把話說的很直白,連說了三遍很心痛

瑛派兒老黃
2026-06-09 17:10:39
2026-06-10 18:44:49
極客公園
極客公園
讓最棒的創(chuàng)新成為頭條
12146文章數 78907關注度
往期回顧 全部

財經要聞

一紙研報引"光"速下跌 CPO落地節(jié)奏有變?

頭條要聞

廣州公交客流暴跌59% 10個曾經坐車的乘客中6個不坐了

頭條要聞

廣州公交客流暴跌59% 10個曾經坐車的乘客中6個不坐了

體育要聞

2026世界杯,我們看什么?

娛樂要聞

蒙淇淇發(fā)文開撕白鹿!輿論再次反轉

科技要聞

凌晨突發(fā)!Anthropic神級模型向你開放

汽車要聞

首款搭載激光雷達的A00級車型 2026款海鷗煥新上市

態(tài)度原創(chuàng)

教育
房產
健康
旅游
公開課

教育要聞

第八屆中小學班主任發(fā)展大會,從“管 到“育”重塑班主任勝任力

房產要聞

方案曝光,三亞又一地王級豪宅要出!

粽子、湯圓……常見粘食大盤點!

旅游要聞

“玩”美新消費|在未來感湯泉館解鎖都市“微度假”

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版