![]()
專為 AI 構建搜索引擎的基礎設施公司 Exa 宣布完成 2.5 億美元 C 輪融資,投后估值達到 22 億美元,由 a16z 領投,a16z 合伙人 Sarah Wang 主導了本輪交易。
此前,Exa 在 2024 年 7 月和 2025 年 9 月分別完成了 2,200 萬美元 A 輪和 8,500 萬美元 B 輪,B 輪由 Benchmark 合伙人 Peter Fenton 領投并加入董事會,估值 7 億美元。不到一年,估值翻了三倍。
新一輪資金將用于把索引范圍擴展到開放網頁之外,訓練下一代檢索模型,以及將基礎設施擴容到每秒處理數十萬次搜索請求。與此同時,Exa 也在積極擴張市場團隊。聯合創始人 Jeffrey Wang 在接受 DeepTech 采訪時表示,“關于這些資金的規劃用途其實非常簡單,技術和市場兩邊都需要繼續提速。”
Exa 目前服務超過 5,000 家企業客戶和 40 萬開發者,客戶名單里有 Cursor、HubSpot、OpenRouter、Gamma、Lovable 等公司。據 Exa 披露,其客戶查詢量從 2025 年 4 月的約 1 億次增長到 2026 年 4 月的約 10 億次,一年翻了十倍。它的爬蟲追蹤著超過 5,000 億個 URL,背后是自建的索引系統、自訓練的 embedding 模型、自研的向量數據庫,以及一個由 H200 GPU 組成的自有訓練集群。
這些數字背后的故事開始于 2021 年。那時候 ChatGPT 還沒出現,“AI 需要搜索引擎”這個判斷甚至顯得有些超前。
撞上 ChatGPT 的搜索引擎
Jeffrey Wang 本科畢業于哈佛大學,畢業后在金融科技公司 Plaid 工作了三年,負責數據與網絡基礎設施。2021 年,他和大學室友 Will Bryk 聯合創辦了 Exa(當時叫 Metaphor),Bryk 擔任 CEO。兩人當時的信念很大膽:世界需要一個比谷歌更好的搜索引擎,而他們能做到。
![]()
圖丨Will Bryk 和 Jeffrey Wang(來源:Exa)
在創業早期,他們就下重注,花 5百萬美元買了一個 GPU 集群,以便快速構建大規模索引系統,嘗試了多種新型搜索技術。目標是開發一個讓用戶能以谷歌做不到的方式搜索網絡的引擎。比如,“給我找出所有在紐約、擁有博客的機器學習工程師,按經驗年限排序。”
2022 年 11 月,Exa 推出了第一款搜索引擎產品。兩周后,ChatGPT 上線。
很快,需求涌了過來。大量公司開始研發 AI 應用,而這些應用需要從網上獲取信息。Wang 和 Bryk 意識到了兩件事:AI 也需要搜索,而且 AI 的搜索頻率很快就會遠超人類。
谷歌搜索被設計出來服務人類用戶,人類想要的是十個藍色鏈接。AI 想要的完全不同:它需要的是高質量的完整頁面內容,而不是 SEO 內容或廣告;它對延遲極其敏感,因為在單個請求中搜索往往只是多個工具調用之一;它要求零數據保留,因為企業客戶的查詢往往高度敏感。
Wang 告訴我們,Exa 產品的底層是同一個引擎:自己的爬蟲,自己的索引,自己的 embedding 模型,自己的向量數據庫。網站上每個產品只是用不同方式向這個引擎提問。
搜索 API 是最原始的接口,按照延遲和質量的不同,分為幾個層級。Exa Instant 響應時間低于 200 毫秒,為實時對話、語音助手和編程 agent 而生,Wang 稱之為“全球最快的搜索 API”。Exa Auto 大約 1 秒,是默認模式,提供最好的單次查詢質量。
Exa Deep 和 Deep Max 則是 agentic search,系統自主推理、并行展開多個子查詢、匯總結果,Deep Max 在 Google DeepMind 的 DeepSearchQA 基準測試和 FRAMES 等評測中拿到了 SOTA。
![]()
(來源:Exa)
在 API 之上還有兩個產品。Highlights 是 Exa 的文本提取模型,能從頁面中抽取最相關的段落。Wang 提到一個數據:在 SimpleQA 評測上,500 個字符的 Highlights 輸出匹配了 8,000 個字符完整頁面的準確度,token 消耗降低了約 20 倍。
Websets 則是異步、大規模的產品,用戶給出自然語言描述和驗證條件,比如“美國做農業科技的 A 輪公司”,系統會自行搜索、逐一驗證、豐富數據。企業 GTM 和運營團隊是 Websets 的重度用戶。
Jeff Wang 把這概括為“一條從 200 毫秒到數分鐘的曲線”,認為用同一套引擎覆蓋“快”和“準確”的兩端是 Exa 的關鍵差異。同樣的索引、模型和向量數據庫,通過調整計算預算和路由,一端做到 200 毫秒以下,另一端做到分鐘級的 agentic 搜索。“只有自己造引擎才能做到這一點,套殼產品是做不到的。”
搜索不只是推理工具,也是訓練基底
Exa 最近發布的一項研究佐證了 Wang 的判斷。他們發現,用 Exa 而非 Google 作為搜索后端來訓練 RL 搜索 agent,agent 學得更快、最終表現更好。具體數字是:訓練同樣的 pass@k 水平,用 Exa 比用傳統搜索引擎結果頁(SERP)基線節省了 69% 的 token 消耗,搜索調用次數減少 62%,交互輪數減少 58%。
![]()
圖丨Pass@k 的提升在各個獨立基準測試中保持一致(來源:Exa)
Wang 認為這個結果雖然事后看很符合直覺,但其意義重大:“搜索不僅僅是推理時的工具,它也是訓練時的基底(substrate),這個區分值真金白銀。”RL 訓練是當下 AI 領域最耗 token 的工作負載之一,60% 到 70% 的削減意味著完全不同的訓練賬單。而且用 Exa 訓練出來的 agent 在推理時也更高效,每個查詢使用更少的 token、更少的輪數和更少的搜索調用。
隨著越來越多的實驗室開始構建搜索 agent,Wang 預判它們會需要一個專為此目的打造的訓練環境,“而不是套殼一個本來為人類點擊藍色鏈接而優化的消費級搜索引擎。”
這一判斷指向了 Exa 反復強調的核心護城河:自建 vs.套殼(wrapper)。Wang 向我們解釋,大多數搜索 API 提供商在底層封裝的是谷歌搜索。“這是行業里一個鮮為人知的秘密。”當查詢到達這些服務商時,會被路由到某個匿名服務器上的瀏覽器,在谷歌搜索中執行查詢,再把結果返回。這意味著至少 700 毫秒的中位延遲,意味著無法真正實現零數據保留(因為谷歌搜索本身會記錄查詢),也意味著無法為特定用例深度定制。
“六個月前我們的代碼搜索還不如谷歌,”Wang 說,“現在我們訓練了代碼專用模型之后,幾乎所有編程 agent 都在用我們。這件事如果你只是谷歌上面的一層套殼,根本做不到。”
Wang 還提到一個更現實的威脅:谷歌不會永遠允許自己 90% 的流量來自機器人。一旦谷歌收緊政策,所有依賴它的套殼產品都會同時失去根基。
10^18>10^100
Exa 去年在舊金山豎過一塊廣告牌,上面寫著“10^18>10^100”(10^18 對應國際單位制前綴 exa,10^100 是數學術語 googol,即 Google 名字的由來),意思不言自明。Wang 說他們仍然認同廣告牌傳達的觀點:為 AI 構建的搜索和為人類構建的搜索是不同的產品,這個差異很重要。
![]()
圖丨Exa 去年火出圈的廣告牌(來源:Reddit)
但 Google Cloud 和 Gemini 是另一回事。幾周前的 Google Next 大會上,Exa 成為 Gemini Enterprise 新推出的 Agent Marketplace 的首批合作伙伴。Vertex AI 上線了“Grounding with Exa”功能,Gemini 企業客戶可以直接用 Exa 做搜索落地,從 Google commit 中直接調用。Exa 的 Highlights 模型為 Gemini 提供高密度、高相關性的上下文,在新聞、產品數據、技術文檔等時效性敏感的場景里尤其關鍵。
“競爭者 or 合作伙伴的二元框架并不是理解這件事的正確方式”Wang 說,“Google Cloud 有龐大的企業客戶群,他們在構建 agent,而 agent 需要高質量的實時網頁信息。我們很樂意服務這些客戶。”
賽道上其他玩家的動態也在印證這個領域受到的關注正在日益提高。Tavily 在 2026 年 2 月被云計算公司 Nebius 收購,Parallel AI 拿到了 1 億美元 A 輪融資。
兩年前,“為 AI 做搜索”還只是別人產品里的一個功能。如今它被資本市場確認為獨立的基礎設施層。Wang 對這個賽道未來一到兩年的判斷是:自建引擎和套殼谷歌之間的差距會變得非常明顯。“隨著 agent 做越來越重要的工作,它們對質量、延遲、時效性和定制化的要求只會不斷提高,而只有擁有全棧技術的產品才能滿足。”
Exa 的團隊也在快速變化。最近加入的人包括 Meta 檢索基礎設施負責人、Yandex 搜索后端負責人,以及一支來自 Google Search 蘇黎世團隊的研究組。“人們來這里,是因為這里正在真正建造搜索引擎,”Wang 說。
Exa 已在新加坡開設了亞洲辦公室,并在快速擴張。Wang 提到 Exa 的亞洲客戶已經涵蓋日本大型商社、千億美元級金融機構、科技巨頭、云和推理服務商、風險投資機構,以及一大批“Global First”的 agent 創業公司。
截至目前,Exa 累計融資約 3.6 億美元,團隊規模過百人。Wang 在采訪中重復了他經常說的一句話:全世界真正獨立的搜索引擎數量比能發射火箭的公司還少。造搜索引擎極其困難,但也極其必要。
當數萬億 agent 在未來幾年陸續上線,搜索需求將增長到谷歌今天總搜索量的千倍以上。而當 agent 開始為人類做出越來越重要的商業決策,它們對全面性、時效性和精確性的要求會遠遠超出人類自身的標準。如何來為這些 agent 提供可信賴的信息基礎設施,仍是一個開放的問題。Exa 押注的答案是:從第一性出發,一切從零重造。
“信息是我們這個 AI 時代的文明基座。政治在分裂,戰爭在蔓延,AI 在加速——我們需要值得信賴的工具,來告訴我們這個世界究竟在發生什么。完美的搜索,讓每個 AI 都能獲取最高質量的信息,進而讓每個人也能。”
參考資料:
1.https://exa.ai/blog/webcode
2.https://exa.ai/blog/deep-max
3.https://exa.ai/blog/composing-a-search-engine
4.https://exa.ai/blog/rl-search-outcomes
運營/排版:何晨龍
注:封面/首圖由 AI 輔助生成
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.