无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

把 RAG 做成主流的公司,現在開始“做空”RAG 了

0
分享至


編譯 | Tina

Pinecone 剛剛幾乎等于親口宣布:RAG 時代結束了。

作為向量數據庫賽道的開創者,Pinecone 當年親手把 RAG 定義成了大語言模型 grounding 的標準范式。過去幾年里,大約 80 萬開發者、9000 家付費客戶,都在 Pinecone 的基礎設施上學習如何切 chunk、做 embedding、跑 retrieval。而隨著本周一發布面向 Agent 的知識引擎 Nexus,Pinecone 現在卻開始告訴這些開發者:他們過去學會的那套模式,如今反而成了瓶頸。

Pinecone 親手定義的賽道,如今被它親手判了過時

如果仔細看 Pinecone 對 Nexus 的描述,會發現它幾乎是在重新定義整個 retrieval 模式。它把 retrieval-at-inference(推理檢索)形容成“Agent 檢索的十條藍色鏈接時代(the ten blue links era of agentic retrieval)”。

這里的“十條藍色鏈接”,其實是在借用早年搜索引擎的經典意象:搜索引擎只負責甩給你一堆鏈接,用戶自己點進去、自己閱讀、自己拼信息。Pinecone 的意思是,現在很多 Agent 的 retrieval,本質上也還停留在這種“AI 版搜索引擎”階段——不停 retrieve、read、再 retrieve。

它給出的數據是:

陷在 retrieve-read-retrieve 循環里的 Agent,任務完成率通常只有 50% 到 60%;而且 Agent 85% 的精力,其實都消耗在“找上下文”這件事上。

Pinecone 的核心觀點是:把一堆原始 chunk 直接丟給前沿模型,然后期待模型自己理解、自己推理,這套方式既脆弱、又慢,還非常昂貴。

而這套描述,其實就是換了個名字的 RAG。過去四年里,Pinecone 一直在推動的正是這套模式:教程、培訓內容、開發者關系體系,幾乎全都圍繞它展開。只是現在,向量數據庫已經不再是面向開發者的“產品表層”,而變成了更底層的基礎設施。真正的產品層,又往上移動了一層。

這種級別的“自我揭短”其實很少見。大多數基礎設施廠商,即便已經意識到舊模式在衰退,也會繼續賣舊東西,等市場自己慢慢察覺。但 Pinecone 成了第一個主動把這件事說出來的廠商,他們表示:“Agent 時代需要一些不同的東西。”

“知識編譯”正在取代 RAG

Pinecone 現在的新關鍵詞叫“Knowledge Compilation(知識編譯)”。核心變化,其實是把“推理”提前了。

他們表示今天的 Agent,其實還無法真正表達“自己需要什么”。這不是功能缺失,而是更底層的結構性缺口。

現在幾乎每一個做 Agent 應用的團隊,都在重復造同樣的 retrieval 輪子:自定義工具定義、在 Agent 框架和數據源之間寫一堆膠水代碼、做各種一次性的集成,而這些東西只要底層稍微變化一下就會崩掉。整個行業至今都沒有一套統一的“知識請求語言”,讓 Agent 能清楚表達自己究竟想從知識系統里得到什么。

這其實不是第一次發生類似的事。在 SQL 出現之前,每個應用也都得自己實現一套數據訪問層。后來 SQL 給關系型數據庫提供了一個通用接口,整個應用生態才真正建立起來。真正改變行業的,不只是數據庫本身,而是那個統一接口。

現在 Agent 也走到了類似的結構性時刻。而且,有些東西,它們今天甚至根本“說不出來”。

“直接把答案給我,而不是二十段 chunk。” 現在沒有統一的輸出結構約定,Agent 拿到的往往還是原始文本,每次調用之后都得重新解析,token 消耗也隨之暴漲。
“告訴我答案來自哪個來源,以及它的可信度。” 今天大多數系統都缺乏字段級別的 grounding,Agent 沒法區分哪些是事實、哪些只是模型猜測,于是輸出天然不穩定,也缺乏治理能力。
“把推理深度控制在標準范圍內,并在 500 毫秒內返回。” 現在沒有統一的 budget envelope(預算邊界)。每次調用可能無限下鉆、無限延長,最終結果就是不可預測、緩慢而浪費。

KnowQL 想解決的,就是 Agent 缺失的這套“表達能力”。

過去的模式里,Agent 會在查詢時臨時抓取二十段 chunk,再瘋狂消耗 token 去理解這些內容到底是什么意思;而 Nexus 的做法,是提前把源數據預編譯成帶類型、可引用、面向具體任務的知識產物(artifacts)。Agent 查詢的不再是原始語料庫,而是這些已經整理好的 artifacts。

KnowQL 則給 Agent 提供了一套完成這件事的“語言”。它把 intent(意圖)、filter(過濾)、provenance(來源)、output shape(輸出格式)、confidence(置信度)以及 latency budget(延遲預算)這六個 primitive,封裝進一次聲明式調用里,最終直接返回一個帶引用、結構化的結果。

Pinecone 聲稱,這種方式能把任務完成率提高到 90% 以上,同時把 token 開銷降低 90%。這些數字當然還需要生產環境驗證,暫時別太早全信。但就算不看具體數字,方向其實已經很明確了:“編譯一次,多次復用(compile once, read many times)”,本來就更適合 Agent 工作負載。

而且,往這個方向走的,也不只有 Pinecone 一家。更大的趨勢,其實是:整個 AI 世界都在把“推理”往上游移動。

Anthropic 推出的 Skills,本質上就是預編譯、可復用的上下文包;Cursor 的 Rules,在編輯器層做的是同一件事;Claude Code 的 subagents,會為不同任務提前打包上下文和工具;而 LangChain 的 Harrison Chase 這幾個月一直在強調的“context engineering”,也是同一個方向。現在,Pinecone 只是把這種思路推進到了 retrieval 層。

這個模式本身并不新鮮。真正新鮮的是:第一個公開宣布它的人,居然是 Pinecone 自己。當然,也有人會提出合理質疑。KnowQL 能不能像 SQL 那樣成為真正的標準,還有很長的路要走。畢竟,標準不是某一家廠商一句話就能定義出來的。向量檢索本身也不會消失,很多 Agent 工作負載依然需要廉價、快速的文本相似度搜索。真正變化的,是價值所在的位置。

如果未來 12 個月的發展,真的像 Pinecone 押注的那樣,那么向量搜索會慢慢變成“水電煤”一樣的基礎設施;Knowledge Compilation 才會成為真正的產品層;而“RAG pipeline”這個詞,最后可能會像今天的“LAMP stack”一樣,變成一種帶著敬意的歷史名詞。

最可能判斷錯的,其實也是“時間點”。因為一個技術范式的衰退,往往都會比廠商宣告它“結束”時來得更慢。但大的方向已經很明顯了。而最先把這個方向說出來的,偏偏正是當年親手把 RAG 做成主流的那家公司。

那個曾經教你怎么做 RAG 的廠商,現在開始告訴你:別再這么干了。

https://www.pinecone.io/blog/knowledge-infrastructure-for-agents/

https://thenewstack.io/pinecone-nexus-rag-obsolete/

聲明:本文為 InfoQ 整理,不代表平臺觀點,未經許可禁止轉載。

會議推薦

Agent 從 Demo 到工程化還差什么?安全與可信這道坎怎么過?研發體系不重構,還能撐多久?

AICon 上海站 2026,13 大重磅專題已上線,誠摯邀請你登臺分享實戰經驗。AICon 2026,期待與你同行。快來掃碼鎖定 8 折專屬席位或提交演講議題

今日薦文

你也「在看」嗎?

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
Shams:沙梅特4年2400萬美元重返尼克斯

Shams:沙梅特4年2400萬美元重返尼克斯

懂球帝
2026-06-30 05:18:27
老板娘問我她身材好不好?我該怎么回答?

老板娘問我她身材好不好?我該怎么回答?

太急張三瘋
2026-06-30 11:28:57
世界杯驚天大瓜!3-3 離譜平局徹底翻車,馬赫雷斯一番話直接自爆

世界杯驚天大瓜!3-3 離譜平局徹底翻車,馬赫雷斯一番話直接自爆

奶蓋熊本熊
2026-06-30 04:07:10
名嘴葉惠賢:開創境外綜藝先河,隨女兒在澳洲養老,79歲晨跑種菜

名嘴葉惠賢:開創境外綜藝先河,隨女兒在澳洲養老,79歲晨跑種菜

白面書誏
2026-06-29 16:36:06
天津凌晨突發!抓了!

天津凌晨突發!抓了!

天津族
2026-06-30 08:58:03
老外搶瘋了!中國分體空調席卷歐洲市場!這只是冰山一角……

老外搶瘋了!中國分體空調席卷歐洲市場!這只是冰山一角……

時尚的弄潮
2026-06-30 01:35:51
聯盟大結局!詹庫在勇士聯手,濃眉加盟組三巨頭

聯盟大結局!詹庫在勇士聯手,濃眉加盟組三巨頭

湖人侃球師
2026-06-30 13:11:51
戰友二婚我隨禮88888,他回我一盒假煙,我心寒丟進垃圾桶,次日民警敲門:那盒煙你抽了嗎?

戰友二婚我隨禮88888,他回我一盒假煙,我心寒丟進垃圾桶,次日民警敲門:那盒煙你抽了嗎?

背包旅行
2026-06-29 12:18:19
中國44年來首次試射洲際導彈,全球反應堪比好萊塢大片

中國44年來首次試射洲際導彈,全球反應堪比好萊塢大片

烽火三月佳人三千
2026-06-25 14:21:42
中國共產黨成立105周年 對話越南駐華大使

中國共產黨成立105周年 對話越南駐華大使

中國日報網
2026-06-30 13:40:10
鐵三女神褲衩開叉 10 厘米!五年被罵上熱搜,裁判卻說是合規的?

鐵三女神褲衩開叉 10 厘米!五年被罵上熱搜,裁判卻說是合規的?

十點體壇
2026-06-09 21:58:11
哈佛10年追蹤:俯臥撐比血壓更準!每周2-3次力竭,給全身換系統

哈佛10年追蹤:俯臥撐比血壓更準!每周2-3次力竭,給全身換系統

健身狂人
2026-06-13 20:30:47
張雪峰女兒張姩菡:否認自己不用讀大學,也不可以躺平

張雪峰女兒張姩菡:否認自己不用讀大學,也不可以躺平

金牌娛樂
2026-06-30 09:36:46
項立剛評馮小剛:飯局跳舞事件后我就不看他電影了,太惡心了

項立剛評馮小剛:飯局跳舞事件后我就不看他電影了,太惡心了

映射生活的身影
2026-06-29 16:37:52
日本心慌了,韓國著急了,如今的中國烏魯木齊,先進制造悄然成勢

日本心慌了,韓國著急了,如今的中國烏魯木齊,先進制造悄然成勢

科技故事聚焦
2026-06-30 09:14:02
董卿:母親因癌離世3個多月,余生我會托起父親的晚年

董卿:母親因癌離世3個多月,余生我會托起父親的晚年

苗苗情感說
2026-06-29 18:11:07
刑偵大案口述紀實:塵封28年,南醫大女學生命案終告偵破!

刑偵大案口述紀實:塵封28年,南醫大女學生命案終告偵破!

橘仔看世界
2026-06-23 09:09:12
中國出手,菲親華派絕地翻盤!憋了17天,菲防長送中方一句狠話

中國出手,菲親華派絕地翻盤!憋了17天,菲防長送中方一句狠話

墨子翟的日記y
2026-06-30 13:34:22
日媒:日本決定暫不把“算數”科目名稱改為“數學”

日媒:日本決定暫不把“算數”科目名稱改為“數學”

隨波蕩漾的漂流瓶
2026-06-29 20:28:56
今晚開始!央一央八愛奇藝等4部王炸劇來襲!眾星云集,先追哪部

今晚開始!央一央八愛奇藝等4部王炸劇來襲!眾星云集,先追哪部

小椰的奶奶
2026-06-30 01:19:29
2026-06-30 14:15:03
AI前線 incentive-icons
AI前線
面向AI愛好者、開發者和科學家,提供AI領域技術資訊。
1586文章數 160關注度
往期回顧 全部

科技要聞

DeepSeek V4正式版要來 高峰期API價格翻倍

頭條要聞

荷蘭隊連續3屆倒在點球大戰 此前9次點球大戰只贏兩場

頭條要聞

荷蘭隊連續3屆倒在點球大戰 此前9次點球大戰只贏兩場

體育要聞

德國足球,臉都不要了

娛樂要聞

韓紅稱要退出公益,多位名人挽留

財經要聞

韓國萬億"芯"基建:存儲能否成AI時代油田

汽車要聞

誰懂啊家人們!爹味和班味一點都沒,這臺底盤最硬國產大獵裝太上頭!

態度原創

藝術
手機
家居
時尚
公開課

藝術要聞

喬治·莫蘭迪簡潔的靜物畫,色彩看著太舒服了!

手機要聞

刀法精準 蘋果iPhone 18e祖傳60Hz屏幕接著賣

家居要聞

傳奇筑 日常詩

“復古波點”又流行回來了!夏天簡單穿就很時髦

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版