无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

RAG 永不死:張穎峰和他藏在 Flow 里的執(zhí)念 | 萬有引力

0
分享至


作者 | 唐小引

出品 | CSDN(ID:CSDNnews)

過去兩年,有一句話反復(fù)出現(xiàn)在技術(shù)媒體、播客,乃至大模型的回答里:RAG 已死。

說這話的人來自各方。有人是為了推銷更新的架構(gòu),有人真的相信超長上下文窗口終將讓檢索技術(shù)變得多余。還有一類人——張穎峰帶著一絲諷刺意味地告訴我——「本質(zhì)上自己就在做 Retrieval(檢索),卻也在宣稱 RAG Dead」。

與此同時,RAGFlow 的 GitHub Star 數(shù)字在漲。

RAGFlow 是一款開源 RAG 引擎,在全球開發(fā)者社區(qū)有相當(dāng)高的知名度。2025 年 GitHub 年度 Top 10 項目榜單上,它是為數(shù)不多來自中國團隊的項目之一。背后的公司叫 InfiniFlow(中文名英飛流),聯(lián)合創(chuàng)始人是張穎峰和金海,2023 年 8 月成立于上海。

兩年多過去了,這家公司剛剛完成架構(gòu)重組,以紅籌方式在香港落地控股主體,正在為更大規(guī)模的出海商業(yè)化做準(zhǔn)備。Pre-A 融資已完成兩輪,投資方分別是創(chuàng)新工場和北極光創(chuàng)投,合計數(shù)百萬美元。

本期《萬有引力》,我和張穎峰做了一次長談。


從蘭州到 Infra,一個搜索老兵的「第一次創(chuàng)業(yè)」

張穎峰是蘭州人。

高考報志愿的時候,他選了上海交通大學(xué)的電子工程專業(yè)。理由很簡單:「別人說這個專業(yè)挺熱門的。」為什么熱門,他自己也說不上來。就這樣去了上海,然后再也沒有回去。

真正開始理解計算機,是工作之后的事。進入搜索領(lǐng)域的那家公司,成了他人生里最關(guān)鍵的一次塑造——「對我為人、技術(shù)上的影響,遠遠高于學(xué)校。」他在那里做搜索系統(tǒng),后來深入到推薦系統(tǒng),做了十幾年 Infra。

搜推方向的人,通常在大廠日子過得不錯。搜推是幾乎所有互聯(lián)網(wǎng)公司的現(xiàn)金流引擎,這個方向的工程師一直稀缺且昂貴。張穎峰在這個系統(tǒng)里待了很久,然后在 2021 年初加入了矩陣起源——一家做 HTAP 數(shù)據(jù)庫的創(chuàng)業(yè)公司。就是在那里,他認識了金海。

金海的背景和張穎峰互補。他是向量數(shù)據(jù)庫領(lǐng)域的早期建設(shè)者,曾在 Zilliz 負責(zé)數(shù)據(jù)庫研發(fā),主導(dǎo)了 Milvus 1.0 的開發(fā)——「向量數(shù)據(jù)庫」這個概念,某種程度上是從那時候被做起來的。來到矩陣起源之后,他們兩人做的是另一種類型的數(shù)據(jù)庫,HTAP,和向量數(shù)據(jù)庫方向完全不同。

但在矩陣起源的兩年里,他們聊了很多。「基本上探討了做 Infra 的每個可能方向,以及后面該怎么演進。推倒了一切之后,最后找了數(shù)據(jù)庫的方向。」

兩個做后臺出身的人,都比較低調(diào),不喜歡打造個人人設(shè)——更希望大家記住的是產(chǎn)品,而不是創(chuàng)始人是誰。也正因為這種性格,他們在大的戰(zhàn)略決策上往往能迅速達成一致:「我們兩個做 Infra 的背景比較多,很多 Sense 和 Vision 差不多。」

從矩陣出來,他們決定一起創(chuàng)業(yè)。

此時是 2023 年,大模型剛剛開始火。兩個做 Infra 出身的人,頂著「AI 原生數(shù)據(jù)庫」的旗號,拿到了晨暉創(chuàng)投領(lǐng)投、曦域資本跟投的天使輪融資。融資當(dāng)時沒有對外做 PR,除非去查企查查,否則并不知道是哪個投資機構(gòu)投了他們。

公司英文名叫 InfiniFlow。這個名字是 2020 年張穎峰在 GitHub 注冊組織時起的,靈感來自他早就加了微信的袁進輝——一流科技 OneFlow(創(chuàng)業(yè)硅基流動前),「我就叫無限流(InfiniFlow)。」

那時候,他們做的第一個項目叫 Infinity。一個數(shù)據(jù)庫,名字取自 InfiniFlow 里的前半段。

RAGFlow 出現(xiàn)的時候,「Infinity」已經(jīng)用掉了,只剩下「Flow」還懸在那里。

這個偶然,后來變成了整個產(chǎn)品理念的注腳。

「RAGFlow 從打樣變成了主打」

2023 年公司剛成立,張穎峰和金海很快面臨一個現(xiàn)實問題:底層 Infra 離業(yè)務(wù)太遠,看不見,摸不著,連給投資人展示都很難。于是,他們決定給數(shù)據(jù)庫做一個「打樣」——選一個場景,向外界展示這個數(shù)據(jù)庫怎么用。2023 年大模型火的背景下,RAG 是最直接的使用場景。RAGFlow 就這樣誕生了,在公司成立的第一天開始開發(fā)。

2024 年 4 月 1 日,愚人節(jié),RAGFlow 對外開源。流量躥升,比 Infinity 高出幾十倍。

唐小引:RAGFlow 開源之后,你們是怎么做的決定?

張穎峰:對外不再單獨去講這個數(shù)據(jù)庫,而是把 RAGFlow 這個產(chǎn)品作為公司的主打產(chǎn)品。換句話說,RAGFlow 從一個打樣、一個 Demo,最后上升到公司的主打產(chǎn)品。而我們公司原本的主打產(chǎn)品,從定位上來說,會定位成 RAGFlow 的一個組件。

當(dāng)時之所以做出這個決策,來自于兩方面的認知。第一方面的認知是流量,這很顯然。第二方面的原因是,我們在做 RAGFlow 的過程中發(fā)現(xiàn),如果說一個數(shù)據(jù)庫離業(yè)務(wù)有一公里遠,那我們做了 RAGFlow 大概又往前推進了幾百米。但是離最后的一百米,我們可能還沒有做。所以我們認為 RAGFlow 本身其實也是一個 Infra,也是個技術(shù)層或者說中間層的組件。更深的一個體會是,數(shù)據(jù)庫其實是整個 RAG 這一層的一個組件。把數(shù)據(jù)清洗、檢索之后的補齊增強這些工作全部都做了之后,它和數(shù)據(jù)庫加在一起,共同起到的角色才是數(shù)據(jù)庫。

唐小引:當(dāng)時你們做這個決策,是立即達成一致,還是有過爭論?

張穎峰:這種大的決策,其實我們反而覺得很快。因為我們兩個做 Infra 的背景比較多,很多 Sense 和 Vision 差不多。但具體細節(jié)上——比方說我們要推出一個功能,到底要做還是不應(yīng)該做——可能我有我的觀點,他有他的觀點,這些細節(jié)我們會不斷去碰撞。換句話說,一個 Infra 產(chǎn)品,其實是在這些細節(jié)上最終不斷去卷出來的。它一定是在每個細節(jié)把所有短板都補齊之后,才能把腳跟站穩(wěn)。

那個懸著的「Flow」,張穎峰越看越覺得是「偶然中的必然」。

「我們到現(xiàn)在發(fā)現(xiàn)真的是要 Flow 起來。數(shù)據(jù)注入要 Flow——PDF、文件、Memory、Skills 這些數(shù)據(jù)進入系統(tǒng),這個過程要靈活可編排。Retrieval 的過程也要 Flow——不是一來一回就結(jié)束了,要幾百幾千來回,要包含查目錄、補全、補齊意圖。而且要把這個 Flow 暴露給智能體,讓智能體來決定怎么 Flow。所以這個名字還真挺符合未來產(chǎn)品的行為和預(yù)期的。」

「完全是 PPT 融資」

張穎峰曾經(jīng)有過兩次,快要轉(zhuǎn)型了。

第一次是 23 年。從上家公司離開后,他們在市場上找了半年融資,遲遲沒有進展。「我們當(dāng)時已經(jīng)在想,如果遲遲沒有融資,公司可能會去做一些轉(zhuǎn)型。不能做純粹的研發(fā)型公司了,可能得去做項目類的公司,支撐公司至少有一個相對標(biāo)準(zhǔn)的現(xiàn)金流,能夠活下去。」就在即將轉(zhuǎn)型的時候,天使輪的 Offer 來了。

第二次是 24 年。產(chǎn)品迭代很快,開源做得很好,但是沒人投。那時候也在想后面出路是什么、怎么轉(zhuǎn)型。這時候,第二輪的 Offer 也接到了。

唐小引:23 年的融資是怎么談的?

張穎峰:完全是 PPT 融資。因為我們不可能拿一個寫了一些代碼、連做 Demo 都沒辦法做的 Infra 數(shù)據(jù)庫,去給投資人展示它究竟有什么強大的能力,完全展示不了。我們能展示的就是在 GitHub 上提交代碼的時間戳,大概現(xiàn)在有多少規(guī)模了,只能這么去展示。

23 年在國內(nèi)拿到融資的初創(chuàng)企業(yè)以大模型為主。除了大模型之外,在 Infra 層面拿到融資的其實很少。24 年情況更糟糕。整個 24 年,他們一直維持在個位數(shù)的團隊,但同時要支持兩款產(chǎn)品的研發(fā)——一款是最開始公司成立的初衷 Infinity,另一款就是后面從打樣變成主打的 RAGFlow。同時做這兩款產(chǎn)品還要做開源,當(dāng)時人力上非常緊缺。

唐小引:Pre-A 融資,和汪華老師聊,他主要問你們什么?

張穎峰:我們當(dāng)時的開源指標(biāo)非常好,所以汪華老師沒有對我們做太多的 Challenge。他更關(guān)心的是決心問題——到底有沒有決心去出海,出海的決心有多大。因為對于效率類、工具類軟件,出海圈里人大概都知道,最終其實不是一個可選項。他問的核心就是敢不敢肉身出去——把自己放到海外,直接面向海外用戶、海外客戶,去簽訂合同,最終完成整個商業(yè)化的閉環(huán)。

第二輪是創(chuàng)新工場,第三輪是北極光創(chuàng)投。兩輪融資先后腳敲定,選擇披露的時候,索性把這兩個合在一起來披露,對外都叫 Pre-A。北極光給他們 Offer 的時候,RAGFlow 當(dāng)時 Star 大概只有三萬還是四萬,「更多還是看中 RAGFlow 產(chǎn)品在全球開源社區(qū)的生態(tài)位、流量以及技術(shù)壁壘」。

Offer 到了之后,他們把公司架構(gòu)做了調(diào)整,這個調(diào)整需要一些必要的手續(xù),持續(xù)了比較長時間,直到最近才完成交割。

「非常感謝新老股東在我們最需要睡覺的時候能夠把枕頭送過來。能在這種階段支持我們做長期的事情,是需要勇氣的。」

「國內(nèi)企業(yè)是為服務(wù)付費,不是為產(chǎn)品付費」

這個問題,我上一次見張穎峰的時候就很想問。那次他愁眉不展,開口就是商業(yè)化的困局。

唐小引:去年見你,你還很愁商業(yè)化,現(xiàn)在跑得怎么樣了?

張穎峰:國內(nèi)現(xiàn)在應(yīng)該說是啟動一段時間了,整體上還好,因為我們相對來說比較挑客戶。海外的話現(xiàn)在還沒開始,把這兩輪 Close 掉之后,主要還是針對全球化商業(yè)化去做一個布局。本質(zhì)上我們現(xiàn)在還是在做產(chǎn)品以及商業(yè)化從零到一的階段。

從開源去做商業(yè)化這條路線是非常清楚的。但 RAGFlow 開源到現(xiàn)在應(yīng)該是整整兩年,為什么沒有從一開源的時候就去做商業(yè)化呢?本質(zhì)上還是在于人手極度不夠。RAGFlow 本身在過去社區(qū)已經(jīng)跑得足夠快了,但內(nèi)部面臨很多問題。這些問題導(dǎo)致如果直接用它作為一個基座去服務(wù)企業(yè),是會出現(xiàn)問題的。所以得等到把這些問題修得差不多了,才會有信心面向企業(yè)。

大家可能也很容易想到一點——你這么慢,很多過去的流量都錯過了。「這確實是這樣。但我們做這個產(chǎn)品不是去蹭流量的。只要把產(chǎn)品打磨得足夠好,最終一定能被企業(yè)所接納。」

唐小引:做國內(nèi)市場和做海外市場,現(xiàn)在看有什么不同?

張穎峰:核心點在于賬期和周期很長,銷售成本非常高。跟一個客戶簽下來可能不是幾個月這么簡單,可能會拉長到一年甚至更久。投資人喜歡訂閱制,一年一付一直付下去。但國內(nèi)基本上沒幾家企業(yè)愿意每年付費。不是付不起,而是流程不一樣。決定一套采購要做立項審批,有的還要招標(biāo)。這套流程折騰下來,第二年再走一遍肯定不做了。所以通常會選擇買斷。

買斷從商業(yè)角度來說并不是一個特別好的方式。買斷無非也就是幾年,過了幾年怎么續(xù)費呢?后面只能說是維護和升級的費用,這個費用相比正常的一年訂閱費用要低很多。另外,這些相對比較大的企業(yè)通常都會有定制類的需求。國內(nèi)企業(yè)可能愿意為產(chǎn)品付費,不是說沒有,但至少不會很多,它通常是為服務(wù)去付費的。那為服務(wù)付費的話,就會導(dǎo)致我們?nèi)ソ桓度嵤┻@么一個項目,可能就會非常的重。

所以他們做了取舍——在國內(nèi)的策略,還是以渠道、以賦能為主,不大會去建一個很大的銷售網(wǎng)絡(luò)。重點展開整個渠道的建設(shè),扶持更多的渠道商,讓他們能夠在國內(nèi)市場成功。「我們希望的是他們用我們的工具來做好他們的產(chǎn)品。」

「出海是必選項,不是可選項」

張穎峰去年在法國GOSIM第一次當(dāng)面見到了 TiDB 創(chuàng)始人黃東旭。他們的微信其實加了十幾年,「那會兒國內(nèi)做 Infra 的人不多,圈子很小,很容易認識。」但真正坐下來聊,是在巴黎那一次。

唐小引:跟東旭老師請教了什么?

張穎峰:見了面,當(dāng)時主要是向他請教一些在海外的具體做法。像東旭他們,很早就下定了決心,大概在 18、19 年左右下定決心出去,經(jīng)歷了挺長時間。正好那時彈藥儲存也比較多。經(jīng)歷了挺長一段時間之后,現(xiàn)在局面總算完全打開了。我們產(chǎn)品的定位跟 TiDB 多少有些類似,大家都是數(shù)據(jù)類產(chǎn)品,屬于 Data Infra。Data Infra 產(chǎn)品的目標(biāo)用戶一般相對會稍微有些規(guī)模,坐席超過十人之后,對數(shù)據(jù)隱私、合規(guī)這些問題可能都會比較看重。所以做這個方向的創(chuàng)業(yè),必須堅定決心面向海外用戶。

走在他們前面的還有很多其他公司,比如 StarRocks,比如 PingCAP 的 TiDB,包括 Dify——從開源走向商業(yè)化這條路都已經(jīng)證明是可行的,是非常好的一條路線。「因為有這些成功的示范,我們更加堅定從這條路能夠走出來的決心。」

唐小引:現(xiàn)在大家都在著力出海,但也有一種去全球化的趨勢,地緣政治因素越來越復(fù)雜,你怎么看?

張穎峰:我們現(xiàn)在也沒有那么激進。因為這個事情坦率地說誰也不知道會怎么樣。我們能做的就是快速去適應(yīng)這個變化。所以我們現(xiàn)在先往香港放。未來會怎么樣,就跟著市場走。我們不會走得很極端,我們還是按照合法合規(guī)的方式去做。未來如果海外走不下去需要回來,該拆架構(gòu)就要去拆,一切取決于市場。

唐小引:那你的出海計劃,具體路徑是什么?

張穎峰:開源商業(yè)化路徑比較清楚。第一步肯定要有一個正式的 SaaS。雖然現(xiàn)在來說 SaaS 已經(jīng)不性感了,但 SaaS 是一個標(biāo)準(zhǔn)的服務(wù)企業(yè)用戶的途徑。只有 SaaS 推出來之后,才能說這件事情剛剛開始。SaaS 的本質(zhì),某種程度上可以理解為一個大號的 Demo,能讓企業(yè)用戶刷信用卡先用起來。用起來之后,才能真正體會系統(tǒng)跟自己產(chǎn)品之間怎么融合對接。

現(xiàn)在線上服務(wù)一直都有,只是我們一直叫 demo.ragflow.io,一直沒有叫 Cloud。根本原因在于沒有去收費。沒有收費就意味著告訴用戶還沒準(zhǔn)備好。沒準(zhǔn)備好,企業(yè)就不會認真評估這個產(chǎn)品。從正式收費那天開始,才是正式告訴企業(yè):我們差不多可以了,可以來體驗。

SaaS 之后,配套的商業(yè)化 GTM 團隊就要同步展開——做開發(fā)者關(guān)系,做社區(qū),把更多面向開發(fā)者的流量,逐漸轉(zhuǎn)化到 B 端。當(dāng)這些角色走到一定程度之后,就是真正要肉身出去了,跟一些稍微大一些的企業(yè)、腰部企業(yè),去做專門的部署,比如私有化,或者 BYOC。

唐小引:海外重點布局哪里?

張穎峰:是由數(shù)據(jù)來告訴我,在哪個地方局面先打開,就在哪個地方先來做。現(xiàn)在數(shù)據(jù)包括日韓、東南亞、歐洲、北美都有。對于北美來說,它是個重要的區(qū)域,但是不是商業(yè)化的重點區(qū)域,現(xiàn)在不知道。得等 SaaS 出來之后,看哪些區(qū)域收入相對比較高。

「Retrieval 是永恒的」

這是張穎峰講到技術(shù)時說得最多、也最篤定的一句話。

唐小引:拋開浮華和輿論的喧囂,現(xiàn)在 RAG 賽道的真實現(xiàn)狀是什么?

張穎峰:RAG 現(xiàn)在不能叫一個純賽道了。RAG 其實現(xiàn)在越來越會變成一個技術(shù),它已經(jīng)不是產(chǎn)品了,是個技術(shù)。到底是這個技術(shù)用在 Memory、知識庫、智能體,還是用在什么底座,都是有可能的。在智能體生態(tài)當(dāng)中,現(xiàn)在的 RAG 產(chǎn)品會怎么演進,我覺得可能是兩個方向。一類是把自己盡可能變得去接管上下文,更加去配合智能體對 Retrieval 的需求——這條路線相對來說會更加的重,因為它的目的是為了把數(shù)據(jù)編排、注入流程、檢索流程都要做到足夠的可定制、透明和參數(shù)化,讓智能體容易使用。另外一條路線可能就會變得更加簡單,就是樸素 RAG——每個公司自己拿 AI 寫代碼,很快就能擼出這么一個小的 RAG 框架,這不是什么難事兒。

唐小引:你怎么看 RAG 和 Agent 的關(guān)系?長期是融合還是各自獨立發(fā)展?

張穎峰:這個觀點我們從公司一開始成立到現(xiàn)在都沒變過。我們一直認為 RAG 就是數(shù)據(jù)庫,Agent 就是應(yīng)用。沒有 RAG,整個智能體回答不會好。但 RAG 這個詞,在現(xiàn)在環(huán)境里大家普遍比較關(guān)注表面的東西,可能這個詞聽起來不夠性感。做任何框架的都會說這個過時了。說 RAG 已經(jīng)過時,差不多從 23 年就一直有。但從最終角度來看,它并沒有發(fā)生什么變化。

他喜歡用圖書館打比方。「你問我個問題,我如果記住了,我就直接回答,這就是模型。我要記得不那么清楚,那我就去圖書館搜一下查一下。所以 RAG 其實就是圖書館事先建好的那些索引。那這個索引到底是什么?向量索引、全文索引、目錄,還是樹導(dǎo)航結(jié)構(gòu),這都不重要。一切都是為了保證檢索快速有效的手段,什么有效就用什么。」

唐小引:現(xiàn)在有一種觀點——只要有足夠長的上下文窗口,加上組織良好的 Markdown 文件,就不需要 RAG 了。這個邏輯通嗎?比如 Karpathy 做的 LLM Wiki。

張穎峰:某種程度上可以這么講。但這就好比我問一個人,他記憶是不是足夠好。他記憶可能是挺好的,但是他能把所有事情都記下來嗎?上下文窗口它畢竟不是無限的,即使真做到無限那也是假無限。因為它一定是以遺忘某些上下文為前提,才能導(dǎo)致這么一個假的無限的結(jié)果。所以真實的上下文窗口一定是有限的。在這個上下文窗口里面,我們所要做的事情就是把能夠注意的事情塞到窗口里面去,把不愿意注意的事情盡快過濾。

Karpathy 那種做法,我覺得應(yīng)該叫筆記。比方說桌上有那么一兩本書,這一兩本書大概以前都掃過一遍,有個筆記記下來了,接下來問,根據(jù)筆記快速定位到那兒,大概就可以了。這種屬于數(shù)據(jù)量不是那么大。但如果數(shù)據(jù)量還挺多的,那可能還要去根據(jù)索引去找一下。所以 Retrieval 不是一個簡單的來回,不是說我去搜了返回了,交給大模型結(jié)束了。RAGFlow 也正在把這類做法,連同其他知識增強手段一起打包到一個統(tǒng)一的知識編譯層,統(tǒng)一服務(wù) Agent 對上下文的需求,后續(xù)版本就會推出。

講到這里,他話鋒一轉(zhuǎn),說了我認為整個采訪里信息密度最高的一段話。

張穎峰:現(xiàn)在有一件非常重要的事情正在發(fā)生:RAG 的用戶,正在從人轉(zhuǎn)向智能體。

這個轉(zhuǎn)變,意味著一切都在變。

人問的問題很短、很模糊,沒有人會問很長的問題,就問幾個字。但智能體不一樣,智能體問的問題都是非常長的——因為問題是智能體經(jīng)過模型做出來的 Prompt 給到的。這是第一點。

第二點,人用 RAG 可能查個十次了不起了。但智能體不一樣,請求的次數(shù)可能是人的超過一兩個數(shù)量級——搜索次數(shù)可能是一百次、一千次。搜索的頻率和行為都有很大不同。

用戶變了,產(chǎn)品的姿勢也要變:要把整個 Retrieval 能力全部暴露出來,讓智能體來決定怎么調(diào)用。「我到底是應(yīng)該以什么樣的方式來做檢索?是查到的結(jié)果馬上就回答,還是覺得不太可信再去補一補?還是查到結(jié)果再去做聯(lián)想,在圖譜里面遨游一番找到其他相關(guān)結(jié)論?這些選擇、這些開關(guān)全部都應(yīng)該暴露出來,讓智能體來操心。」

這就是從「RAG 引擎」到「上下文引擎」的本質(zhì)。

這也意味著,Retrieval 正處于一個變革前夜。當(dāng)用戶從人轉(zhuǎn)向智能體,新的技術(shù)挑戰(zhàn)隨之而來:全文索引如何處理智能體發(fā)出的超長查詢而不至于結(jié)果過噪?底層系統(tǒng)如何支撐從每次十次變成每次一千次的檢索頻率?這些問題,還沒有標(biāo)準(zhǔn)答案。

唐小引:那有什么是你認為的反共識,但你很篤定堅持的?

張穎峰:反共識比方說 RAG 會一直持續(xù)下去。不管是國內(nèi)媒體還是全球媒體,我最近發(fā)現(xiàn)一個很有意思的現(xiàn)象,明明是自己在做 Retrieval,特別是面向 Agentic Retrieval 的一些產(chǎn)品,他們自己也在宣稱 RAG Dead 等等。這個其實更多是從營銷角度去講的。說明 RAG 這個事兒從流量角度來說確實是在下降的,但從內(nèi)核角度來說它又是不變的。所以我說的從來都是內(nèi)核。

作為產(chǎn)品形態(tài)的 RAG 可能不會長久,因為 RAG 本身其實是一種簡單的智能體。但是 Retrieval 這件事情它是永恒的。如果說智能體需要一個數(shù)據(jù)底座,那么這個底座一定也只能是以 RAG Retrieval 這種技術(shù)為中心構(gòu)建的底座,也只能是以 RAG 為中心的技術(shù)去構(gòu)建。

「Agent 到底做不做」

唐小引:你們從 RAG 引擎到上下文引擎,這個演進背后是怎么想的?

張穎峰:去年我們當(dāng)時就已經(jīng)判定,可能我們剛剛做出來不多久的這套 Agent,場景會逐漸受限。所以一方面在繼續(xù)維護功能,但另一方面其實已經(jīng)在思考,接下來的布局可能要有所調(diào)整。所以我們在去年第四季度剛開始的時候,就提出了「Context Engine」的口號。當(dāng)然只是提口號,限于人力也沒有實質(zhì)性舉措。但提出口號后,沒想到過了三個月 LangChain 就火成這個樣子了,到現(xiàn)在 Claude 也火成這個樣子了。這一切都驗證了我們當(dāng)時的判定是對的,智能體真的已經(jīng)在席卷整個軟件行業(yè)了。

唐小引:那 Agent Harness 這件事,做還是不做?

張穎峰:天下智能體的江湖有十分,五分可能在龍蝦、Hermes,剩下一兩分大概有 LangChain,現(xiàn)在 Claude Code 作為 Agent 也逐漸成為主流。這么多智能體,我們可能不一定能夠作為一個流量的入口去抓住 Agent Harness 這件事情。所以我們還是要把握住自己擅長的不變的事情,就是變成所謂的 Context Engine——但它的核心跟我們過去做的 RAG 沒有本質(zhì)的區(qū)別。雖然我們口號一直在變,先是 AI 原生數(shù)據(jù)庫,后面是 RAG 引擎,到現(xiàn)在是上下文引擎。但是這件事情本身其實沒有什么變化,它只是為了應(yīng)對多變的 AI 生態(tài)做出的調(diào)整。

唐小引:你和金海在這一點上有分歧嗎?

張穎峰:會有一些分歧,因為都會有好處。比方說股東也會覺得你們要占領(lǐng)流量入口。但另外一方面,流量入口有了固然好,但不是想占就一定能占的。像 LangChain,還有現(xiàn)在的 Claude,這些項目的火其實都是偶然現(xiàn)象。如果我們轉(zhuǎn)型把自己定位成做 Agent 框架的公司,其實很難說競爭優(yōu)勢到底是什么。因為我們的錨點永遠都是在底層的 Retrieval,做搜索這塊一直是我們的錨點。如果我們過分追逐熱點,很難說優(yōu)勢體現(xiàn)在什么地方。如果真做了一個 Demo 一夜爆紅,那是另外一種情況,但這種情況只是黑天鵝,不能構(gòu)成我們形成決策的主要原因。

關(guān)于 MCP,他的觀點已經(jīng)變了。「之前認為 MCP 很好,它就像 TCP/IP 協(xié)議一樣,大家所有的工具調(diào)用都用 MCP 包裝好。」但現(xiàn)在他不這么認為了——「因為大模型已經(jīng)被訓(xùn)練成對寫代碼特別的友好。所有的智能體都是 Coding Agent,對所有工具的調(diào)用都會是以寫代碼的方式去調(diào)用。所以這個工具到底是 MCP 還是普通的 API,都可以。MCP 確實不那么重要。但你說它完全不需要,那倒也不是。反正都已經(jīng)包成了 API 了,那就放在那兒去用就可以了。」

「RAGFlow 年中發(fā)布 1.0,把 Python 換成 Go」

唐小引:今年年中要發(fā) RAGFlow 1.0,1.0 會帶來什么?

張穎峰:1.0 首先代表的是穩(wěn)定性。來自社區(qū)的槽點也蠻多的,更新頻繁,開發(fā)人員有限,有很多情況顧此失彼。但到 1.0 狀態(tài)就代表產(chǎn)品形態(tài)基本定型了,穩(wěn)定了,生產(chǎn)可用了。

我們現(xiàn)在還在做一件事情,把在線 Retrieval 這部分正在從 Python 全部切換到 Go 語言。切換原因是性能。Infinity 性能非常好,但加了 RAGFlow 性能優(yōu)勢發(fā)揮不出來,都是拜 Python 所賜。RAG 的用戶正從人走向智能體,發(fā)給 RAGFlow 的請求會幾個數(shù)量級往上漲,我們不能再讓 Python 成為系統(tǒng)瓶頸。所以會在合適階段把 Online 這部分全部切換到 Go 語言實現(xiàn)。Offline 這部分,數(shù)據(jù)怎么編排注入,不會改,因為對 Python 生態(tài)更友好。

1.0 就是讓性能大幅提升,產(chǎn)品穩(wěn)定性和形態(tài)處于穩(wěn)定狀態(tài)。大家就可以放心用了,感謝社區(qū)用戶陪我們跑了兩年才有個 1.0。

唐小引:我看 RAGFlow 的 PR 現(xiàn)在有一百多個 Open,一個月前是五十多個,漲得很快。社區(qū)貢獻者越來越多是好事,但也帶來了問題?

張穎峰:現(xiàn)在比較苦惱的點,就是每天都會有用戶到社區(qū)領(lǐng) Issue,領(lǐng)完就讓 Cursor 幫他們生成代碼提交,但他們基本上都沒有測過。這大大增加了維護成本。這就是現(xiàn)在沒有合并的 PR 一百多個的原因。

我感覺這也沒有什么特別好的辦法。我們自己雖然也用 AI 寫代碼,但我們會有人為這個 PR 兜底。但是社區(qū)大大降低了提 PR 門檻之后,沒有人為這個 PR 兜底,就只能我們來兜。人手就有點捉襟見肘。所以我們現(xiàn)在主要是選擇性 Review:如果提的 Feature 比較重要,我們會重點看;不是那么重要的,就先往后放了。有了 AI Coding 之后,人的價值其實就是為這些事情兜底,只有人才能兜底。

「Infinity 論文剛被 VLDB 錄用,24 年的工作,26 年還是 SOTA」

Infinity 數(shù)據(jù)庫現(xiàn)在,他們只是維持一個最低規(guī)模的團隊,基本上停止所有新 Feature 的研發(fā),主要是來不停地測試。但張穎峰說,「即使站在現(xiàn)在來看,Infinity 的特性在整個行業(yè)也是非常領(lǐng)先的。我相信在后面還有很多比較新的特性要去做。這個事情是要跟隨著 Retrieval、跟隨著信息檢索的演進去同步迭代的。」

唐小引:兩年前的工作,現(xiàn)在依然很領(lǐng)先,為什么?

張穎峰:其實很簡單,對于 RAG 所需要的數(shù)據(jù)庫應(yīng)該具備什么能力,我們很早就有很清晰的認知:本質(zhì)上它就是個索引數(shù)據(jù)庫,需要具備各種各樣的索引,需要能夠允許用戶任意組合這些索引。因為每種索引都有自己的長短處,多種索引組合在一起。所以 Infinity 本質(zhì)上就是一個索引數(shù)據(jù)庫。Infinity 本身的特性在 24 年其實就已經(jīng)足夠先進了。最近我們剛跟浙大合作的論文就是 Infinity,剛剛被 VLDB 錄用。像 24 年的工作在 26 年還能被錄用,說明它現(xiàn)在仍然是 SOTA 的。我們所做的唯一的事情就是讓它穩(wěn)定。

他們今年年中的目標(biāo),是希望能夠把 Infinity 作為 RAGFlow 的正式默認選項。現(xiàn)在默認是 Elasticsearch,Infinity 一直沒有作為正式選項,是因為一直沒有足夠的信心。他們現(xiàn)在主要是在測試,也把在線的一些平臺數(shù)據(jù)做了雙寫——同時寫到 ES 和 Infinity 里面去,目的就是為了發(fā)現(xiàn)更多的缺陷。

「RAGFlow 和 Infinity 雙劍合璧的那天,我們希望是在今年的年中。合并的那天之后,這個事情才真正閉環(huán)了。」

「老登」來創(chuàng)業(yè)的得與失

從業(yè)二十多年,這是張穎峰第一次真正意義上的創(chuàng)業(yè)。

唐小引:走現(xiàn)代創(chuàng)業(yè)流程,是第一次?

張穎峰:對。最早那次創(chuàng)業(yè)是二十多年前,當(dāng)時都沒有風(fēng)險融資這個事兒,不能完整叫創(chuàng)業(yè)。所以這次是正兒八經(jīng)自己走完一個標(biāo)準(zhǔn)的創(chuàng)業(yè)流程,自己說了算,自己主導(dǎo)融資,組建公司,這是第一次。其他幾次更多是加入別人的團隊。

唐小引:見 VC 的時候,有沒有遇到因為年齡被打擊的情況?

張穎峰:實際上這個事情確實挺敏感的。我自己融資也不會去說年齡,因為這肯定不是個優(yōu)勢。跟我年齡相差不大的同學(xué),其實已經(jīng)很少在一線做這些事情了。從我的角度講,年齡對這個事有優(yōu)勢也有劣勢。優(yōu)勢在于對事情的觀察會更加長久。就像前面講的,我跟金海討論做不做產(chǎn)品 Feature,是討論推導(dǎo)得出來的,不是腦袋一拍激情行動。我們是通過長時間積累推導(dǎo)出來的,把各個可能的組合排列盡可能的列全之后,找到每個可能的強項和弱項,我們才去動手。

唐小引:那劣勢呢?

張穎峰:老登明顯讓人感覺不太愿意跟上最新形勢,不光是生理,更多是心理認知,會導(dǎo)致距離快速迭代的生態(tài)漸行漸遠。作為創(chuàng)始人絕對要避免這種情況。如果我來投資,我也不會特別關(guān)注跟我年齡差不多的人的創(chuàng)業(yè)。因為跟我年齡差不多的人,選擇創(chuàng)業(yè)深入一線的已經(jīng)很少了。

過于年輕也有不擅長的點,在于過分關(guān)注可變的事情。如果總是追逐可變的事情,沒追上怎么辦?什么是不變的點,什么是錨點,這個很難把握。年輕人做事相對不太愿意沉浸性投入,過段時間興趣就轉(zhuǎn)移了,不會長時間投入一件事情。這就是為什么做 Infra 的人,年輕人有,但數(shù)量肯定比中登老登少很多。

唐小引:創(chuàng)業(yè)至今,有什么 Bitter Lessons 嗎?

張穎峰:教訓(xùn)其實也沒什么。現(xiàn)在一個標(biāo)準(zhǔn)創(chuàng)業(yè)流程,就是想到事情付諸實施,拿到融資,把公司搭起來。所幸在這個流程當(dāng)中,雖然經(jīng)歷過困難時期,但整體還算幸運。在 23 年、24 年全行業(yè)低谷時,我們都拿到了 Offer,能讓公司按預(yù)期往前走,已經(jīng)非常幸運了。什么時候有資格來說這個事兒?在商業(yè)化做出顯著成果的時候,我們可能才會有資格來說到底受了什么教訓(xùn)。

唐小引:那創(chuàng)業(yè)這件事,對你來說是痛苦多,還是享受多?

張穎峰:創(chuàng)業(yè)者角度來說,其實是比較享受這個過程的。艱苦是艱苦,但其實是享受創(chuàng)業(yè)這個事兒。如果覺得很痛苦,或者痛苦大于其他選擇,那就不要做這事兒了。因為創(chuàng)業(yè),特別是像我們做這個方向,不可能像做 Agent 賽道或者上層 C 端賽道,流量一下就起來能變現(xiàn)了。我們這個變現(xiàn)確實需要挺長時間的積淀才能完成,天然周期較長。如果不能享受這個過程,還是不要做。

認識張穎峰至今,每次見面,我總感覺他的頭發(fā)又白了些。他對這個觀察毫不在意,還反問我:「你看我頭發(fā)又白了幾根是吧?」

他不太在意很多事。最近有投資人來找,他連 PPT 都沒有,「就是對著屏幕空講,就像咱們現(xiàn)在聊天一樣」。袁進輝老師白發(fā)比他多,貼紙做得粗糙也沒關(guān)系,下個版本會改。

問他工作之外有什么愛好,他想了一下說:「中年男人沒什么愛好,就是工作。家里孩子也比較大了,也就趁著這個時間,按照自己喜歡的事情去做。」

表面上看比較好說話。但在某些核心準(zhǔn)則上,很固執(zhí)。

「我習(xí)慣在某些核心準(zhǔn)則上一定要達到預(yù)期。如果跟預(yù)期不一樣,就會覺得很不爽很不舒服。」

這大概是他和金海走到一起創(chuàng)業(yè)的原因——兩個都有很強烈的「自己說了算」的意圖。也大概是他在「RAG 已死」的喧囂里,能夠保持定力的原因。

InfiniFlow。Infinity 被用掉了,剩下一個 Flow。

張穎峰說,這是「偶然中的必然」。

Retrieval 已經(jīng)存在了三四十年,它正處于變革前夜——用戶在變,行為在變,技術(shù)需要隨之創(chuàng)新。但它本身,不會消失。張穎峰相信,它還會一直存在下去。

那個 Flow,還沒有到終點。

免費領(lǐng)取 100 小時 AI 算力|CSDN 讀者福利

加入 AI 開發(fā)者計劃獲取:

? AI 算力資源

? 官方技術(shù)社群

? Workshop 與 AI Academy

? 開發(fā)者專屬福利

立即掃碼,前 50 名額外領(lǐng)取「瑞幸咖啡」

咖啡領(lǐng)取鏈接: https://s.csdn.cn/4nPsOp

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
離譜!量子力學(xué)創(chuàng)始人、諾獎得主普朗克兩篇論文被撤稿

離譜!量子力學(xué)創(chuàng)始人、諾獎得主普朗克兩篇論文被撤稿

新浪財經(jīng)
2026-06-30 21:17:43
世界杯7位主帥下課!科曼創(chuàng)恥辱,德國少帥不辭職 等1400萬解約金

世界杯7位主帥下課!科曼創(chuàng)恥辱,德國少帥不辭職 等1400萬解約金

小火箭愛體育
2026-07-01 16:46:27
連跌三輪!今晚油價大幅降價!95汽油跌回7元區(qū)間,加滿省幾十!

連跌三輪!今晚油價大幅降價!95汽油跌回7元區(qū)間,加滿省幾十!

趣味萌寵的日常
2026-07-02 00:42:58
200%!這類芯片暴漲!

200%!這類芯片暴漲!

感知芯視界
2026-06-30 23:00:02
別笑梅威瑟破產(chǎn),他的死局,90%的有錢人都逃不掉!

別笑梅威瑟破產(chǎn),他的死局,90%的有錢人都逃不掉!

格斗時代
2026-06-30 20:34:39
敢動俄羅斯?這就是下場,普京說到做到,炸得烏克蘭能源濃煙滾滾

敢動俄羅斯?這就是下場,普京說到做到,炸得烏克蘭能源濃煙滾滾

音樂時光的娛樂
2026-07-01 16:00:06
河北懷孕女子相親外賣員開價18.8萬:以后很難懷孕,這孩子必須生

河北懷孕女子相親外賣員開價18.8萬:以后很難懷孕,這孩子必須生

搗蛋窩
2026-06-22 07:36:30
女子大鬧奶茶店后續(xù):人被拘留,學(xué)校停了她的課,正臉曝光已社死

女子大鬧奶茶店后續(xù):人被拘留,學(xué)校停了她的課,正臉曝光已社死

江山揮筆
2026-05-26 09:32:15
馬斯克和范冰冰什么關(guān)系?偷稅8億的范冰冰,如今在國外重回巔峰

馬斯克和范冰冰什么關(guān)系?偷稅8億的范冰冰,如今在國外重回巔峰

追風(fēng)小狗
2024-11-12 21:52:56
入夏后,少買黃瓜茄子,多吃8種“堿性菜”,鮮嫩營養(yǎng),應(yīng)季而食

入夏后,少買黃瓜茄子,多吃8種“堿性菜”,鮮嫩營養(yǎng),應(yīng)季而食

美食店主
2026-06-30 08:19:55
女人最容易出軌的4個地方:不是渣,是渴得慌

女人最容易出軌的4個地方:不是渣,是渴得慌

藝鑒在線
2026-07-01 18:42:41
因為印度,蘋果最不愿被人看到的文件,現(xiàn)在全世界都能下載了

因為印度,蘋果最不愿被人看到的文件,現(xiàn)在全世界都能下載了

叮當(dāng)當(dāng)科技
2026-07-01 08:01:17
謝霆鋒王菲甜蜜牽手離開西安,56歲王菲穿粉紫色上衣好有少女感!

謝霆鋒王菲甜蜜牽手離開西安,56歲王菲穿粉紫色上衣好有少女感!

娛樂團長
2026-06-29 17:45:37
70歲知名演員米雪自曝患“過度活躍癥”:從不午休 精力旺盛

70歲知名演員米雪自曝患“過度活躍癥”:從不午休 精力旺盛

大象新聞
2026-05-19 16:58:25
人有沒有血栓,散步就知道?體內(nèi)有血栓的人,散步常有這4個表現(xiàn)

人有沒有血栓,散步就知道?體內(nèi)有血栓的人,散步常有這4個表現(xiàn)

芹姐說生活
2026-05-27 15:02:55
小米辟謠號正式上線,首條案例是友商暗諷大米汽車被判賠40萬!網(wǎng)友:王騰的微博到底是水刪的?

小米辟謠號正式上線,首條案例是友商暗諷大米汽車被判賠40萬!網(wǎng)友:王騰的微博到底是水刪的?

大白聊IT
2026-07-01 14:23:58
張常寧現(xiàn)狀:和CBA名將丈夫分居,在江蘇當(dāng)教練,已是北體大博士

張常寧現(xiàn)狀:和CBA名將丈夫分居,在江蘇當(dāng)教練,已是北體大博士

翰飛觀事
2026-06-30 22:07:13
自由市場冷清,但NBA續(xù)約季暗流涌動

自由市場冷清,但NBA續(xù)約季暗流涌動

熱血體育社
2026-07-02 01:25:40
手指開裂不只是小毛病,可能是這些習(xí)慣在“毀”你的手,快改!

手指開裂不只是小毛病,可能是這些習(xí)慣在“毀”你的手,快改!

上海圈
2026-06-24 20:35:07
CBA官宣:今年69人符合選秀資格 狀元大熱石奎未報名寶島5人參選

CBA官宣:今年69人符合選秀資格 狀元大熱石奎未報名寶島5人參選

醉臥浮生
2026-07-01 17:52:13
2026-07-02 02:00:49
AI科技大本營 incentive-icons
AI科技大本營
連接AI技術(shù)的創(chuàng)造者和使用者
2737文章數(shù) 7711關(guān)注度
往期回顧 全部

科技要聞

Claude Code被曝“植入木馬”識別中國用戶

頭條要聞

許家印英國豪宅被指遭流浪漢“霸占” 真相披露

頭條要聞

許家印英國豪宅被指遭流浪漢“霸占” 真相披露

體育要聞

賣球衣救子的門將,把德國撲出了世界杯

娛樂要聞

77歲牛群公證裸捐全部財產(chǎn),清貧獨居堅持月捐

財經(jīng)要聞

新氧貸款:宣傳年化15%,實際頂格24%

汽車要聞

同比暴漲188.4% 方程豹6月熱銷35607臺

態(tài)度原創(chuàng)

房產(chǎn)
教育
家居
數(shù)碼
公開課

房產(chǎn)要聞

洞察新局 | 2026年天河置業(yè)紅盤圖鑒

教育要聞

高考落幕,征途未止!高中為畢業(yè)生開設(shè)大學(xué)先修課

家居要聞

傳奇筑 日常詩

數(shù)碼要聞

華碩a豆高速固態(tài)U盤上架:280-959元

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版