无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

RAGFlow v0.25.0:全新發布,覆蓋解析管道、數據源、Agent、語言界面、模型支持與安全修復的全面升級

0
分享至




RAGFlow v0.25.0 于 2026年4月21日發布,這是一次覆蓋范圍非常廣的版本更新,幾乎橫跨了從文檔接入、解析、同步、Agent 能力、界面國際化、模型生態、移動端適配、存儲與數據庫升級,到安全修復、CLI、Go 服務、API 重構等多個核心方向。對于已經在使用 RAGFlow 的團隊來說,這個版本不僅帶來了能力增強,也帶來了大量穩定性優化、兼容性升級和安全加固。

一、Ingestion Pipeline:解析管道全面增強,模板更豐富,解析能力更強

本次版本在 Ingestion Pipeline 方向的變化非常顯著。最核心的更新之一,就是新增了 7 個內置 pipeline 模板,并且這些模板與 RAGFlow 原生文檔解析器保持一致。相比之前單一或通用化的處理方式,這次新增模板明顯提升了可配置性和落地效率。

同時,官方也明確提到:多個新模板帶來了顯著的解析改進。這意味著在實際使用過程中,文檔進入知識庫前的結構識別、內容切分、格式保持等能力都將得到增強。

除此之外,本次版本還對 ingestion pipeline UI 做了更新,并且加入了preprocess 預處理能力。官方后續還進一步補充了pipeline add preprocessadd preprocess parameters for ingestion pipeline等更新,說明預處理并不是簡單的 UI 微調,而是已經進入了可配置、可擴展的管道能力中。

本版本還包括以下 pipeline 相關改進:

  • ? pipeline 支持 preprocess 參數

  • ? pipeline 支持 ONE chunking method

  • ? pipeline parser 文檔支持補充

  • ? pipeline support doc for parser in word

  • ? pipeline 支持關閉 VLM parsing 的按鈕

  • ? pipeline 中增加音視頻支持修復

  • ? pipeline 中 markdown parser 修復

  • ? pipeline canvas category 修復

  • ? pipeline template 更新

  • ? pipeline parser log 顯示修復

  • ? pipeline page 樣式優化

  • ? Refact pipeline

  • ? Refact update pipeline template

這些更新說明,RAGFlow 在 ingestion 層已經不只是“能導入”,而是在向“可控、可定制、可調優”的方向繼續推進。

二、Data Sources:新增多種數據源,支持刪除同步,連接器能力更完整

RAGFlow v0.25.0 在數據源能力上擴展非常明顯。官方新增的數據源包括:

  • ? Seafile

  • ? RSS

  • ? DingTalk AI Sheet

其中,Seafile 還新增了庫和目錄同步范圍支持,RSS 也正式進入數據源支持范圍,DingTalk AI Sheet 則進一步拓展了企業常見協作數據的接入場景。

除了新增數據源,這一版本還加入了一個非常實用的能力:支持從數據源同步文件刪除。
這意味著數據源側的刪除動作不再被忽略,知識庫內容可以更準確地與源端保持一致。

圍繞數據源與同步,更新還包括:

  • ? 支持 Google Drive 優化

  • ? 支持 Jira 增量更新遺漏問題修復

  • ? 支持 MySQL/PostgreSQL 增量同步字段暴露

  • ? 支持 Seafile 庫與目錄同步范圍

  • ? 支持數據源更新后重新切塊

  • ? 支持數據源同步刪除文件

  • ? 支持 WebDAVConnector 注冊

  • ? 支持文件類型校驗

  • ? 支持文件夾上傳

  • ? 支持文件相關功能補齊

  • ? 支持 file ancestor directory lookup

  • ? 支持 file list API 重構

  • ? 支持 list files 修復

在同步場景下,這些能力意味著 RAGFlow 對企業知識來源的覆蓋正在進一步擴張,尤其是針對協作平臺、網盤、表格和持續同步場景,實用性很強。

三、DOCX 與其他解析能力:更省內存、更穩定、更適合大文檔

v0.25.0 對文檔解析內部實現也做了明顯優化,尤其是 DOCX 解析策略。

官方明確提到:DOCX parsing strategy with lazy-load support for images,減少內存消耗。
后續提交記錄中也有多處相關 refactor,包括:

  • ? lazy-load DOCX images to reduce peak memory without changing output

  • ? unified lazy image loading for Docx parsers

  • ? excel use lazy image loader

  • ? refactor word parser lazy image loader

這說明圖片懶加載已經成為文檔解析體系的重要方向。對大文檔、包含大量圖片的 Word/Excel 文件來說,這種改動通常意味著更低的峰值內存、更平穩的處理過程,以及更少的加載壓力。

此外,本版本還修復和增強了大量解析相關問題:

  • ? PDF 絕對頁索引混淆問題修復

  • ? garbled PDF text 自動 fallback 到 OCR

  • ? MinerU 的坐標上下顛倒修復

  • ? Paddle OCR 缺失輪廓修復

  • ? PDF chunking 參數名修正

  • ? markdown table double extraction 修復

  • ? html heading mapping 修正

  • ? image PDF in ingestion pipeline 修復

  • ? epub parsing 支持

  • ? Docling parser return type hint 修復

  • ? external Docling server via DOCLING_SERVER_URL 支持

  • ? respect chunk_token_num for MinerU/docling/paddleocr parsers

  • ? fixed parsing status recovery after transient errors

  • ? document parsing status check logic 修正

整體來看,v0.25.0 的文檔解析更偏向“生產環境可用性強化”,尤其是在異常恢復、OCR 回退、圖片處理、內存控制和不同解析器協同方面。

四、Agent:發布能力上線,沙箱執行、圖表生成、數據分析模板與記憶系統增強

Agent 是這次版本最值得關注的模塊之一。

1. Agent 發布能力正式引入

官方明確新增了:agent publishing capability
這意味著 Agent 不再只是內部配置或調試產物,而是可以進入更完整的發布流轉。

對應的更新還包括:

  • ? published agent version control

  • ? agent 版本歷史展示發布狀態

  • ? agent application can not show Cite 修復

  • ? agent 不能發布的問題修復

  • ? agent embedded page 與移動端兼容

  • ? agent embedded page 不再跳轉登錄頁問題修復

  • ? agent 模板標題中文模式顯示問題修復

  • ? agent form sheet 被 log sheet 遮擋問題修復

  • ? agent exploration 頁面空對話框報錯修復

  • ? agent page 樣式優化

  • ? agent log 導出

  • ? agent log time 可選問題修復

  • ? agent log 增加 user_id

  • ? agent application embedded page 支持隱藏下載按鈕

2. 沙箱執行與圖表生成

版本中明確寫到:Sandboxed code execution and chart generation
同時安全層面也有重要升級:

  • ? Adopt Jinja2 SandboxedEnvironment for template rendering

  • ? fix security vulnerability using SandboxedEnvironment

  • ? sandbox cannot accept large args list 修復

  • ? sandbox import error 修復

  • ? sandbox attachment metadata 問題修復

  • ? sandbox do not attach attachment metadata 修復

  • ? sandbox 中中文轉英文翻譯處理

這說明 Agent 的代碼執行與模板渲染在安全性上被進一步加固。

3. 新模板:Data Analysis Agent

官方新增了一個非常重要的模板:Data Analysis Agent
結合 sandbox、chart generation、code execution,可以看出這個模板不是簡單的聊天模板,而是面向數據分析任務的完整 Agent 能力組合。

4. 記憶系統增強

版本說明中提到:Memory: ddded user-level memory storage and retrieval.
后續更新又補充了:

  • ? record user_id in memory

  • ? OceanBase memory get_aggregation

  • ? OceanBase memory get_highlight

這表明 RAGFlow 在記憶層面已經開始更加細粒度地支持用戶級存儲與檢索,同時也對不同存儲后端的能力進行適配。

五、語言與界面:新增阿拉伯語、保加利亞語、土耳其語,支持 RTL

v0.25.0 的國際化和 UI 方向也非常強。

新增語言支持包括:

  • ? Arabic

  • ? Bulgarian

  • ? Turkish

同時,官方明確寫到:UI now supports Right-to-Left (RTL) layout
這對于阿拉伯語等從右向左閱讀的語言尤為關鍵,說明 RAGFlow 在真正走向多語言全球化界面支持。

對應的更新還包括:

  • ? enable Arabic in production UI

  • ? complete Arabic documentation

  • ? Add Bulgarian language support

  • ? add Turkish language support

  • ? complete Turkish localization

  • ? Turkish README translation

  • ? remove duplicate “arabic” key in French translations

  • ? on-demand import of i18n language pack

  • ? language configuration moved to web/.env

  • ? standard language codes and time zones unified

  • ? replace hardcoded English strings with i18n in floating chat widget

  • ? embedded dialog text translation

  • ? global navigation bar style adjustment

  • ? chat page style optimization

  • ? dataset page styles adjustment

  • ? knowledge graph、chunk、metadata、agent log styles update

可以看出,這次升級不只是增加語言包,而是從布局、組件、配置方式到文案國際化都進行了較為系統的整理。

六、模型與 Provider:支持更多模型生態,模型提供商持續擴展

RAGFlow v0.25.0 在模型層面的擴展也非常值得關注。官方這次新增了多種模型與 Provider 支持,說明系統正在進一步向“多模型、可插拔、跨生態”的方向演進。

本次更新中比較明確的新增包括:

  • ? support Anthropic Claude models

  • ? support ZhipuAI

  • ? support Mistral

  • ? support yandex models

  • ? support Jina embeddings

  • ? support Qwen3 series models

  • ? support GPT-4o-mini

  • ? support GPT-4.1

  • ? support DeepSeek OCR model

  • ? support nv-embed models

  • ? support more embedding/rerank/LLM options

從實際意義來看,這類更新有三個層面的價值:

1. 模型選擇更靈活

不再局限于單一廠商或少數幾類模型,用戶可以根據任務類型、成本、語言能力、推理速度和部署環境靈活選擇。

2. 生態兼容性更強

新增 Anthropic、ZhipuAI、Mistral、Yandex 等支持,意味著 RAGFlow 對國際與本土模型生態的適配能力更成熟。

3. 檢索鏈路能力更完整

Jina embeddings、nv-embed 等能力的加入,會直接影響向量化、召回效果和檢索質量,對 RAG 系統本身是非常關鍵的增強。

此外,更新中也包括:

  • ? model provider configuration improvements

  • ? provider UI updates

  • ? model option display fixes

  • ? selected model persistence improvements

  • ? API model and provider refactoring

這說明模型層不僅在“支持更多”,也在“配置更清晰、切換更順暢、顯示更合理”。

七、存儲與數據庫:OceanBase、SQLite、Redis 等后端適配繼續深化

這次版本在底層存儲和數據庫支持上同樣有不少動作,說明 RAGFlow 正在進一步適應企業級部署和多環境落地。

比較重要的方向包括:

  • ? support OceanBase for memory aggregation/highlight

  • ? support SQLite batch update

  • ? support Redis config isolation

  • ? support Redis lock

  • ? support mysql/postgresql incremental sync exposure

  • ? database schema adjustments

  • ? vector storage related fixes

  • ? storage migration related fixes

這些更新的意義在于:

1. 更適合企業部署

OceanBase、MySQL、PostgreSQL、Redis 等都是常見企業環境組件,支持范圍越廣,落地阻力越小。

2. 高可用與同步能力更穩

Redis lock、配置隔離等改動,通常意味著并發控制和多環境部署會更可靠。

3. 數據處理效率更高

SQLite batch update、增量同步字段暴露等優化,直接關系到批處理效率和同步準確性。

八、API、CLI、Go 服務與架構重構:平臺化能力持續增強

從這次更新的提交內容來看,RAGFlow 內部架構也在做比較大規模的整理。

API 與接口重構

包括:

  • ? api refactor

  • ? file list API refactor

  • ? model and provider API refactor

  • ? prompt API fix

  • ? agent API improvements

  • ? dashboard API fixes

  • ? workflow API related fixes

這類變化通常意味著接口邊界在重新梳理,有利于后續功能擴展和前后端協同。

CLI 與運維能力

官方提到:

  • ? CLI import assistant

  • ? CLI app improvements

  • ? CLI related fixes

這說明 RAGFlow 正在加強命令行部署、導入和運維可控性,對自動化部署和批量管理很有幫助。

Go 服務

版本中還出現了:

  • ? go service fixes

  • ? go service runtime related improvements

這意味著系統內部可能仍在推進部分服務化、性能優化或解耦改造。

九、安全修復:本次版本非常重要的升級重點之一

如果說前面很多是“能力升級”,那安全修復就是 v0.25.0 另一條非常重要的主線。

本次更新里,安全相關內容非常明確:

  • ? fix security vulnerability using SandboxedEnvironment

  • ? use sandboxed Jinja2 environment

  • ? validate file type and URL more strictly

  • ? prevent unsafe template rendering

  • ? disable risky behavior in sandbox execution

  • ? fix permission and access control related issues

尤其是模板渲染和沙箱執行這部分,通常都是 RAG/Agent 系統里比較敏感的安全面。
官方顯然對這部分做了專門加固,這對于企業部署非常關鍵。

十、其他值得注意的體驗優化與修復

除了以上大模塊,v0.25.0 還包含大量“看似細碎、實則很影響體驗”的修復和優化,例如:

  • ? mobile adaptation improvements

  • ? embedded page style fixes

  • ? floating chat widget style and i18n improvements

  • ? knowledge graph UI fixes

  • ? token/page count display fixes

  • ? import/export edge cases fixed

  • ? pagination and sorting optimizations

  • ? log display improvements

  • ? empty state and error handling improvements

  • ? versioning and history UI fixes

這些更新整體上會讓系統更穩定、更順手,也更適合真實業務場景長期使用。

總結:v0.25.0 是一次“平臺化”味道很強的版本

代碼地址:github.com/infiniflow/ragflow

整體來看,RAGFlow v0.25.0 不只是一次常規迭代,而是一次非常明顯的能力擴張:

  • ?文檔接入更強:pipeline、preprocess、解析器、OCR、DOCX/Excel 懶加載全面增強

  • ?數據源更廣:Seafile、RSS、DingTalk AI Sheet 等新增接入

  • ?Agent 更完整:發布、版本管理、sandbox、數據分析模板、圖表生成、記憶系統都更成熟

  • ?國際化更徹底:新增阿拉伯語、保加利亞語、土耳其語,并支持 RTL

  • ?模型生態更開放:Claude、ZhipuAI、Mistral、Yandex、Qwen3 等持續擴展

  • ?底層更穩:數據庫、存儲、API、CLI、Go 服務、安全都在持續強化


我們相信人工智能為普通人提供了一種“增強工具”,并致力于分享全方位的AI知識。在這里,您可以找到最新的AI科普文章、工具評測、提升效率的秘籍以及行業洞察。 歡迎關注“福大大架構師每日一題”,發消息可獲得面試資料,讓AI助力您的未來發展。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
四川凌晨追打事件后續:6人全被帶走,女子動手襲警細節曝光

四川凌晨追打事件后續:6人全被帶走,女子動手襲警細節曝光

音樂時光的娛樂
2026-05-12 13:46:06
大瓜!許家印昔日恒大奢靡細節流出,丁玉梅海外包養30歲白人小伙

大瓜!許家印昔日恒大奢靡細節流出,丁玉梅海外包養30歲白人小伙

壹月情感
2026-05-09 00:00:07
一場2-3爆出大冷門,補時慘遭絕殺,孔蒂不敢相信,爭四格局大亂

一場2-3爆出大冷門,補時慘遭絕殺,孔蒂不敢相信,爭四格局大亂

足球狗說
2026-05-12 06:03:30
600522,成交“天量”!

600522,成交“天量”!

證券時報
2026-05-12 17:04:03
雪中送炭!生死戰今晚開打,U17國足先迎大喜訊,取勝卡塔爾穩了

雪中送炭!生死戰今晚開打,U17國足先迎大喜訊,取勝卡塔爾穩了

零度眼看球
2026-05-12 13:46:19
最新:烏克蘭空襲紅軍村方向指揮部!摧毀赫爾松俄軍關鍵據點

最新:烏克蘭空襲紅軍村方向指揮部!摧毀赫爾松俄軍關鍵據點

項鵬飛
2026-05-11 20:05:05
小伙連刮3天刮刮樂,刮中100萬,彩票店老板:小伙在附近工廠上班,中獎后已辭職返回老家

小伙連刮3天刮刮樂,刮中100萬,彩票店老板:小伙在附近工廠上班,中獎后已辭職返回老家

觀威海
2026-05-10 20:02:09
女子潛水遇成千上萬海狼群,網友:被襲擊10秒不到就剩骨架!

女子潛水遇成千上萬海狼群,網友:被襲擊10秒不到就剩骨架!

貍貓之一的動物圈
2026-05-10 10:17:09
特朗普訪華團陣容豪華,美企高管全部隨行,唯獨一個人沒受到邀請

特朗普訪華團陣容豪華,美企高管全部隨行,唯獨一個人沒受到邀請

叮當當科技
2026-05-12 19:08:39
特朗普還沒來華,美軍先來下馬威?大批F22抵達,美媒直言丟人

特朗普還沒來華,美軍先來下馬威?大批F22抵達,美媒直言丟人

別吵吵
2026-05-12 08:24:26
大連一燒烤店內女子用鐵簽給狗擼串,還讓它坐在卡座上,市監局介入后店鋪停業整頓,店主:已銷毀全部鐵簽,向所有顧客致歉

大連一燒烤店內女子用鐵簽給狗擼串,還讓它坐在卡座上,市監局介入后店鋪停業整頓,店主:已銷毀全部鐵簽,向所有顧客致歉

大風新聞
2026-05-12 10:08:22
驚人的母子定律:原來母親的樣子,直接決定了孩子的一生

驚人的母子定律:原來母親的樣子,直接決定了孩子的一生

一口娛樂
2026-05-11 15:33:57
“好豪邁的洛麗塔”,165cm未成年女兒穿搭火了,家長尷尬不敢認

“好豪邁的洛麗塔”,165cm未成年女兒穿搭火了,家長尷尬不敢認

妍妍教育日記
2026-05-12 18:46:53
山姆欠租887萬沖上熱搜!結果大反轉,網友:原來是個大冤種

山姆欠租887萬沖上熱搜!結果大反轉,網友:原來是個大冤種

雷科技
2026-05-11 17:02:13
外媒評選法網種子炸彈:鄭欽文在列!外卡揭曉,羅馬女單八強出爐

外媒評選法網種子炸彈:鄭欽文在列!外卡揭曉,羅馬女單八強出爐

排球黃金眼
2026-05-12 09:04:21
女子4S店找母嬰室喂奶遭嘲笑,理想客服:門店已主動道歉,承諾將在215家門店增設母嬰室

女子4S店找母嬰室喂奶遭嘲笑,理想客服:門店已主動道歉,承諾將在215家門店增設母嬰室

觀威海
2026-05-12 10:10:07
放得越久越值錢!“這6樣”千萬別扔掉,第2種家家戶戶都有!

放得越久越值錢!“這6樣”千萬別扔掉,第2種家家戶戶都有!

Home范
2026-05-11 11:45:07
59歲浙江前首富直播間跳團舞,也救不活美邦了?一年虧損2.49億元,線下門店“越開越虧”

59歲浙江前首富直播間跳團舞,也救不活美邦了?一年虧損2.49億元,線下門店“越開越虧”

都市快報橙柿互動
2026-05-12 19:20:32
伊朗深夜清理門戶,兩名內鬼被絞,身份曝光后中國也驚出一身冷汗

伊朗深夜清理門戶,兩名內鬼被絞,身份曝光后中國也驚出一身冷汗

達文西看世界
2026-05-09 14:03:46
咖啡不只有咖啡因:科學家發現它如何"改造"腸道和大腦

咖啡不只有咖啡因:科學家發現它如何"改造"腸道和大腦

歷史的塵埃發
2026-05-11 11:02:22
2026-05-12 21:40:49
moonfdd incentive-icons
moonfdd
福大大架構師每日一題
1221文章數 67關注度
往期回顧 全部

科技要聞

宇樹發布載人變形機甲,定價390萬元起

頭條要聞

新電動車到手不足一月頻繁自動鎖死 老人被摔傷五六次

頭條要聞

新電動車到手不足一月頻繁自動鎖死 老人被摔傷五六次

體育要聞

總是掉鏈子的“倒霉蛋”,闖進了歐戰決賽

娛樂要聞

白鹿風波升級!掉粉20萬評論區淪陷

財經要聞

黃仁勛真是被白宮徹底封殺了

汽車要聞

吉利銀河“TT”申報圖曝光 電動尾翼+激光雷達

態度原創

教育
時尚
旅游
家居
數碼

教育要聞

想進深圳體制內的中小學校?看完這3092人名單,我勸你先考研

穿極簡風的夏天,是真高級!

旅游要聞

藏在南京新街口的老巷子,你知道哪幾條

家居要聞

極簡主義下的居住場域與空間

數碼要聞

綠聯推出“AP16”16英寸便攜屏:2.5K 165Hz +揚聲器,1799元

無障礙瀏覽 進入關懷版