網易首頁 > 網易號 > 正文 申請入駐

性能超越DeepSeek-OCR2,百度發布并開源新一代SOTA OCR模型

0
分享至

1月29日,百度正式發布并開源新一代文檔解析模型PaddleOCR-VL-1.5。該模型以僅0.9B參數的輕量架構,在全球權威文檔解析評測榜單OmniDocBench V1.5中取得全球綜合性能第一成績,整體精度達到94.5,超過Gemini-3-Pro、DeepSeek-OCR2、Qwen3-VL-235B-A22B、GPT-5.2等模型。

值得關注的是,PaddleOCR-VL-1.5 全球首次實現OCR模型的“異形框定位”能力,使機器能夠精準識別傾斜、彎折、拍照畸變等非規則文檔形態,首次讓“歪文檔”實現穩定、可規模化解析。該技術解決了傳統OCR模型在移動拍照、掃描件變形、復雜光照等真實場景中因文檔形變導致的識別失敗問題,可廣泛應用于金融票據處理、檔案數字化、政務文檔流轉等場景。

PaddleOCR-VL-1.5 基于文心大模型進行開發,在 OmniDocBench V1.5多個關鍵指標上取得領先表現。其中,表格結構理解(92.8 分)和閱讀順序預測(95.8 分)兩項核心指標上均位列第一,分別領先 Gemini-3-Pro、DeepSeek-OCR 等主流模型 2–5 分不等。在文檔閱讀順序預測任務中,其版面邏輯解析錯誤率僅為同類其他模型約一半。這表明,PaddleOCR-VL-1.5 在復雜文檔結構還原與版面邏輯理解方面具備更高穩定性,在合同、財報等高復雜度業務場景中擁有更高可用性。



2025年10月16日,百度首次發布并開源 PaddleOCR-VL模型,在 OmniDocBench V1.5 榜單中取得全球SOTA成績,并連續五天登頂 HuggingFace全球模型總趨勢榜與ModelScope全球模型總趨勢榜雙榜第一。

相比于上代,在功能層面,PaddleOCR-VL-1.5 進一步集成印章識別、文本檢測與識別等任務能力,關鍵指標持續領跑;同時針對特殊場景與多語種識別進行系統優化,在生僻字、古籍文獻、多語種表格、下劃線與復選框等復雜結構識別方面顯著提升,并新增對藏語、孟加拉語等語種的支持。模型還支持跨頁表格自動合并與跨頁段落標題識別,有效解決長文檔解析中的結構斷裂問題。

近半年來,全球主流模型廠商密集布局 OCR 領域。1月27日,深度求索發布新一代 OCR 模型 DeepSeek-OCR-2,引入“因果流查詢”機制,并將語言模型融入視覺編碼,在OmniDocBench V1.5中實現91.09%精度。與此同時,Mistral AI、字節跳動、騰訊等企業也相繼推出新一代 OCR 模型,行業競爭持續加劇。

業內分析認為,隨著大模型加速進入金融、政務、制造等高復雜度業務流程,文檔解析能力正從“能用”走向“穩定可規模化落地”。PaddleOCR-VL-1.5 在精度、復雜場景適應性與工程化能力上的系統突破,有望進一步降低產業應用門檻,推動 OCR 技術在真實生產環境中的深度落地。

目前,PaddleOCR-VL-1.5 已全面開源,開發者可通過GitHub、Hugging Face獲取,并在 PaddleOCR 官網進行在線體驗或通過百度智能云千帆平臺調用API接口。

  • 在線使用/API:https://www.paddleocr.com?
  • 開源項目地址:https://github.com/PaddlePaddle/PaddleOCR?
  • 模型下載地址:https://huggingface.co/PaddlePaddle/PaddleOCR-VL-1.5?

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
華誼兄弟7年虧80億申請破產,王中磊落魄兒子美國瀟灑

華誼兄弟7年虧80億申請破產,王中磊落魄兒子美國瀟灑

圓夢的小老頭
2026-04-25 08:49:42
上海富商花2000萬,讓情人生3個孩子,2019年后得知娃都不是他的

上海富商花2000萬,讓情人生3個孩子,2019年后得知娃都不是他的

漢史趣聞
2026-04-24 18:35:46
終于官宣!國家明令:即日起,非法放貸、暴力催收一律嚴打不留情

終于官宣!國家明令:即日起,非法放貸、暴力催收一律嚴打不留情

牛鍋巴小釩
2026-04-25 12:15:10
事發上海地鐵!警方通報:2人車廂內大打出手,均被行拘!公共視頻還原事發經過

事發上海地鐵!警方通報:2人車廂內大打出手,均被行拘!公共視頻還原事發經過

新民晚報
2026-04-25 12:50:21
知名博主被封禁:朝鮮風云,終成江湖絕響

知名博主被封禁:朝鮮風云,終成江湖絕響

虔青
2026-04-24 19:18:03
陸毅女兒近照曝光,16歲身高已超170cm,校花級美貌太驚艷了

陸毅女兒近照曝光,16歲身高已超170cm,校花級美貌太驚艷了

黎兜兜
2026-04-24 15:10:25
黑尾醬,徹底消失了?

黑尾醬,徹底消失了?

生如稗草
2026-03-15 08:48:11
別不當回事!4月30日前趕緊辦完,5月1日全面嚴查,誰躲都沒用

別不當回事!4月30日前趕緊辦完,5月1日全面嚴查,誰躲都沒用

復轉這些年
2026-04-24 21:20:33
21股暴增1000%!2026一季報瘋了,最高321倍

21股暴增1000%!2026一季報瘋了,最高321倍

慧眼看世界哈哈
2026-04-25 07:24:33
國乒男團陣容落定!關鍵二單敲定,王皓布局精妙球迷直呼穩了

國乒男團陣容落定!關鍵二單敲定,王皓布局精妙球迷直呼穩了

阿晞體育
2026-04-25 09:42:40
湖人頭號奇兵!斯馬特21+10+5斷兩數據全場最高 統治加時連場給力

湖人頭號奇兵!斯馬特21+10+5斷兩數據全場最高 統治加時連場給力

醉臥浮生
2026-04-25 11:14:52
秦皇島大姐逃單偷狗后續:正臉曝光,被人認出已社死,攤主不和解

秦皇島大姐逃單偷狗后續:正臉曝光,被人認出已社死,攤主不和解

奇思妙想草葉君
2026-04-24 11:33:43
悲催!37歲名牌大學畢業、年薪30萬女醫生被技術男嫌棄,當場崩潰

悲催!37歲名牌大學畢業、年薪30萬女醫生被技術男嫌棄,當場崩潰

火山詩話
2026-04-24 06:14:58
李詩灃湯杯狀態堪憂!韓國男隊被丹麥隊暴揍!

李詩灃湯杯狀態堪憂!韓國男隊被丹麥隊暴揍!

楊晨大神
2026-04-25 12:14:01
上海人終于體會到了引進印度人的“快樂”!

上海人終于體會到了引進印度人的“快樂”!

步論天下事
2026-04-25 09:34:47
明查|日本自衛隊坦克炸膛涉“中國制造”?型號搞錯了,且此“中國”非中國

明查|日本自衛隊坦克炸膛涉“中國制造”?型號搞錯了,且此“中國”非中國

澎湃新聞
2026-04-25 07:16:29
快訊!不等了,菲律賓喊話中國了!

快訊!不等了,菲律賓喊話中國了!

達文西看世界
2026-04-25 09:47:33
臺球皇帝亨得利:丁俊暉碰上趙心童就打雞血,但他防守壓力太大了

臺球皇帝亨得利:丁俊暉碰上趙心童就打雞血,但他防守壓力太大了

楊華評論
2026-04-25 01:56:27
北京車展名場面:雷軍打卡蔚來展臺 李斌聞訊一路小跑趕來

北京車展名場面:雷軍打卡蔚來展臺 李斌聞訊一路小跑趕來

快科技
2026-04-24 20:54:03
詹姆斯絕平三分,湖人不可思議的逆轉

詹姆斯絕平三分,湖人不可思議的逆轉

只關于籃球
2026-04-25 14:32:28
2026-04-25 15:04:49
貝克街探案官 incentive-icons
貝克街探案官
洞察科技和商業領域的一切秘密
326文章數 851關注度
往期回顧 全部

科技要聞

DeepSeek V4發布!黃仁勛預言的"災難"降臨

頭條要聞

"蚊子大軍"來襲北極圈也被攻破 各地疾控發出重要預警

頭條要聞

"蚊子大軍"來襲北極圈也被攻破 各地疾控發出重要預警

體育要聞

火箭0-3觸發百分百出局定律:本季加時賽9戰8敗

娛樂要聞

鄧超最大的幸運,就是遇見孫儷

財經要聞

90%訂單消失,中東旺季沒了

汽車要聞

2026款樂道L90亮相北京車展 樂道L80正式官宣

態度原創

數碼
親子
教育
藝術
手機

數碼要聞

3DMark macOS獨立版終于發布:不用蘋果商店、離線也能跑

親子要聞

當54歲的日本老公有了女兒,每天捧在手心都怕要化了!

教育要聞

第11課-Discomfort and difficulties 海外遇到困難怎么辦?

藝術要聞

荒廢十多年!福建石獅“最美爛尾樓”,德國品牌接盤了

手機要聞

打破沉悶色調:谷歌有望推出松綠色Pixel 11 Pro Fold折疊手機

無障礙瀏覽 進入關懷版