網易首頁 > 網易號 > 正文 申請入駐

一鍵生成PPT和科研繪圖,北大開源Paper2Any,全流程可編輯

0
分享至



你是否經歷過這樣的至暗時刻: 明明實驗數據已經跑通,核心邏輯也已梳理完畢,卻在面對空白的 PPT 頁面時陷入停滯; 明明腦海里有清晰的系統架構,卻要在 Visio 或 Illustrator 里跟一根歪歪扭扭的線條較勁半小時; 好不容易用 AI 生成了一張精美的流程圖,卻發現上面的文字是亂碼,或者為了改一個配色不得不重新生成幾十次……

在內容生產的過程中,“寫” 往往只占了一半,而將文字轉化為結構圖、流程圖,再整理成演示用的 PPT,這個過程繁瑣、耗時,且極度考驗設計感。為什么我們不能讓 AI 像理解文字一樣,理解我們的邏輯,并自動幫我們要展示的 “視覺物料” 準備好?

為了解決這一痛點,北京大學 DCAI 課題組基于自動化數據治理 Agent 框架DataFlow-Agent,推出了全新的多模態輔助平臺 ——Paper2Any





它不再是一個簡單的 “文生圖” 工具,而是一整套自動化的內容視覺化 Workflow。從閱讀資料、理解邏輯,到生成圖像、切割元素,最終輸出完全可編輯的 PPT 和 SVG 文件,Paper2Any 正在試圖重塑我們準備 Presentation 的方式。

  • 本地部署方式:https://github.com/OpenDCAI/Paper2Any?tab=readme-ov-file#-linux-% E5% AE%89% E8% A3%85
  • 網頁體驗地址:http://dcai-paper2any.nas.cpolar.cn/
  • 文章多模態工作流 Paper2Any:https://github.com/OpenDCAI/Paper2Any

一、 核心突破:打破 “不可編輯” 的魔咒

目前市面上的 AI 繪圖工具雖然效果不錯,但在科研與辦公等場景下有一個致命缺陷:生成的圖片是 “死” 的。 文字無法修改,模塊無法拖拽,風格難以統一。



工作流實現邏輯



生成示例PPT繪圖

Paper2Any 的核心差異在于它實現了從邏輯到結構化元素的映射。

系統內置的智能體首先對輸入的文章或文本進行語義分析,提取核心貢獻與思路。接著,它不僅生成視覺圖像,更進一步對草稿圖進行圖文內容分割 —— 自動識別其中的文字、圖表、結構模塊、圖標,并記錄每個元素的元數據。

這意味著,你拿到的不再是一張不可直接修改的 PNG,而是一組獨立、分層、可操作的圖文塊。用戶可以在 PPT 中自由移動、編輯、替換、重新布局。(Paper2PPT 和 PPTPolish 功能暫時僅支持輸出 PDF,可通過 PDF2PPT 功能將其結果轉為可編輯 PPTX)

二、 功能全景:從草稿到演示的自動化閉環

Paper2Any 目前支持的功能主要涵蓋以下四大核心場景,旨在解決從 “輸入素材” 到 “最終匯報” 的最后一公里問題。

Paper2Figure:智能科研繪圖,草圖變精圖



用戶無需從零學習復雜的矢量繪圖軟件。Paper2Figure 支持多模態輸入(PDF、文本、甚至隨手畫的草圖截圖),系統便能自動識別你的意圖。

  • 模型架構圖: 上傳論文或描述,系統自動梳理模塊連接關系,生成清晰的架構圖。支持生成 SVG 和 可編輯 PPTX,圖里的方框、線條都能動。
  • 技術路線圖: 無論是中文還是英文,系統能根據方法論自動繪制流程與邏輯步驟。
  • 實驗數據圖: 扔給它一堆實驗數據文本或表格,它能自動轉化為可視化的對比柱狀圖或折線圖。

Paper2PPT:文章結構化解析與 PPT 生成



這是為 “趕進度” 的研究者和職場人準備的救星。Paper2PPT 不僅僅是簡單的摘要生成,它利用算法對文檔結構進行深度語義分析,提取背景、方法論、關鍵圖表。

  • 三種輸入模式: 直接上傳 PDF 論文、粘貼長文本、或者僅僅輸入一個研究 Topic(系統會自動深度搜索)。
  • 自定義設置: 支持用戶自定義幻燈片頁數、風格及自由選擇中英文語言;支持逐頁生成 PPT,用戶可自由調整每頁 PPT 的大綱。
  • 超長 PPT 支持:首次支持制作超過 40 頁的超長 ppt,無論是綜述的演示還是深入研究某個主題都能一次滿足!
  • 中文適配與呈現: 可解決大模型生成 PPT 字體怪異及表達僵硬問題。輸出結果采用標準中文字體與規范的排版,文案邏輯自然流暢,可減少 “AI 痕跡”,滿足正式場合演示需求。



PDF2PPT:讓靜態文檔可編輯



你是否遇到過這種情況:手里只有一份 PDF 格式的講義或報告,卻需要對其進行修改和匯報?

PDF2PPT 模塊利用MinerUSAM(Segment Anything Model) 模型,像 “拆積木” 一樣對版面進行高精度解析,將原本鎖死的 PDF 頁面還原為可編輯的 PPTX。

  • 黑科技加持: 系統集成了Gemini Nano模型進行圖像內補(Inpainting)。當系統將文字提取出來后,會自動修復文字覆蓋區域的背景,實現 “去字留影”,最大程度還原原始底圖的視覺效果。

PPTPolish:交互式美化專家

如果你的 PPT 內容已經寫好,但排版卻有些簡陋,PPTPolish 可以接手后續的美化工作。系統會自動分析頁面并生成美化提示詞,用戶可以逐頁修改提示詞來微調美化方向。



三、 示例高能時刻:從輸入到輸出的 “視覺魔法”

空口無憑,我們來看看 Paper2Any 的實際表現。

科研繪圖:拯救手殘黨

  • 模型架構圖生成:

1. 論文 PDF → 符合論文主題的架構圖



2. 科研配圖 / 示意圖截圖 → 可編輯 PPTX



3. 論文摘要文本 → 可編輯架構圖



  • 技術路線圖智能梳理:

1. 論文 PDF → 符合論文主題的技術路線圖



2. 論文摘要文本 → 符合論文主題的技術路線圖



  • 實驗數據可視化:

1. 論文 PDF → 自動提取實驗數據繪制 PPT





不同類型與不同風格的生成圖示例

2. 論文實驗表格文本 → 自動整理實驗數據繪制 PPT



PPT 智能生成與美化

從文檔到演示,Paper2Any 提供了全鏈路的解決方案。

  • Paper2PPT:



















與 Gemini 3 Pro、NotebookLM 相比,Paper2Any 生成的 PPT 有以下優勢:

  • 結構化圖表生成能力強
  • 中文文字表達與字體呈現效果更自然
  • 可讀性更好,干貨更多,排版布局更具專業感與人工感
  • PDF2PPT:



  • PPTPolish:

1. PPT 增色美化



2. PPT 潤色拓展



原始 PPT 只是簡單的文字羅列;潤色后,系統自動添加了科技感背景、可視化圖標、以及邏輯圖示,瞬間提升匯報檔次。

四、 如何使用與部署

Paper2Any 提供兩種使用方式:

1. 本地部署(開發者推薦)

如果你希望深入研究、二次開發或本地運行,可以基于 Github 倉庫進行本地部署。

  • Github 倉庫: https://github.com/OpenDCAI/Paper2Any
  • 快速開始指引: https://github.com/OpenDCAI/Paper2Any?tab=readme-ov-file#-linux-% E5% AE%89% E8% A3%85

參考 Readme 文檔啟動 Web 前端即可。

2. 網頁版快速體驗

團隊已推出可視化的 Web 前端,支持拖拽上傳與實時進度展示。新用戶可免費注冊,登錄后可查看歷史使用記錄。

  • 訪問地址: http://dcai-paper2any.nas.cpolar.cn/

結語:讓配圖成為一種「自動獲得的附加值」

Paper2Any 的愿景,是希望建立一條新的科研與工作慣例:寫文章 + 一鍵配圖 + 一鍵生成 PPT + 一鍵展示

在未來,課題組計劃陸續支持Paper2Rebuttal(論文返修)、Paper2Idea(創新點生成)和Paper2Poster(文章海報生成)等更多的多模態功能。我們相信,工具的價值在于釋放人類的創造力,讓你從繁瑣的格式調整中解脫出來,將寶貴的時間投入到那些真正閃光的 Idea 之中。

歡迎大家關注使用 DCAI 的開源項目并與我們進行技術交流,如果覺得好用也請在 GitHub 倉庫點一個 star ~

Data-centric AI 開源項目:

文章多模態工作流 Paper2Any: https://github.com/OpenDCAI/Paper2Any

自動化數據治理 Agent 框架 DataFlow-Agent: https://github.com/OpenDCAI/DataFlow-Agent

LLM 數據準備系統 DataFlow (1.9k star): https://github.com/OpenDCAI/DataFlow

DataFlow 技術報告(#1 of the Hugging Face daily paper): https://arxiv.org/abs/2512.16676

LLM 數據訓練系統 DataFlex (基于 LLaMA-Factory): https://github.com/OpenDCAI/DataFlex

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
小米粥再次被關注!醫生發現:糖尿病患者喝小米粥時要重視這6點

小米粥再次被關注!醫生發現:糖尿病患者喝小米粥時要重視這6點

芹姐說生活
2026-04-25 12:32:30
湘潭大學大二女生賣紅棗幫母親治病:醫生說她還能活兩到三年 ,時間好短,想讓她多陪陪我;校友會捐款:希望幫其渡過難關,早日返回校園

湘潭大學大二女生賣紅棗幫母親治病:醫生說她還能活兩到三年 ,時間好短,想讓她多陪陪我;校友會捐款:希望幫其渡過難關,早日返回校園

揚子晚報
2026-04-25 18:04:55
先是海參崴,再是圖瓦和庫頁島,俄羅斯對中國,心態完全變了

先是海參崴,再是圖瓦和庫頁島,俄羅斯對中國,心態完全變了

觀察者小海風
2026-04-17 16:11:00
被指涉嫌在美強奸27歲女性?陸宏達辭任智度股份、國光電器董事長不到一周再起風波

被指涉嫌在美強奸27歲女性?陸宏達辭任智度股份、國光電器董事長不到一周再起風波

藍鯨新聞
2026-04-25 15:54:05
我在非洲烏干達創業10年,娶了三個老婆,揭秘當地黑人的真實生活

我在非洲烏干達創業10年,娶了三個老婆,揭秘當地黑人的真實生活

千秋文化
2026-04-22 20:23:34
全球死亡率第一!這一癌癥,是“沉默殺手”

全球死亡率第一!這一癌癥,是“沉默殺手”

上觀新聞
2026-04-26 06:59:12
亞洲第一賭場新東泰覆滅記:性交易泛濫,富商瘋狂砸錢,揮金如土

亞洲第一賭場新東泰覆滅記:性交易泛濫,富商瘋狂砸錢,揮金如土

談史論天地
2026-04-04 17:30:03
徹底敗光路人緣!皇馬核心惹怒球迷,更衣室內全隊不滿

徹底敗光路人緣!皇馬核心惹怒球迷,更衣室內全隊不滿

奶蓋熊本熊
2026-04-26 00:41:29
這是李鴻章妻妾的真實樣貌,個個美艷身材修長,顏值不輸當代女星

這是李鴻章妻妾的真實樣貌,個個美艷身材修長,顏值不輸當代女星

阿廢冷眼觀察所
2026-04-11 18:41:14
王治郅入選名人堂,中國籃協發聲!字字不提姚明,句句戳中他心窩

王治郅入選名人堂,中國籃協發聲!字字不提姚明,句句戳中他心窩

阿纂看事
2026-04-25 18:13:00
統治 AI 十年的英偉達,要被谷歌NPU 掀桌子了?

統治 AI 十年的英偉達,要被谷歌NPU 掀桌子了?

藍鯨新聞
2026-04-24 12:50:22
漢密爾頓、卡戴珊挽手出街!開了一臺Virgil限量邁巴赫S680...

漢密爾頓、卡戴珊挽手出街!開了一臺Virgil限量邁巴赫S680...

Supreme情報網
2026-04-25 11:59:03
有種差距叫于和偉和王陽,同樣跟萬茜搭戲,才知“CP感”是門玄學

有種差距叫于和偉和王陽,同樣跟萬茜搭戲,才知“CP感”是門玄學

陳述影視
2026-04-24 22:44:40
隨著馬倫一球一助+羅馬2-0,意甲最新積分榜出爐:爭四白熱化

隨著馬倫一球一助+羅馬2-0,意甲最新積分榜出爐:爭四白熱化

側身凌空斬
2026-04-26 01:57:26
2-0!亞馬爾缺席,1.5億超巨助攻,巴薩豪取9連勝,狂甩皇馬11分

2-0!亞馬爾缺席,1.5億超巨助攻,巴薩豪取9連勝,狂甩皇馬11分

我的護球最獨特
2026-04-26 00:10:37
伊朗國防部:伊朗仍留存了大部分導彈能力

伊朗國防部:伊朗仍留存了大部分導彈能力

財聯社
2026-04-25 05:04:43
“救護車遲到致1歲幼子延誤搶救身亡” 官方通報

“救護車遲到致1歲幼子延誤搶救身亡” 官方通報

看看新聞Knews
2026-04-25 22:44:13
開了十年麻將館我算看透了!天天泡牌桌上的人,沒一個命好的

開了十年麻將館我算看透了!天天泡牌桌上的人,沒一個命好的

林子說事
2026-04-25 21:11:40
兩家孩子被醫院抱錯5年,家長含淚換子,孩子的回答看哭了!

兩家孩子被醫院抱錯5年,家長含淚換子,孩子的回答看哭了!

莫地方
2026-04-26 02:00:03
罕見!醫生撥打12345舉報自己,官方通報出爐,真相太無奈!

罕見!醫生撥打12345舉報自己,官方通報出爐,真相太無奈!

醫客
2026-04-25 12:02:47
2026-04-26 08:03:00
機器之心Pro incentive-icons
機器之心Pro
專業的人工智能媒體
12852文章數 142636關注度
往期回顧 全部

科技要聞

DeepSeek V4發布!黃仁勛預言的"災難"降臨

頭條要聞

小伙被困隧道給母親留遺言:我救了個人可能出不去了

頭條要聞

小伙被困隧道給母親留遺言:我救了個人可能出不去了

體育要聞

那一刻開始,兩支球隊的命運悄然改變了

娛樂要聞

《我們的爸爸2》第一季完美爸爸翻車了

財經要聞

90%訂單消失,中東旺季沒了

汽車要聞

2026款樂道L90亮相北京車展 樂道L80正式官宣

態度原創

親子
手機
家居
旅游
軍事航空

親子要聞

總感覺她們兩是上輩子的情人!

手機要聞

停更一年憋大招!小米大折疊攜玄戒O3回歸,系統也是新的

家居要聞

自然肌理 溫潤美學

旅游要聞

安徽黃山:呈坎古村嬉魚燈

軍事要聞

伊朗總統:不會在壓力、威脅下進行談判

無障礙瀏覽 進入關懷版