无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

6.4k Stars!用Claude Code寫論文的全套流水線,有人打包開源了

0
分享至

聽雨 發自 凹非寺量子位 | 公眾號 QbitAI

用Claude Code寫論文的一整套流水線,有人打包開源出來了。

完全戳中了學生黨的痛點,github星標直達6.4k


academic-research-skills

項目名叫academic-research-skills(以下簡稱ARS),是一套Claude Code技能包。

里面涵蓋4個skill,分別對應論文的研究、寫作、審稿、定稿

只需兩行命令安裝,直接一條龍串起整套學術研究流水線。


academic-research-skills

只能說,我讀研的時候怎么沒碰到這種好東西呢…


示意圖

4個skill,跑通整套科研流程

ARS的核心架構由4個skill組成,它們各司其職,拼在一起就是一條從選題到交稿的完整鏈路。

我這里還做了圖,大家可以看得比較直觀:


Deep Research是一支13個Agent的研究團隊。

它負責文獻調研、研究問題構建、方法論設計,還能寫系統性的PRISMA綜述。

團隊里有專門做文獻溯源的Agent,會調用Semantic Scholar API驗證每一篇引用的真實性。

有蘇格拉底導師Agent,通過對話引導研究者理清思路。

還有魔鬼代言人Agent,專門挑刺,防止研究者在早期就陷入思維定式。


Academic Paper是一支12個Agent的寫作團隊。

從大綱設計、論證構建、草稿撰寫,到雙語摘要生成、圖表可視化、引用格式轉換,全流程覆蓋。

特別值得一提的是風格校準功能,AI會學習你過往作品的寫作風格,讓輸出更像你自己寫的,而不是千篇一律的AI味。

輸出格式支持Markdown、DOCX、LaTeX,最終可以編譯成APA 7.0或IEEE格式的PDF。


Academic Paper Reviewer是一支7個Agent的審稿團隊。

模擬真實學術期刊的評審流程,由主編EIC帶領三位領域審稿人,再加上一個魔鬼代言人,從方法論、學科視角、跨學科價值等多個維度打分。

評分采用0到100的量化標準,80分以上接受,65到79小修,50到64大修,50以下拒稿。

審稿團隊還會輸出詳細的修改路線圖,告訴作者下一步該做什么。


Academic Pipeline是流程編排器,把前面三個團隊串聯成一條10階段的流水線。

從研究、寫作、完整性檢查、同行評審、修訂、最終檢查,到發表準備和流程總結,每個階段都有明確的產物和檢查點。

你可以在任意階段插入,比如已經有了初稿,就從Stage 2.5的完整性檢查開始;收到了審稿意見,直接從Stage 4的修訂切入。

費用參考也很透明,一篇1.5萬字的論文,全程跑下來大約4到6美元


比較有意思的設計

用Claude Code做學術研究的開源項目已經很多了,但是深扒之后,我發現ARS在底層設計上還是有些過人之處。

可以簡單總結為一句話:系統性防止AI搞砸學術研究

第一,引用核驗

AI寫論文最忌諱的,就是幻覺引用。

不只是編造不存在的文章,還包括標題相似但作者年份全錯、DOI真實但內容對不上等更隱蔽的情況。

ARS在Deep Research階段就埋了一個引用核驗機制,每一篇文獻都要過Semantic Scholar API的存在性確認。

不是簡單查一下標題對不對,而是用Levenshtein相似度算法做模糊匹配,閾值設在0.70以上才算通過。


第二,完整性閘門

在流水線的Stage 2.5和Stage 4.5,有兩道不可跳過的完整性閘門,會運行一份7項AI失敗模式檢查清單

這份清單直接來自2026年Nature上發表的一項全自主AI科研研究,其中總結了7種翻車模式,覆蓋引用幻覺、數據捏造、方法論造假等情形。


7種翻車模式

任何在2.5被標記為SUSPECTED的問題,必須在4.5變成CLEAR,或者由人工手動覆蓋并留下記錄。

設計邏輯是:把「我相信AI不會出錯」變成「我要求AI證明它沒出錯」。

實測中,這套機制在一篇真實論文里抓到了15個偽造引用和3個統計錯誤。

第三,反諂媚協議,讓AI敢于說不

大多數AI工具都有一個隱形毛病,討好用戶。你讓它改,它就改,哪怕改得更差。

所以ARS在審稿環節專門設計了反諂媚機制。

審稿團隊里有一個Devil’s Advocate,也就是魔鬼代言人,職責是挑刺。

但挑完刺之后,還有一個讓步閾值協議。

DA的反駁會被評分1到5,如果低于4分,寫作團隊不允許承認。


換句話說,AI不能為了顯得好合作就輕易讓步。

同時,攻擊強度在修訂過程中必須保持。如果第一輪審稿把方法論批得體無完膚,作者修訂后不能讓審稿人突然變得溫柔。

評分軌跡也會被追蹤,任何維度的分數下降都會被標記為回歸。

這和軟件工程里的不引入新Bug原則一樣,改一個地方不能搞砸另一個地方。

第四,三層數據隔離,不讓AI偷看答案

ARS把數據流嚴格分成三層:

Layer 1是原始輸入,默認不可信,可能幻覺、過時、帶偏見。

Layer 2是通過完整性驗證后的產物。

Layer 3是評分標準、參考答案和金標數據,這層材料永遠不能出現在寫作AI的上下文中。

具體實現上,寫作團隊和審稿團隊分兩次獨立調用,中間有階段邊界隔離。

寫作AI只能收到審稿AI的自然語言反饋,比如「第二章論證跳躍,建議補充對比實驗」。

但它看不到原始的評分標準,也不知道每個維度占多少分。

這個設計的靈感來自于Anthropic今年的w2s-researcher研究,其中也用了同樣的三層隔離模型。

結論是當AI能讀取標簽數據時,結果可能不是真的泛化,而是在優化表面特征。

解決方案不是更好的提示詞,而是結構上的隔離。


最后一點,誠實文檔化,「我不保證能復現」

學術界經常遇到「這個結果我復現不了」的問題。ARS給每個產物生成一個repro_lock文件,記錄運行時的完整配置。

但文件里有一段強制聲明,LLM輸出不是字節級可復現的,模型提供商會更新權重而不改模型ID,外部API每天返回不同的數據。

這個文件只是配置文檔,不是重放保證。


在更新日志上,可以看到ARS已經經歷了很多輪迭代。從2月上線到現在,提交的commit數達到了三百多次。

從每次版本更迭中,也能看出作者對AI學術研究系統風險有著深刻理解。

這也是我覺得目前學術研究AI工具的關鍵所在——

讓AI幫你寫論文并不難,重點是如何防止它出錯、討好,讓整個流程變得更系統更可靠。

ARS的設計哲學,可以總結為README里那句話:

「AI是你的副駕駛,不是飛行員。」

如何安裝

安裝方式很簡單,如果你已經在用Claude Code,只需要兩行命令:

/plugin marketplace add Imbad0202/academic-research-skills/plugin install academic-research-skills

驗證安裝是否成功,運行:

/ars-plan

然后描述你正在寫的論文主題,ARS就會啟動蘇格拉底對話,幫你梳理論文結構。

如果你偏好單條命令測試,也可以用:

/ars-lit-review “你的研究主題”

不過最簡單的安裝辦法,其實是直接把SKILL.md上傳到claude.ai項目知識庫

不需要安裝Claude Code,打開瀏覽器就能用。

不過要注意,這種方式不支持多Agent并行,功能上是單Agent版本,適合輕度體驗;想跑完整流水線還是需要Claude Code。

還有一點,項目支持繁體中文和英文

那么,又到了大家最關心的,要花多少錢的環節。

作者推薦使用Claude Opus 4.7搭配Max訂閱計劃

完整跑完10個階段,單次可消耗超過20萬輸入token和10萬輸出token,單獨使用某個子模塊則少得多。

Max訂閱計劃分兩檔,每月100刀或200刀,相當不便宜。

但如果你的科研經費可以報銷的話,那…


示意圖

本文來自微信公眾號“量子位”,作者:關注前沿科技,36氪經授權發布。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
麻生太郎也坐不住了,沒想到中國還要回訪美國!

麻生太郎也坐不住了,沒想到中國還要回訪美國!

阿龍聊軍事
2026-05-16 14:32:29
中年男性破產被“斬殺”四件套:陽痿、失業、老婆出軌離婚和心梗

中年男性破產被“斬殺”四件套:陽痿、失業、老婆出軌離婚和心梗

黯泉
2026-05-09 20:15:36
訪華已經結束,特朗普回到白宮,用6句話談中國之行,措辭不尋常

訪華已經結束,特朗普回到白宮,用6句話談中國之行,措辭不尋常

高潔之冬
2026-05-17 10:20:18
白冰控訴被前員工做局后續!對方硬剛現身回應,網友:這面相挺狠

白冰控訴被前員工做局后續!對方硬剛現身回應,網友:這面相挺狠

小蜜情感說
2026-05-17 07:47:21
71.5%!歷史性暴跌,以貸養貸的泡沫崩了

71.5%!歷史性暴跌,以貸養貸的泡沫崩了

月滿大江流
2026-04-16 13:54:38
王小騫也沒想到,患上矮小癥的女兒,會在自己52歲這年迎來逆襲

王小騫也沒想到,患上矮小癥的女兒,會在自己52歲這年迎來逆襲

流云隨風去遠方
2026-05-08 12:21:02
后悔萬分啊!大廠員工哭訴被精神小妹“崩走”3000元,評論區炸鍋

后悔萬分啊!大廠員工哭訴被精神小妹“崩走”3000元,評論區炸鍋

火山詩話
2026-05-16 09:38:31
斯塔默發聲:不會辭職

斯塔默發聲:不會辭職

環球時報國際
2026-05-13 08:44:13
白人女性與黑人女性的體味差異,網友真實分享引發熱議

白人女性與黑人女性的體味差異,網友真實分享引發熱議

特約前排觀眾
2025-12-22 00:20:06
這家機油公司95%店長從學徒做起:年輕人需要的不是同情,是出路

這家機油公司95%店長從學徒做起:年輕人需要的不是同情,是出路

全棧遛狗員
2026-05-16 04:14:30
洪明甫解釋韓國隊名單爭議:孫興慜領銜多名名將落選

洪明甫解釋韓國隊名單爭議:孫興慜領銜多名名將落選

阿衃體育
2026-05-16 17:25:49
姜超回應紅魔游戲平板5 Pro進度:新技術比預期難搞 要是就換個芯片早上市了

姜超回應紅魔游戲平板5 Pro進度:新技術比預期難搞 要是就換個芯片早上市了

快科技
2026-05-17 14:00:14
120萬一針值嗎?3個患者的5年隨訪:有人考入名校,有人重獲新生

120萬一針值嗎?3個患者的5年隨訪:有人考入名校,有人重獲新生

華庭講美食
2026-05-17 13:09:16
3天讓一眾美國高官開了眼界,魯比奧感嘆,中國軍力不愧世界第二

3天讓一眾美國高官開了眼界,魯比奧感嘆,中國軍力不愧世界第二

起喜電影
2026-05-16 16:49:59
狂砍32分9板11助!這就是本土最強內外組合,CBA最大爭冠熱門浮現

狂砍32分9板11助!這就是本土最強內外組合,CBA最大爭冠熱門浮現

老葉評球
2026-05-17 11:09:32
這次很多人都被騙了,但媒體不應該

這次很多人都被騙了,但媒體不應該

走讀新生
2026-05-17 13:25:30
歷史不會重演,但會驚人相似:中國房地產很有可能重走日本老路?

歷史不會重演,但會驚人相似:中國房地產很有可能重走日本老路?

笑熬漿糊111
2026-05-11 05:00:12
勒布倫兄弟如愿以償,與樊振東在歐冠決賽中相遇

勒布倫兄弟如愿以償,與樊振東在歐冠決賽中相遇

去山野間追風
2026-05-17 12:50:12
不是布朗!不是胡金秋!鄭永剛盛贊廣廈1人太強,史密斯傷情出爐

不是布朗!不是胡金秋!鄭永剛盛贊廣廈1人太強,史密斯傷情出爐

老吳說體育
2026-05-16 23:34:36
人類全部的政治困境,都在這場會議里

人類全部的政治困境,都在這場會議里

尚曦讀史
2026-05-11 07:04:06
2026-05-17 14:32:49
36氪 incentive-icons
36氪
讓一部分人先看到未來
151382文章數 2848764關注度
往期回顧 全部

科技要聞

三大運營商即將免月租?多方回應

頭條要聞

上海男子公交車上閉眼"休息"實則已死亡 家屬索賠11萬

頭條要聞

上海男子公交車上閉眼"休息"實則已死亡 家屬索賠11萬

體育要聞

又見搶七!活塞全員發揮or騎士雙核爆發?

娛樂要聞

《主角》劉浩存上線,死別猝不及防

財經要聞

OpenAI和蘋果的“聯盟”即將破裂

汽車要聞

大五座SUV卷王!樂道L80上市 租電15.68萬元起

態度原創

健康
教育
時尚
本地
軍事航空

專家揭秘干細胞回輸的安全風險

教育要聞

“早七晚十,月補1w”,專碩研究生真實待遇曝光,看完刷新認知

5.22沙龍報名|何寬×黃競歐×王如菲:「二手知識,一手思考」

本地新聞

用蘇繡的方式,打開江西婺源

軍事要聞

黎以停火再延長 空襲卻未停止

無障礙瀏覽 進入關懷版