无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

13AI代理全流程寫論文,設7道防造假閘門

0
分享至

完全戳中了學生黨的痛點,github星標直達6.4k。



項目名叫academic-research-skills(以下簡稱ARS),是一套Claude Code技能包。

只需兩行命令安裝,直接一條龍串起整套學術研究流水線。



只能說,我讀研的時候怎么沒碰到這種好東西呢…



ARS的核心架構由4個skill組成,它們各司其職,拼在一起就是一條從選題到交稿的完整鏈路。

我這里還做了圖,大家可以看得比較直觀:



△AI生成

Deep Research是一支13個Agent的研究團隊。

有蘇格拉底導師Agent,通過對話引導研究者理清思路。

還有魔鬼代言人Agent,專門挑刺,防止研究者在早期就陷入思維定式。



△AI生成

Academic Paper是一支12個Agent的寫作團隊。

從大綱設計、論證構建、草稿撰寫,到雙語摘要生成、圖表可視化、引用格式轉換,全流程覆蓋。

特別值得一提的是風格校準功能,AI會學習你過往作品的寫作風格,讓輸出更像你自己寫的,而不是千篇一律的AI味。

輸出格式支持Markdown、DOCX、LaTeX,最終可以編譯成APA 7.0或IEEE格式的PDF。



△AI生成

Academic Paper Reviewer是一支7個Agent的審稿團隊。

模擬真實學術期刊的評審流程,由主編EIC帶領三位領域審稿人,再加上一個魔鬼代言人,從方法論、學科視角、跨學科價值等多個維度打分。

評分采用0到100的量化標準,80分以上接受,65到79小修,50到64大修,50以下拒稿。



△AI生成

Academic Pipeline是流程編排器,把前面三個團隊串聯成一條10階段的流水線。

從研究、寫作、完整性檢查、同行評審、修訂、最終檢查,到發表準備和流程總結,每個階段都有明確的產物和檢查點。

你可以在任意階段插入,比如已經有了初稿,就從Stage 2.5的完整性檢查開始;收到了審稿意見,直接從Stage 4的修訂切入。



△AI生成

用Claude Code做學術研究的開源項目已經很多了,但是深扒之后,我發現ARS在底層設計上還是有些過人之處。

可以簡單總結為一句話:系統性防止AI搞砸學術研究。

第一,引用核驗。

不是簡單查一下標題對不對,而是用Levenshtein相似度算法做模糊匹配,閾值設在0.70以上才算通過。



△AI生成

第二,完整性閘門。

在流水線的Stage 2.5和Stage 4.5,有兩道不可跳過的完整性閘門,會運行一份7項AI失敗模式檢查清單。

這份清單直接來自2026年Nature上發表的一項全自主AI科研研究,其中總結了7種翻車模式,覆蓋引用幻覺、數據捏造、方法論造假等情形。



任何在2.5被標記為SUSPECTED的問題,必須在4.5變成CLEAR,或者由人工手動覆蓋并留下記錄。

設計邏輯是:把「我相信AI不會出錯」變成「我要求AI證明它沒出錯」。

第三,反諂媚協議,讓AI敢于說不。

大多數AI工具都有一個隱形毛病,討好用戶。你讓它改,它就改,哪怕改得更差。

所以ARS在審稿環節專門設計了反諂媚機制。

審稿團隊里有一個Devil’s Advocate,也就是魔鬼代言人,職責是挑刺。

但挑完刺之后,還有一個讓步閾值協議。

DA的反駁會被評分1到5,如果低于4分,寫作團隊不允許承認。



△AI生成

換句話說,AI不能為了顯得好合作就輕易讓步。

評分軌跡也會被追蹤,任何維度的分數下降都會被標記為回歸。

這和軟件工程里的不引入新Bug原則一樣,改一個地方不能搞砸另一個地方。

第四,三層數據隔離,不讓AI偷看答案。

ARS把數據流嚴格分成三層:

Layer 1是原始輸入,默認不可信,可能幻覺、過時、帶偏見。

Layer 2是通過完整性驗證后的產物。

具體實現上,寫作團隊和審稿團隊分兩次獨立調用,中間有階段邊界隔離。

寫作AI只能收到審稿AI的自然語言反饋,比如「第二章論證跳躍,建議補充對比實驗」。

但它看不到原始的評分標準,也不知道每個維度占多少分。

這個設計的靈感來自于Anthropic今年的w2s-researcher研究,其中也用了同樣的三層隔離模型。

結論是當AI能讀取標簽數據時,結果可能不是真的泛化,而是在優化表面特征。

解決方案不是更好的提示詞,而是結構上的隔離。



△AI生成



△AI生成

這也是我覺得目前學術研究AI工具的關鍵所在——

ARS的設計哲學,可以總結為README里那句話:

「AI是你的副駕駛,不是飛行員。」

安裝方式很簡單,如果你已經在用Claude Code,只需要兩行命令:

驗證安裝是否成功,運行:

如果你偏好單條命令測試,也可以用:

不過最簡單的安裝辦法,其實是直接把SKILL.md上傳到claude.ai項目知識庫。

不需要安裝Claude Code,打開瀏覽器就能用。

不過要注意,這種方式不支持多Agent并行,功能上是單Agent版本,適合輕度體驗;想跑完整流水線還是需要Claude Code。

那么,又到了大家最關心的,要花多少錢的環節。

完整跑完10個階段,單次可消耗超過20萬輸入token和10萬輸出token,單獨使用某個子模塊則少得多。

Max訂閱計劃分兩檔,每月100刀或200刀,相當不便宜。

但如果你的科研經費可以報銷的話,那…





他是Edward Cheng-I Wu(吳政宜),頭像是一個頂著貓貓的可愛男生。



聲明:個人原創,僅供參考

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
羅馬尼亞遭襲后,梅德韋杰夫警告:歐盟已進入與俄羅斯的戰爭

羅馬尼亞遭襲后,梅德韋杰夫警告:歐盟已進入與俄羅斯的戰爭

澎湃新聞
2026-05-31 11:04:28
中國沒給面子,普京回國后認清現實,沉默一周后,終究還是妥協了

中國沒給面子,普京回國后認清現實,沉默一周后,終究還是妥協了

斜煙風起雨未
2026-05-30 22:36:40
釋永信被判24年,為啥不是無期?盤點他的錢色人生

釋永信被判24年,為啥不是無期?盤點他的錢色人生

大江看潮
2026-05-30 10:48:52
大爆冷!雷霆3-4馬刺恥辱出局,誰是輸球罪魁禍首?數據不會說謊

大爆冷!雷霆3-4馬刺恥辱出局,誰是輸球罪魁禍首?數據不會說謊

籃球掃地僧
2026-05-31 12:11:28
我國駐烏克蘭前大使:俄羅斯失敗不可避免

我國駐烏克蘭前大使:俄羅斯失敗不可避免

論鑒
2022-12-26 23:26:15
事態升級!全網緊急下架林志玲作品,20 年內娛生涯徹底歸零

事態升級!全網緊急下架林志玲作品,20 年內娛生涯徹底歸零

未曾青梅
2026-05-29 22:26:21
14歲女孩和同學吵架后吞下3枚刀片,醫生:刀片已穿過胃部進入小腸,隨時都有危險…

14歲女孩和同學吵架后吞下3枚刀片,醫生:刀片已穿過胃部進入小腸,隨時都有危險…

都市快報橙柿互動
2026-05-30 23:40:54
王者歸來 29歲樊振東率隊3-1進決賽:出任一單獨取2分 與新主爭冠

王者歸來 29歲樊振東率隊3-1進決賽:出任一單獨取2分 與新主爭冠

風過鄉
2026-05-31 07:09:45
越是上流人越“下流”?蘇芒代言遭全民抵制,廣汽緊急切割難平息

越是上流人越“下流”?蘇芒代言遭全民抵制,廣汽緊急切割難平息

楓塵余往逝
2026-05-29 07:35:23
馬尼大戰!誰能奪冠?19w球迷投票一針見血,原因有3!

馬尼大戰!誰能奪冠?19w球迷投票一針見血,原因有3!

運籌帷幄的籃球
2026-05-31 16:58:10
中國人均商鋪率僅有美國1/8!利潤太微薄為房東打工,人口和消費又不景氣

中國人均商鋪率僅有美國1/8!利潤太微薄為房東打工,人口和消費又不景氣

風向觀察
2026-05-31 11:49:14
寧波知名法餐廳老板娘吳優琴去世,年僅39歲,嫁老外定居中國11年

寧波知名法餐廳老板娘吳優琴去世,年僅39歲,嫁老外定居中國11年

裕豐娛間說
2026-05-30 18:31:41
張雪機車回應:不滿意第8!開度被限到85% 尾速很低 張雪打電話

張雪機車回應:不滿意第8!開度被限到85% 尾速很低 張雪打電話

念洲
2026-05-31 08:28:04
俄烏戰爭,如果俄羅斯最終贏了,你我在有生之年很可能會親歷戰爭

俄烏戰爭,如果俄羅斯最終贏了,你我在有生之年很可能會親歷戰爭

混沌錄
2026-05-29 23:26:12
豐田回應中止下一代純電轎車開發

豐田回應中止下一代純電轎車開發

財聯社
2026-05-30 21:56:05
再見雷霆!衛冕冠軍轟然倒下,我必須承認7個事實:三巨頭該散伙

再見雷霆!衛冕冠軍轟然倒下,我必須承認7個事實:三巨頭該散伙

籃球掃地僧
2026-05-31 14:16:11
總臺記者觀察丨香格里拉對話會進入最后一天 中美表態是最大看點

總臺記者觀察丨香格里拉對話會進入最后一天 中美表態是最大看點

北青網-北京青年報
2026-05-31 14:46:04
衛冕失敗!亞歷山大空砍35+9功虧一簣 兩連莊MVP卻無緣兩連冠

衛冕失敗!亞歷山大空砍35+9功虧一簣 兩連莊MVP卻無緣兩連冠

醉臥浮生
2026-05-31 10:49:15
給阿嬤的情書,新加坡官媒連批三天,最后承認:這東西,真擋不住

給阿嬤的情書,新加坡官媒連批三天,最后承認:這東西,真擋不住

娛說瑜悅
2026-05-30 17:03:54
50歲后才懂,夏天的熱是最好的補藥

50歲后才懂,夏天的熱是最好的補藥

詩詞天地
2026-05-30 06:00:13
2026-05-31 17:31:00
劇短情長
劇短情長
感謝關注,持續更新
331文章數 161關注度
往期回顧 全部

科技要聞

戴爾諾基亞又回來了!AI重估老牌科技公司

頭條要聞

50歲女子在美容店打除皺針半月后死亡 老板:加量打的

頭條要聞

50歲女子在美容店打除皺針半月后死亡 老板:加量打的

體育要聞

阿森納用最悲壯的方式,成就了巴黎王朝

娛樂要聞

賈玲最新動作!侯明昊給虞書欣抬轎!

財經要聞

醫學首席轉崗搞科技,A股科技股遭遇巨震

汽車要聞

900V+3.2秒破百 領克10+&領克10上市16.99萬元起

態度原創

房產
手機
親子
旅游
數碼

房產要聞

紅動五月!全國搶入核心資產,廣州盯緊凱旋新世界!

手機要聞

國產旗艦單品過百萬盤點,這個結果意外嗎?

親子要聞

歐美兒童“服美役”,10歲開始抗衰抗老?

旅游要聞

魅力山鄉|昭蘇,一個萬馬奔騰的地方

數碼要聞

微星發布搭載英特爾Arc G3的掌機Claw 8 EX AI+ 6月開售

無障礙瀏覽 進入關懷版