亚洲中文字幕乱码亚洲-蜜桃成熟视频在线观看-免费中文字幕视频在线-中国五十路熟妇洗澡视频-亚洲av伊人啪啪c-国产精品成人一区二区-国产自拍视频一区在线观看-成人一区不卡二区三区四区-亚洲情精品中文字幕99在线

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

學(xué)術(shù)數(shù)據(jù)庫的"薅羊毛"生意:當(dāng)600篇論文共享同一個金礦

0
分享至

當(dāng)統(tǒng)計學(xué)成為遮羞布

2026年初春,一篇關(guān)于明星減肥藥的論文悄然從學(xué)術(shù)期刊上消失。這篇研究曾信誓旦旦地宣稱,兩種藥物聯(lián)用能讓患者多減掉4%的體重——在GLP-1類藥物席卷全球醫(yī)藥市場的當(dāng)下,這個數(shù)字足以讓臨床醫(yī)生眼前一亮。

但貝勒醫(yī)學(xué)院的統(tǒng)計學(xué)家David Allison在審閱時發(fā)現(xiàn)了蹊蹺。他反復(fù)研讀論文的統(tǒng)計方法,卻始終無法復(fù)現(xiàn)作者的結(jié)論。更令人困惑的是,當(dāng)他試圖理解作者究竟采用了何種分析路徑時,竟發(fā)現(xiàn)這套方法在邏輯上根本無法推導(dǎo)出論文所聲稱的結(jié)果。


半年多的調(diào)查拉鋸后,期刊最終撤回了這篇論文。所有作者都不同意這個決定,他們正在準(zhǔn)備辯護信。但這已無關(guān)緊要。

真正值得警惕的不是這一篇論文的命運,而是它背后那個正在失控的龐大陰影。

三年暴漲六倍的學(xué)術(shù)奇觀

讓我們看一組數(shù)字:2021年,全球基于美國FDA不良事件報告系統(tǒng)的研究論文約有100篇。三年后,這個數(shù)字飆升至600篇。這不是某個新興領(lǐng)域的自然爆發(fā),而是一場有組織的學(xué)術(shù)淘金熱。

FAERS系統(tǒng)原本是個好東西。這個由美國藥監(jiān)部門維護的數(shù)據(jù)庫,收錄了二十年來數(shù)千萬條藥物副作用報告,為上市后的藥品安全監(jiān)管提供了重要依據(jù)。法國藥理學(xué)家Charles Khouri估計,市面上六成到七成的藥品說明書修訂,都源于這類藥物警戒數(shù)據(jù)庫的監(jiān)測發(fā)現(xiàn)。


但金礦一旦被發(fā)現(xiàn),挖礦的人就蜂擁而至。

這套系統(tǒng)的致命誘惑在于它的開放性。任何人都可以免費下載數(shù)據(jù),任何藥物都可以成為研究對象,任何副作用組合都可以被檢驗。當(dāng)數(shù)據(jù)庫的規(guī)模達(dá)到數(shù)百萬種藥物與數(shù)百萬種不良事件的量級時,統(tǒng)計學(xué)上的"顯著發(fā)現(xiàn)"就變成了可以批量制造的工業(yè)產(chǎn)品。

這本質(zhì)上是一種合法的學(xué)術(shù)博彩:只要檢驗的次數(shù)足夠多,總能湊出一個看似有意義的p值。

更隱蔽的陷阱在于數(shù)據(jù)本身的缺陷。FAERS依賴自愿上報,沒有人知道實際發(fā)生的副作用有多少比例被記錄。一種被媒體反復(fù)報道的"網(wǎng)紅藥",其副作用報告量可能遠(yuǎn)超那些同樣廣泛使用但缺乏話題性的老藥。這種報告偏倚不是技術(shù)誤差,而是系統(tǒng)性的信息扭曲,卻極少被論文作者認(rèn)真對待。

流水線生產(chǎn)的"科學(xué)發(fā)現(xiàn)"

Khouri和他的合作者深入分析了這股論文洪流的共同特征。他們發(fā)現(xiàn)了令人驚訝的標(biāo)準(zhǔn)化痕跡。

正常的藥物安全研究通常選用一種成熟的不成比例分析方法,因為多種方法并用往往是冗余的。但灌水論文偏偏熱衷于堆砌方法,仿佛方法越多,結(jié)論就越可靠。他們還發(fā)明了一種名為"鏡像圖"的可視化工具,把同樣的時間信息在同一幅圖里畫兩遍,美其名曰展示"發(fā)病時間規(guī)律",實則毫無信息增量。

但真正暴露底牌的,是這些論文普遍缺乏一個核心要素:研究問題。

規(guī)范的學(xué)術(shù)研究始于一個具體的臨床疑問。為什么懷疑這種藥會導(dǎo)致這種副作用?基于什么生物學(xué)機制或前期觀察?這些FAERS批量論文往往跳過這一步,直接把藥物扔進數(shù)據(jù)庫,讓算法去挖掘"信號",再把挖掘結(jié)果包裝成科學(xué)發(fā)現(xiàn)。


這種無的放矢的研究模式,偶爾會產(chǎn)出令人啼笑皆非的"成果"。比如有論文通過數(shù)據(jù)分析"發(fā)現(xiàn)",治療肺動脈高壓的藥物西地那非,與肺動脈高壓存在統(tǒng)計關(guān)聯(lián)。這就像通過大數(shù)據(jù)發(fā)現(xiàn)"醫(yī)院與疾病高度相關(guān)"一樣,把因果關(guān)系徹底顛倒了。研究者對藥物基本適應(yīng)癥的無知,在這種"發(fā)現(xiàn)"中暴露無遺。

產(chǎn)能爆發(fā)的背后推手

論文數(shù)量的異常曲線,往往指向評價體系的畸形激勵。

Khouri團隊的文獻計量分析揭示了一個尖銳的地理分布:近期發(fā)表的相關(guān)論文中,近八成來自中國研究機構(gòu)。而在2021年之前,中國作者在這個細(xì)分領(lǐng)域幾乎空白。這種從零到壟斷的跨越,很難用學(xué)術(shù)興趣的自然轉(zhuǎn)移來解釋。

更具體的線索來自作者署名。某所高校的一位研究者獨力貢獻了27篇相關(guān)論文,其中7篇發(fā)表在頂級專業(yè)期刊上。同校同事緊隨其后,另一所高校也有多人上榜。這種集中產(chǎn)能,遠(yuǎn)超個人學(xué)術(shù)興趣的范疇,更像是生產(chǎn)線上的分工協(xié)作。

英國學(xué)者Matt Spick將這種現(xiàn)象置于更宏觀的背景下審視。他追蹤了包括FAERS在內(nèi)的五個公共數(shù)據(jù)庫,發(fā)現(xiàn)它們的論文產(chǎn)出曲線呈現(xiàn)相似的異常模式。這與另一個案例高度吻合:美國全國健康營養(yǎng)調(diào)查數(shù)據(jù)庫NHANES,在2021年至2024年間同樣經(jīng)歷了單關(guān)聯(lián)研究論文的井噴。

Spick指出,一旦數(shù)據(jù)庫上網(wǎng),論文工廠的制約因素就只剩下 imagination 和投稿速度。數(shù)據(jù)下載是即時的,分析腳本可以復(fù)用,論文框架能夠模板化。再輔以生成式AI的文本潤色,一條零成本、高產(chǎn)出的學(xué)術(shù)產(chǎn)業(yè)鏈就此成型。

這不是孤立的學(xué)術(shù)失范,而是一場技術(shù)賦能的系統(tǒng)性沖擊。

期刊的防御與潰敗

最先感受到壓力的是學(xué)術(shù)期刊的編輯們。

《藥物安全專家觀點》的主編在2024年夏天下達(dá)了禁令:不再接受未經(jīng)邀請的FAERS數(shù)據(jù)分析投稿。出版方的解釋很直白——投稿量"顯著上升",即使投入額外資源進行預(yù)審,拒稿率仍超過八成,系統(tǒng)已不堪重負(fù)。具有諷刺意味的是,這位主編本人也署名發(fā)表了多篇基于FAERS的論文。

《藥理學(xué)前沿》選擇了另一條路。他們要求所有基于公共數(shù)據(jù)集的研究必須提供外部獨立驗證,試圖用提高門檻的方式過濾掉流水線產(chǎn)品。新政實施后效果顯著:739篇投稿被拒,僅9篇通過新規(guī)發(fā)表。

但這些措施只能阻擋未來的潮水,對已淹沒岸邊的洪水無能為力。

撤稿機制在此陷入了尷尬的沉默。

現(xiàn)有的學(xué)術(shù)糾錯體系擅長處理明確的造假:數(shù)據(jù)篡改、圖片拼接、抄襲剽竊,這些都有清晰的判定標(biāo)準(zhǔn)。但FAERS論文使用的是真實數(shù)據(jù),運行的是正版軟件,輸出的統(tǒng)計指標(biāo)格式規(guī)范。它們的問題不在于真?zhèn)危谟跓o意義——沒有研究假說支撐的統(tǒng)計顯著性,就像沒有地基的建筑,外觀完整卻經(jīng)不起推敲。

Khouri坦承,試圖以造假為由撤稿幾乎不可能。"結(jié)果是無意義的,存在p值操縱和高假陽性風(fēng)險。這些是無用的論文,但它們不是假的。"

大概吧。

無毒的污染物

"無用但非假",這個定性精準(zhǔn)地描述了此類論文的特殊危害。

它們不會直接毒害讀者,不會像造假論文那樣導(dǎo)致實驗室重復(fù)實驗時的事故。但它們以另一種方式破壞著學(xué)術(shù)生態(tài)的根基。

第一重危害在臨床一線。醫(yī)學(xué)文獻中的安全警告具有真實的威懾力。患者會因此停藥,醫(yī)生會因此改變處方習(xí)慣。如果一篇FAERS論文聲稱某類暢銷減肥藥與自殺傾向相關(guān),即使這個"信號"只是媒體關(guān)注度造成的報告偏倚疊加統(tǒng)計噪音,其傳播仍可能引發(fā)不必要的恐慌,讓真正需要藥物治療的患者錯失干預(yù)時機。

第二重危害在科研資源分配。當(dāng)虛假的"信號"進入文獻,就可能觸發(fā)后續(xù)的驗證研究。臨床試驗的設(shè)計、執(zhí)行、資金消耗,本應(yīng)用于探索真正未知的醫(yī)學(xué)問題,卻被浪費在證偽數(shù)據(jù)挖掘的幻覺上。

更深層的損害在于認(rèn)知環(huán)境的污染。同行評審的精力被海量低質(zhì)投稿稀釋,有價值的研究在噪聲中難以辨識,臨床決策所依賴的證據(jù)基礎(chǔ)被泥沙俱下的事實堆砌所動搖。

這不是學(xué)術(shù)不端,而是一種新型的文獻污染。它利用的是開放科學(xué)的善意設(shè)計,鉆的是評價體系的漏洞,留下的是難以清除的長期殘留。

結(jié)構(gòu)性困局與出路

問題的根源不在于某個數(shù)據(jù)庫被濫用,而在于"發(fā)表或出局"的學(xué)術(shù)生存法則。

當(dāng)職稱晉升、基金申請、人才帽子都以論文數(shù)量為硬通貨時,一篇耗時數(shù)月、精心設(shè)計的臨床觀察研究,與一篇用現(xiàn)成數(shù)據(jù)、模板化分析、一周成稿的數(shù)據(jù)庫挖掘論文,在統(tǒng)計表格上可能貢獻相同的分值。這種激勵機制天然地獎勵短平快的產(chǎn)出,懲罰需要長期投入的深耕。

技術(shù)變革正在放大這種扭曲。生成式AI降低了寫作門檻,開放數(shù)據(jù)庫消除了數(shù)據(jù)獲取成本,統(tǒng)計軟件的自動化功能減少了技術(shù)壁壘。學(xué)術(shù)生產(chǎn)的門檻從未如此之低,而質(zhì)量控制的手段卻未能同步進化。

堵住FAERS這一個口子,灌水者會涌向NHANES,涌向任何下一個被發(fā)現(xiàn)的數(shù)據(jù)寶庫。

那篇被撤回的GLP-1論文提供了一個觀察窗口。它并非典型的數(shù)據(jù)庫灌水作,作者來自正規(guī)學(xué)術(shù)機構(gòu),研究設(shè)計也相對完整。但它與那些流水線產(chǎn)品共享同一種深層病理:用復(fù)雜的數(shù)據(jù)操作替代清晰的因果邏輯,用統(tǒng)計顯著性包裝缺乏理論根基的"發(fā)現(xiàn)"。

Allison在回顧這個案例時提到,這涉及一個新興的研究領(lǐng)域——治療反應(yīng)異質(zhì)性。他認(rèn)為這個領(lǐng)域亟需方法學(xué)的規(guī)范,"讓人們理解什么是合理和合規(guī)的研究方法"。

但規(guī)范一個領(lǐng)域容易,規(guī)范整個學(xué)術(shù)生產(chǎn)的激勵結(jié)構(gòu)困難得多。

Spick提出了一個尖銳的元科學(xué)問題:我們應(yīng)該允許毫無意義的科學(xué)研究發(fā)表嗎?這個問題至今沒有共識。但在爭論繼續(xù)的同時,數(shù)以千計的類似論文正在進入索引系統(tǒng),被引用,被納入綜述,潛移默化地塑造著醫(yī)學(xué)知識的版圖。

它們不是謊言,卻正在構(gòu)成一種比謊言更隱蔽的知識污染。

尾聲:重建學(xué)術(shù)的價值錨點

FAERS危機是一面鏡子,映照出開放科學(xué)時代的新挑戰(zhàn)。

數(shù)據(jù)共享本是為了加速發(fā)現(xiàn)、造福公眾,卻在特定的激勵環(huán)境下異化為論文制造業(yè)的原材料。技術(shù)賦能讓"生產(chǎn)"變得無比高效,卻讓"創(chuàng)造"的價值更加稀缺。

解決之道不在于關(guān)閉數(shù)據(jù)庫,而在于重建評價體系的重心。一篇論文的學(xué)術(shù)價值,應(yīng)當(dāng)由它回應(yīng)的問題質(zhì)量來衡量,而非由它消耗的數(shù)據(jù)體量或運行的統(tǒng)計檢驗次數(shù)來判定。

在算法能夠批量生成符合格式規(guī)范的"研究"的時代,人類研究者的核心競爭力恰恰在于提出真問題的能力,在于對臨床現(xiàn)象的敏銳觀察,在于對生物學(xué)機制的深刻理解。這些無法被模板化的素質(zhì),應(yīng)當(dāng)成為學(xué)術(shù)評價的真正標(biāo)尺。

否則,我們終將面對一個文獻爆炸卻知識貧瘠的未來:數(shù)據(jù)庫越來越多,論文越來越厚,而真正推動醫(yī)學(xué)進步的真知灼見,卻淹沒在統(tǒng)計噪音的汪洋之中。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
機器人半馬最詭異機器人出現(xiàn),網(wǎng)友:半夜送外賣要被嚇?biāo)?>
    </a>
        <h3>
      <a href=第一財經(jīng)資訊
2026-04-19 11:39:06
騎士消息:登帝解散原因曝光,阿倫展現(xiàn)格局,G2出場情況更新

騎士消息:登帝解散原因曝光,阿倫展現(xiàn)格局,G2出場情況更新

冷月小風(fēng)風(fēng)
2026-04-20 10:36:47
馬英九攤牌:兩岸開戰(zhàn)在所難免,臺成不了烏克蘭,只因有致命死穴

馬英九攤牌:兩岸開戰(zhàn)在所難免,臺成不了烏克蘭,只因有致命死穴

混沌錄
2026-04-16 17:31:13
任澤平退款730萬:價值4500萬的恒大花瓶

任澤平退款730萬:價值4500萬的恒大花瓶

超先聲
2026-04-17 16:34:01
馬卡:馬競?cè)牱岛綍r飛機上彌漫著葬禮般的氛圍

馬卡:馬競?cè)牱岛綍r飛機上彌漫著葬禮般的氛圍

懂球帝
2026-04-20 10:40:10
急瘋了!快船梭哈式豪賭,4筆重磅交易曝光,只為留住倫納德?

急瘋了!快船梭哈式豪賭,4筆重磅交易曝光,只為留住倫納德?

體育大朋說
2026-04-20 11:15:16
張藝凡回應(yīng)脫鞋合照:“是我自己脫鞋的,沒有任何人要求我”

張藝凡回應(yīng)脫鞋合照:“是我自己脫鞋的,沒有任何人要求我”

韓小娛
2026-04-20 08:29:10
女演員千萬別整容!看“金像獎紅毯”章子怡,舒淇同框,就懂了

女演員千萬別整容!看“金像獎紅毯”章子怡,舒淇同框,就懂了

童叔不飆車
2026-04-20 09:49:21
解氣!!!來而不往非禮也!中國海軍今天出手了!

解氣!!!來而不往非禮也!中國海軍今天出手了!

樂趣紀(jì)史
2026-04-20 08:03:19
“鳥巢”要拆?花34億建成的奧運地標(biāo),如今是賺了還是賠了?

“鳥巢”要拆?花34億建成的奧運地標(biāo),如今是賺了還是賠了?

拳擊時空
2026-04-20 06:18:44
專打高端局?狀元常規(guī)賽被噴水貨!到季后賽就爆發(fā),場均27+8太猛

專打高端局?狀元常規(guī)賽被噴水貨!到季后賽就爆發(fā),場均27+8太猛

你的籃球頻道
2026-04-20 09:58:25
中國為何能“打完就撤”,俄羅斯卻陷在烏克蘭出不來

中國為何能“打完就撤”,俄羅斯卻陷在烏克蘭出不來

民間胡扯老哥
2026-03-22 20:32:40
很意外,蘇林坐了12小時中國高鐵,越南人急了

很意外,蘇林坐了12小時中國高鐵,越南人急了

新浪財經(jīng)
2026-04-19 02:38:50
英超天王山戰(zhàn):曼城2比1阿森納,多納魯馬超巨失誤送禮,謝爾基、哈蘭德建功

英超天王山戰(zhàn):曼城2比1阿森納,多納魯馬超巨失誤送禮,謝爾基、哈蘭德建功

足球報
2026-04-20 01:33:26
全球公認(rèn)最懶國家,當(dāng)?shù)厝藞詻Q反對獨立,每天好吃懶做全靠援助

全球公認(rèn)最懶國家,當(dāng)?shù)厝藞詻Q反對獨立,每天好吃懶做全靠援助

心中的麥田
2026-04-17 18:03:56
收拾完伊朗,下一個輪到中國?以色列發(fā)戰(zhàn)爭威脅,中方送出5個字

收拾完伊朗,下一個輪到中國?以色列發(fā)戰(zhàn)爭威脅,中方送出5個字

千羽解讀
2026-04-18 10:12:15
天生一張娃娃臉都已經(jīng)46了,你敢想?

天生一張娃娃臉都已經(jīng)46了,你敢想?

記錄生活日常阿蜴
2026-04-18 19:43:42
伊朗向中國通報!談判團差點被美軍“團滅”,全程連電話都不敢打

伊朗向中國通報!談判團差點被美軍“團滅”,全程連電話都不敢打

荷蘭豆愛健康
2026-04-19 21:53:37
美軍計劃在國際水域登臨并扣押與伊朗有關(guān)船只

美軍計劃在國際水域登臨并扣押與伊朗有關(guān)船只

澎湃新聞
2026-04-19 11:38:24
演員何潤東回應(yīng)穿項羽鎧甲亮相蘇超:14年后受邀過來,內(nèi)心滿是感動,等下去逛項王故里

演員何潤東回應(yīng)穿項羽鎧甲亮相蘇超:14年后受邀過來,內(nèi)心滿是感動,等下去逛項王故里

極目新聞
2026-04-19 10:17:37
2026-04-20 12:47:00
研學(xué)世家
研學(xué)世家
專注于研學(xué)、研究生、學(xué)術(shù)領(lǐng)域創(chuàng)作!
152文章數(shù) 0關(guān)注度
往期回顧 全部

科技要聞

藍(lán)色起源一級火箭完美回收 客戶衛(wèi)星未入軌

頭條要聞

媒體:伊朗剛說不談 美國立即開打

頭條要聞

媒體:伊朗剛說不談 美國立即開打

體育要聞

七大獎項候選官宣!文班或全票DPOY

娛樂要聞

鹿晗生日上熱搜,被關(guān)曉彤撕下體面

財經(jīng)要聞

月之暗面IPO迷局

汽車要聞

把天門山搬進廠?開仰望U8沖上45度坡的那刻 我腿軟了

態(tài)度原創(chuàng)

教育
手機
數(shù)碼
藝術(shù)
公開課

教育要聞

我發(fā)現(xiàn)一個殘酷真相:孩子長大后,最怨恨的不是管太嚴(yán)的父母……

手機要聞

一加Ace6至尊版手機官宣4月28日發(fā)布:天璣9500、8600mAh

數(shù)碼要聞

華為全新鴻蒙電腦搭載云晰柔光屏,硬件級低藍(lán)光,今日下午發(fā)布

藝術(shù)要聞

王羲之《換鵝帖》尚在人間,驚艷無比!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版