機器之心編輯部
如果有一天,你在撤稿名單里看到了馬克斯·普朗克的名字,大概率會以為自己點進了某個學術惡搞網站。
畢竟,這不是普通作者。普朗克是量子論奠基人,1918 年諾貝爾物理學獎得主,也是 20 世紀科學史上最重要的名字之一。
但一篇新論文指出,普朗克發表于 1940 年和 1942 年的兩篇文章,竟然在 Springer 的數字平臺上被標記為「retracted」(撤回)。
![]()
![]()
- 論文標題:The Curious Case of Max Planck retracted papers. When past scientific practices meet contemporary publishing norms
- 論文地址:https://arxiv.org/abs/2605.17534
搞笑的是,從論文作者的調查看,這兩篇文章并不是因為造假、錯誤或學術不端被撤,而是被算法誤傷。
事情的開端,是 Retraction Watch(學術出版問題記錄網站)的一個「諾獎得主撤稿名單」。
作者作為物理學史研究者,在名單中看到馬克斯·普朗克時感到意外,因為這兩篇文章出自德國科學期刊《Die Naturwissenschaften》。當時的普朗克已經是享譽世界的物理學家,論文作者也很難相信這些文章真的在他生前被撤,或者后來存在足夠充分的撤回理由。
![]()
鏈接:https://retractionwatch.com/retractions-by-nobel-prize-winners/
Springer 平臺上給出的解釋相當含混。頁面標題把它標成「RETRACTED ARTICLE」(撤稿文章),但 PDF 里的說法是「This article has been withdrawn due to article violation」;網頁上的表述則更明確一些,稱文章因「copyright violation」(版權違規)被撤回。
![]()
也就是說,這可能是版權、數字化歸檔和平臺元數據管理共同制造出來的事故——這兩篇老文章在現代數據庫里被系統/出版商當成了版權或重復發表問題處理。
讓我們先回到 20 世紀上半葉的科學出版生態。《Die Naturwissenschaften》創刊于 1913 年,由 Julius Springer Verlag 出版,定位有點像德語世界的《Nature》:它是面向自然科學、醫學和技術進展的綜合性科學周刊。它既發表技術論文,也發表演講、會議報告,以及關于科學哲學和文化意義的討論。
普朗克這兩篇文章本身也不是報告新實驗或新理論的研究論文,而是關于科學知識性質的哲學性反思。
1942 年那篇《精確科學的意義與界限》尤其典型。它原本是普朗克 1941 年在柏林 Kaiser-Wilhelm-Gesellschaft 的一次演講,后來以多種形式流通:1942 年作為小冊子出版,也發表在《Europ?ische Revue》和《Die Naturwissenschaften》上,1943 年又被收入普朗克的演講和論文集中。
放在今天,這種路徑很容易被平臺或版權系統識別為「重復發表」。但在當時,從演講到期刊、從小冊子到文集的多渠道流通,本來就是科學思想傳播的一部分。
1940 年的《自然科學與真實外部世界》則更離奇。論文作者沒有發現它在其他地方重復發表的證據。作者提出的一種可能解釋是:同一期刊幾個月前,另一位作者 Aloys Müller 曾發表過一篇同名文章,討論普朗克的哲學立場;普朗克隨后用同樣標題寫了一篇回應,參與這場思想辯論。
在當年的編輯文化里,這顯然不是問題,甚至是一種明確的對話姿態。但到了后來的數字索引、版權管理和元數據系統里,兩個相同標題就可能被識別成一組可疑的重復。
論文還指出,這兩篇「被撤稿」的文章在 Springer 的平臺上甚至變成了空白頁。通常情況下,即便一篇論文被撤稿,原文也會保留,只是加上撤稿說明,以維護科學記錄的完整性。但在這里,1940 年那篇兩頁文章、1942 年那篇九頁文章,在數字平臺上都被抹掉了。今天想看原文,去原始出版方 Springer 是看不到的,得去非營利的 Internet Archive。
![]()
事情到這里,已經不只是「普朗克被誤撤稿」這么好笑了,而是一次現代學術出版基礎設施的翻車:當歷史文獻進入現代數字出版平臺,誰有權決定什么算「重復發表」、什么算「版權違規」、什么又該繼續被看見?
論文作者認為,「重復發表」「自我剽竊」這類概念并不是永恒不變的學術倫理標準,而是和 20 世紀后期以來的文獻計量、科研評價、版權轉讓、商業出版平臺綁定在一起的現代范疇。論文明確指出,「自我剽竊」是一個相對晚近的概念,隨著 1990 年代以來以論文數量衡量學術生產力的評價系統而興起。
這也是今天的學術系統格外熟悉的一點:問題不只是「內容是什么」,而是「內容被系統如何表示」。
一篇歷史文章進入數據庫后,會被拆成 DOI、標題、作者、版權狀態、撤稿標簽、PDF 文件、引用記錄等結構化對象。一旦平臺按照當代規則自動或半自動地處理舊文獻,就可能把過去正常的出版實踐,改寫成今天的違規事件。
這種錯位在 AI 時代尤其值得警惕。
我們今天談訓練數據、數據清洗、文獻數據庫、知識圖譜和 RAG,常常默認數字化知識是穩定、可檢索、可調用的。但這件事提醒我們:數字檔案不是中性的「過去之鏡」,而是一套帶有商業邏輯、法律假設和平臺規則的過濾器。數據會被平臺重新命名、重新分類,甚至被空白頁替代。
一個現代版權和計量系統,把前數字時代正常的科學傳播行為,反向判定為可疑操作。更嚴重的是,這種判定并沒有停留在標簽層面,而是直接影響了歷史文獻的可訪問性。
對正在進入 AI 時代的知識生產系統來說,一個錯誤標簽、一段缺失的 PDF、一次不透明的版權處理,都可能在模型、搜索引擎和學術工具中被繼續放大。未來的 AI 助手未必知道普朗克的文章是「誤撤」的,它可能只會看到數據庫里那個冷冰冰的 retracted 標記。
當科學記憶越來越多地被數據庫、出版商、平臺規則和商業基礎設施托管,我們還能不能準確地看見科學的過去?
參考鏈接:https://www.science.org/content/article/why-have-papers-one-history-s-most-famous-physicists-been-retracted
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.