一个算法,替一具 1947 年的尸体,撤掉了两篇 80 年前的论文
目录
- Retraction Watch 的列表里,出现了一个不可能的名字
- 两篇论文,两个截然不同的「算法误会」
- Springer 的回应:沉默、消灭编辑、继续卖空 PDF
- 现场验证:两个空 PDF 和一个 80 年前的哲学问题
- 最后:1930 年代的出版伦理,和 2026 年的版权机器人。谁在审判谁?
Retraction Watch 的列表里,出现了一个不可能的名字
Yves Gingras 在 Retraction Watch 上翻看诺贝尔奖得主的撤稿清单——纯属好奇。他是魁北克大学蒙特利尔分校的物理学史教授,看这种东西就像别人刷 Twitter。
然后他愣住了。
Max Planck。
Max Planck 的名字出现在一个撤稿(retraction)列表中。
你不需要懂量子力学也能感知到这件事有多荒诞。普朗克是量子力学的奠基人之一,1918 年诺贝尔物理学奖得主。他的名字被用来命名一个粒子(普朗克粒子)、一个长度单位(普朗克长度)、一个常数(普朗克常数)、一个温度(普朗克温度)、一颗卫星(普朗克卫星)和位于柏林的科学学会总部(马克斯·普朗克学会)。他的职业生涯中,「丑闻」这个词出现的次数是零。
一个在 1947 年就去世的人,怎么会被「撤回」论文?
Gingras 叫上了同事 Mahdi Khelfaoui。两个月后,他们把调查结果写成了一篇预印本,标题说得很克制——但在我们这种普通人看来,整个故事更像是一出算法喜剧。
两篇论文,两个截然不同的「算法误会」
被撤的两篇论文分别发表于 1940 年和 1942 年,发表在 Naturwissenschaften 期刊上——这家期刊现在叫 The Science of Nature,属于 Springer Nature 集团。
第一篇(1940 年):标题是《自然科学和真实的外部世界》("Natural Science and the Real External World")。这篇文章不是重复发表——但问题出在同年早些时候,一个叫 Aloys Muller 的科学家在同一本期刊上发表了同一标题的文章,内容是对普朗克 1931 年一篇论文的批判。普朗克用同标题在同一期刊随后回应。两篇文章,同一标题,不同作者。
2020 年代的自查重算法看到这个:两篇同标题文章在同一期刊 → duplicate → flag → retract。
第二篇(1942 年):标题是《精确科学的意义与界限》("Meaning and Limits of Exact Science")。这篇文章基于普朗克 1941 年在柏林的一场讲座。它被收录进一本小册子出版,又被放进另一本选集,同时发表在期刊上——1940 年代学术圈的常规操作。
2020 年代的版权算法看到这个:同一内容出现在多个出版物 → copyright violation → retract。
两篇的 DOI 记录都是在 2005 年电子化大规模迁移时期创建的。Gingras 和 Khelfaoui 推测,Springer 的法务部门当时接管了这批历史文章的版权审查——一家公司的「法务风控」大脑,用 2020 年代的标准审判 1940 年代的操作。而这种「审判」显然没有经过任何人眼的复核。
Springer 的回应:沉默、消灭编辑、继续卖空 PDF
更荒谬的部分发生在纸面之外。
The Science of Nature 的现任主编 Suzanne Scarlata(伍斯特理工学院教授)在接受《科学》杂志采访时说,她之前根本不知道期刊撤掉了普朗克的两篇论文。「这太疯狂了,」她说,「我不明白为什么会被标记。这肯定是算法干的,他们应该纠正这个错误。」
当 Scarlata 准备写一篇编辑部声明来讨论这个错误时,Springer Nature 的出版社高层直接毙掉了这篇声明。出版社拒绝对此置评,只通过发言人给了《科学》杂志一句标准回复:「关于具体撤稿的详细信息通常是保密的,只能与相关作者分享。」
问题是:相关作者死于 1947 年。按这个逻辑,Springer 的保密策略是完美的——他们的法律合规负责人应该说不出什么破绽。
还有一点让人哭笑不得:《科学》杂志的记者 Sam Kean 称,Springer 仍然在以每份 39.95 美元的价格继续销售这两个空 PDF。我只想说,我自己从 Springer 官网下载这两个空 PDF 时确实一分钱没花——看来机器人的定价系统也分不清"收费"和"免费"之间的差别。
现场验证:两个空 PDF 和一个 80 年前的哲学问题
我花了几分钟跟踪这两篇论文的数字痕迹。
在 Springer 官网,两篇论文的 DOI 页面仍然存在,但点击下载链接后,返回的是空白 PDF——封面还在,出版社栏还在,但正文一干二净。页面上加了一行小字:「因文章违规被撤回」(withdrawn due to article violation)。
违规?什么违规?八十年前发表在权威期刊上的一篇哲学论文,2026 年被一个算法判定为「违规」——而那个算法自己写不来哲学论文、也不知道普朗克是谁、甚至连自己正在检索的内容是不是一篇合法的学术出版物都分不清。
更妙的是,两篇论文在绝大多数国家已经进入公有领域(公共版权)。普朗克死于 1947 年,按照中国著作权法,作品保护期为作者终身加 50 年——这两篇论文早就到期了。所谓的「版权违规」从一开始就不是一个法律问题,它是一个元数据问题——一个 2005 年电子化时留下的分类歧义,被一个 2020 年代的算法放大器给引爆了。
两篇论文目前在 Internet Archive 上仍然可以自由获取。数字的永续性没有被破坏——但数字的权威记录被篡改了。有「Springer」作为出版方认证的版本显示的是「已撤回」;Archive.org 上的版本虽然可以被正常阅读,但任何引用它的学者都得面对一个问题:「你的参考文献是 Max Planck 被撤回的论文?」——这句描述本身就是一种暗伤。
Gingras 在接受《科学》杂志采访时说了一句最狠的话:「是谁干的,我不在乎。把它们放回数据库。从知识的角度说,这是不可接受的。」
最后:1930 年代的出版伦理,和 2026 年的版权机器人。谁在审判谁?
这个故事最让我不安的,不是「算法犯了错」——算法的错误每天都在发生。让我不安的是:撤回的门槛,从来没有如此之低;而撤回之后纠错的门槛,又从来没有如此之高。
1940 年代的一位作者,在发表论文时只需要说服主编和他的同行评议委员会——两三个人,建立在共识和信任之上的判断。2026 年的一位作者,在发表论文 80 年后,需要说服的是一套自己也不明白自己为什么撤回的自动系统,和一个认为「与已故作者的相关信息是保密的」的出版社法务流程。
这是一个制度设计上的巨大不对称。当你只相信人类时,犯错很慢,但纠错也很快(给主编打个电话就行)。当你只相信算法时,「放行」很快,但「撤回」和「纠错」中间的通道比地球到半人马座阿尔法星还远——因为要经过法律部、合规部、全球法务、VP of something 的层层点头。
而这一切的起因,只是一个研究员出于好奇翻了一下 Retraction Watch 的列表,看到了一行不该出现的名字。
如果他不翻呢?那两篇论文就永远在 Springer 的服务器上显示为空。Max Planck——量子力学的奠基人——在数字世界里就成了一个「被撤回论文的问题学者」。
历史的记录不是被大恶棍摧毁的,是被免责的自动化流程慢慢模糊掉的。
两篇论文仍在。但它们不再被「认证」了。
普朗克画像来源:Hugo Erfurth, 1938(公有领域)
评论(0)
暂无评论,来写第一条吧~