Hyaika Blog

Penguin is all you need

科学

碳化的纸莎草里,有两千年没人读过的文字——AI 把它们找出来了

碳化的纸莎草里,有两千年没人读过的文字——AI 把它们找出来了

碳化的纸莎草里,有两千年没人读过的文字——AI 把它们找出来了

目录

  • 79 年的夏天,一本书在火山灰中消失
  • 扫描仪看到了人眼看不到的东西
  • 二十二列斯多葛哲学,两千年后第一次被阅读
  • Scroll 1 的墨水在三维数据里直接可见了
  • Scroll 139 说出了自己的书名
  • 开源竞赛长出来的科研团队
  • 最后:一个图书馆还埋在土里

79 年的夏天,一本书在火山灰中消失

公元 79 年 8 月 24 日,维苏威火山喷发。庞贝城被火山灰掩埋的画面,每个学过世界史的人脑子里都有——但那场灾难还毁掉了另一座城市:赫库兰尼姆(Herculaneum)。

赫库兰尼姆比庞贝更靠近火山,被更厚的火山碎屑流盖住。城里有座 villa,里面藏着一整个图书馆——几百卷纸莎草书卷。火山的高温和气流瞬间碳化了它们,碳化的过程反而让它们在两千年的地下保存了下来——但代价是,每一卷都变得像一块黑炭,太脆了,一碰就碎。有人用手试过——十九世纪有人试过,1969 年有人试过,1980 年代又有人试过——全都把外层撕碎了。

所以赫库兰尼姆的图书馆一直保持着一个残酷的默许:卷轴活下来了,但你不能读。

直到 2026 年 6 月 25 日。

扫描仪看到了人眼看不到的东西

Scroll Prize 团队宣布,他们用完全非破坏性的方法读完了 PHerc. 1667(社区里叫 Scroll 4)——从头到尾,一列不落。

怎么做?三件事加在一起:

  1. 同步辐射 X 射线显微断层扫描——在法国格勒诺布尔的欧洲同步辐射装置(ESRF)上,用 BM18 光束线对卷轴做超高分辨率扫描。波长足够短,能分辨碳化纸莎草里几十微米厚的层。
  2. 虚拟展开——用算法把卷芯里层层叠叠的纸莎草表面重建出来,展开成可读的二维平面。
  3. 机器学习墨水检测——碳化墨水几乎和碳化纸莎草一模一样,肉眼和常规 CT 都分不出来。训练过的模型能在微米级数据里找到墨水的痕迹,然后把文字"擦"出来。

每一步都是公开的。扫描数据、重建表面、文字转录,全部以 Creative Commons 协议发布在 scrollprize.org/data。代码在 GitHub 上。你可以下载、检查、跑一遍,自己看是不是真的。

二十二列斯多葛哲学,两千年后第一次被阅读

PHerc. 1667 本来是一卷更大的卷轴——19 到 24 厘米高。十九世纪和后来 1969、1980 年代的物理打开尝试已经把外层全部毁掉了,只剩下了大约 8 厘米高的卷芯。但从这个卷芯里,研究人员恢复了 22 列文字的底部——一行不缺,连续阅读,从开头到结尾。

写的是什么?一部伦理学著作,证据指向斯多葛学派:讨论人性、冲动、道德进步。最后一列提到了一个名字——Aristocreon,大斯多葛哲学家克吕西波斯(Chrysippus)的外甥兼弟子。结合文风和主题,这把它定位到了公元前 2 世纪。

是残片,有破洞有缺字。但几段文字可以清晰地读出来——两千年后,第一次有人看到了它们。不是碎片,不是孤立的词句,是一本哲学书里连续 22 列的论述。

Scroll 1 的墨水在三维数据里直接可见了

不只是 Scroll 4。同一批研究还推进了另一个卷轴——PHerc. Paris 4(Scroll 1)。

Scroll 1 在 2023 年已经通过 ML 读了片段出来,赢得了 Vesuvius Challenge 大奖。但这次,更高分辨率的扫描让墨水在三维数据里直接可见了——不用 ML 推断,用眼睛就能在 CT 切片里找到字迹。研究者把三维数据里看得见的墨水投影回展开的书页上,和 2023 年 ML 读出的文字逐字匹配

这不是"或许对了",这是从更优质的数据出发,从一个独立的角度,证实了 ML 的读数。

Scroll 139 说出了自己的书名

更妙的是第三卷:PHerc. 139。这卷的标题页被恢复了。

它叫**《论诸神,第八卷》**(Philodemus, On Gods, Book 8)——伊壁鸠鲁学派哲学家菲洛德穆斯(Philodemus)的神学著作。菲洛德穆斯是赫库兰尼姆图书馆的主角,他的作品占据了这个图书馆的很大一部分。

读一个密封卷轴的标题,在它被打开之前就知道里面是什么。这放在二十年前是 archaeology science fiction,今天只是科技进步当中的一个 footnote。

开源竞赛长出来的科研团队

到这里我要插入一点个人看法。科学突破报道总爱聚焦终点线——论文发出来了,卷轴读完了。但 Scroll Prize 的故事里有个很少被提及的细节:

这个项目的大部分研究团队成员,最初是作为参赛者加入的

不是教授空降,不是知名实验室内部攻关。他们是在 2023 年进入 Vesuvius Challenge 的比赛平台,提交了算法创新,赢了奖,然后被招募到核心团队。Brent Seales 在 2023 年把他的实验室技术和软件开源给这个公开挑战赛,Nat Friedman 和 Daniel Gross 用捐款支撑了整个项目——然后来自全世界的参赛者推进了这个领域,从识别字母到读懂单词到读完一整卷。

一个 OpenAI 高管和一个 GitHub 前 CEO 掏钱,一个大学实验室开源,一群全球参赛者攻破一个个里程碑,最后形成一个科研团队完成最终突破。这种组织结构不需要总统令,不需要几十年国家计划——只需要一个开放数据、开放代码的竞赛和一个足够有吸引力的目标。

现在 Scroll Prize 团队下一步的目标很直接:剩下的几百卷还密封着。哲学、诗歌、散文——一整个古罗马的私人图书馆,等待被阅读。

最后:一个图书馆还埋在土里

有人可能会问:一卷两千年前的哲学残简有什么用?

我不确定"有用"是唯一正确的评判维度。这卷斯多葛文本在维苏威喷发的那天停止了被阅读——1947 年之后,有人用 X 射线和神经网络把它翻了回来。这不改变世界能源结构,不推翻任何 AI 模型的能力边界,但它做到的是一件更安静也更犯规的事:一个信号从公元前 2 世纪出发,在纸莎草上停了 20 个世纪,然后通过硅、光子和梯度下降,撞进了一个 2026 年的人的眼睛里

这些文字在 scrollprize.org 上,代码是开源的,数据可以自由下载。如果这套流程能推广到几百卷密封的书卷,那么赫库兰尼姆失去的文字就不是"被保存",而是被取回了。

毕竟,它被埋了两千年,但它从来没有真的消失过。

分享:

评论(0)

暂无评论,来写第一条吧~

发表评论