在古老的罗马帝国,铭文如繁星般点缀在历史的长河中,它们或刻在宏伟的纪念碑上,或涂鸦于市井巷陌,既有政治宣言的庄严,也有情诗的婉约,更有商贸往来的记录。这些文字碎片如同历史的密码,为现代学者解锁了那个时代的日常生活与文明背景。然而,岁月的侵蚀与人为的破坏,让许多铭文变得残缺不全,字迹模糊甚至被蓄意抹去,使得解读这些古老文字成为一项艰巨的挑战。缺乏足够的背景信息,让学者们难以恢复、鉴定和定位这些文本的年代,几乎将这一领域的研究推向了困境。
为了突破这一瓶颈,谷歌DeepMind团队研发了革命性的“Aeneas”模型,这是全球首个专门针对古代铭文进行上下文解读的人工智能工具。Aeneas的问世,为历史研究带来了划时代的突破。传统上,历史学家需要依赖深厚的专业知识和海量的资源,通过寻找文本之间的相似性——即所谓的“平行文本”——来解读铭文。这一过程不仅耗时费力,而且往往受限于个人视野和资料获取的局限性。而Aeneas则能够通过处理数以千计的拉丁铭文,在短短几秒钟内提供相关的文本和上下文平行例证,极大地加速了研究进程,为历史学家提供了前所未有的助力。
Aeneas的强大之处不仅在于其处理拉丁文的能力,更在于其广泛的适用性。该模型可以轻松扩展到其他古代语言、文字和材料,如纸莎草文、古希腊铭文以及古代货币上的文字,进一步拓宽了历史研究的边界。其多模态输入能力更是令人惊叹,能够同时处理文本和图像信息,从而更准确地判断铭文的地理来源,为历史地理学研究提供了新的视角。
Aeneas的先进性还体现在其强大的文本恢复功能上。它能够识别并填补长度不确定的文本缺口,甚至在对历史文本的恢复和预测方面设立了新的基准。为了训练Aeneas,研究团队整合了来自多个权威历史数据库的数据,包括罗马铭文数据库、海德堡铭文数据库等,最终创建了一个包含超过176,000条古罗马铭文的拉丁铭文数据集。通过这种方式,Aeneas能够高效地识别、分类和解读铭文,为历史学家的研究提供了强有力的支持。
在一项针对23位历史学家的评估中,参与者们使用Aeneas进行铭文的恢复、鉴定和年代定位研究。结果显示,当历史学家结合Aeneas提供的上下文信息与模型的预测时,取得了最佳的研究成果。许多参与者表示,Aeneas不仅加速了他们的工作流程,更提高了他们对复杂铭文任务的信心和准确性。这一工具的出现,无疑为历史研究注入了新的活力,让学者们能够更深入地探索古代文明的奥秘。
项目链接:https://deepmind.google/discover/blog/aeneas-transforms-how-historians-connect-the-past/
划重点:
🔍 Aeneas模型由谷歌DeepMind推出,旨在帮助历史学家理解古代文本。
🗣️ 该模型能够分析古代文本的相似性,填补文本空白,减轻历史研究者的负担。
📜 Aeneas将文本转化为“历史指纹”,帮助历史学家在更广泛的背景下解读铭文。