2019-04-02 15:16:05 来源:参考消息网 责任编辑:孙之冰
核心提示?#39608;?#26102;光机器”项目的目的是制造一种类似谷歌的搜索引擎,并且该引擎的搜索范围将跨越欧洲2000年的历史。

参考消息网4月2日报道 美媒称,科学家用人工智能(AI)和X射线解密古代社交网络。

据美国?#35835;?#32447;》月刊网站3月21日报道,卡塔?#31216;?#23045;·萨沃纳里奥的遗嘱在威尼斯国家档案馆保存了650多年,从未有人读过它。学者们不明白,为什么这份?#20174;?351年的文件从未被打开过?

但对物理学家福齐亚·阿尔贝廷而言,这份6页纸的文件正好适合做实验。

阿尔贝廷目前在意大利的恩里科·费米研究?#34892;?#24037;作。她希望不解封这份遗嘱而读取其内容,她的办法是利用X光透视。在2017年的一次演示中,阿尔贝廷和她的团队用X光照射这份文件,以此方法为其中的文本拍照。然后,利用一些算法,他?#19988;?#25968;字手段展开这6页纸,从而清晰地重制其中的?#20013;?#21333;词。

他们尚未完全弄清楚这份文件的内容。阿尔贝廷说,萨沃纳里奥使用了一种旧的意大利语形式,与他们合作的档案官员还在解读这种语言。但这一?#38469;?#24212;该可以帮助历史学家在不损害物品本身的情况下研究文本。阿尔贝廷说:“另外阅读这份遗嘱的唯一途径是将它剪开。”

跨越欧洲2000年历史

阿尔贝廷正在参与一个称为“时光机器”的项目。该项目的目的是制造一种类似谷歌的搜索引擎,并且该引擎的搜索范围将跨越欧洲2000年的历史。

洛桑联邦理工大学的计算机科学家弗雷德里克·卡普兰说,为了做到这一点,研究人员计划对欧洲各个城市的档案文件进行数字化处理,并将它们纳入一个数据库。卡普兰将领导“时光机器”项目的合作事务。卡普兰认为,最终历史学家可以利用阿尔贝廷的X光?#38469;?#22312;一个自动化程度很高的过程中扫描大量未打开的大部头书。然后,他们可以将这些扫描结果输入卡普兰团队正在开发的一个由人工智能推动的文本识别算法中。该算法将自动把有关文本送入一个数据库。

VCG41135627372

图片来源:视觉中国

“时光机器”不只是时髦的应用。它巨大的数据库将?#32654;?#21490;学家在更长的时间跨度和更大的地理范围中研究社会组织模?#20581;?#35813;项目是过去几年来一种新趋势的一部分。近几年,有越来越多的历史学家试图使用数据科学来从旧文本中发掘新信息。奥地利科学院的历史学家约翰内斯·普赖泽尔-卡佩勒说,当历史学家为他们的科研项目申请研究基金时,“你要建立一个数据库并做一些网络分析,这几乎是一个必要条件”。

例如,莱顿大学的历史学家茜尔德·德韦尔特和她的团?#21491;?#32463;建造了一个工具。该工具会在数字化的中国?#32479;?#40092;文本中自动标记人名、地名和时间。他?#19988;?#32463;设计了数据库,这样它可以同地图绘制软件相连,以便更容?#23383;?#35266;地展示人如何在时空中移动,以及思想如何在时空中传播。

数据科学防止“择优挑选”

这种基于数据的方法可以就过去提供一种新鲜的视角。普赖泽尔-卡佩勒说,传统?#24076;?#21382;史学家使用叙事来理解过去,并把他们的重点放在“大人物和重要地方”上。这种框架可能导致“择优挑选”,这样学者们只会?#24247;髦?#25345;他们叙事的案例。他说,在历史研究中,择优挑选依然经常发生。

数据科学会部分地防止这种主观性。普赖泽尔-卡佩勒说:“如果你系统地搜集证据并将它们放进一个数据库,你会摆?#35328;?#20248;挑选。”这可以?#32654;?#21490;学家避开占支配地位的叙事。例如,普赖泽尔-卡佩勒绘制了一些网络来识别拜占庭帝国文件中的重要角色。这些人在对这些文件的初步阅读中显得并不起眼。他说:“他们不是最容易受到关注的人。但他们总是存在于背景中,将各个人群联系起来,而本来这些群体可能不会被联系起来。”

凡注明“来源:参考消息网”的所有作品,未经本网授权,不得转载、摘编或以其他方式使用。