来源:环球Tech

原标题:【写意中国探寻汉字起源】安阳的这所学院有个梦想,让全世界的甲骨文“数字回归”

【环球网文化频道 记者 代玉】安阳是甲骨文的故乡、中国文字的发源地。2月17日,记者跟随“写意中国——探寻汉字起源”网络主题宣传活动走进安阳师范学院,这里拥有国内唯一的甲骨文信息处理教育部重点实验室和文博考古与信息化处理跨学科人才创新团队,致力于以人工智能技术“破译”甲骨文,向我们传递三千多年前古人文字里的讯息。

“殷契文渊”——甲骨文大数据平台首页截图

甲骨文是迄今为止中国发现的年代最早的成熟文字系统,殷墟甲骨的发现使只存在于典籍中的商代被证实为信史。甲骨文发现120余年来,甲骨学研究者遍布中国、美国、日本、韩国、加拿大等数十个国家,成为认知中国早期历史和古代文明的重要工具。

2017年,甲骨文入选“世界记忆名录”。2019年,安阳师范学院甲骨文信息处理教育部重点实验室完成的“殷契文渊”——甲骨文大数据平台正式发布,该平台从上线之日起免费对全世界提供服务,为甲骨学研究提供大数据支持,也标志着甲骨学研究进入智能化时代。

“数据中心总共有37台服务器,每一秒都不停地为世界提供服务。”甲骨文信息处理教育部重点实验室主任刘永革教授告诉环球网文化记者,有一次学校意外停电,立刻就有美国的学者打电话来,着急地询问为何访问不了数据平台,“国外专家非常需要使用我们的甲骨文研究数据”。 

刘永革介绍,实验室的工作内容主要采集甲骨文拓片、摹本、著录以及甲骨实物等数据,并对甲骨文语义、语法、字形、数据挖掘研究。目前平台数据库中包括著录152种,种类数量为世界最多;收录甲骨文字型4300多个,甲骨文研究文献3万多篇。

作为汉字的源头和中华优秀传统文化的根脉,对于甲骨文的研究中,考释和缀合是公认的重点和难题。实验室核心的大数据工作正是“缀合”。如何把成千上万的甲骨文碎片上的数据拼合起来,形成上下文的连接,能够读懂甲骨上记录的内容?刘永革带领团队研发了甲骨文自动缀合系统,目前缀合数据库已收录6956条数据,已经缀合34组甲骨碎片,开创了甲骨文研究的新局面。

与此同时,他表示,实验室的终极目标是实现甲骨文的“图形检索”,即用计算机人工智能图像识别系统,直接检索甲骨文拓片上的甲骨文,这将为全球的甲骨文研究学者及爱好者的甲骨文资料查询带来极大便利,“我们正在一步步向这个目标靠近”。

据了解,自殷墟刻辞甲骨发现以来,甲骨文字骨先后出土了16万片左右,“除了我国博物馆里的收藏,在安阳民间也收藏有大量甲骨文字骨,民间的甲骨文也将是重要的数据。在世界很多地方也收藏了数量不等的甲骨片。”刘永革说。

“用超级显微镜把甲骨上的文字放大500倍,你会看到3000年前文字的刻画。”自2000年研发甲骨文输入法开始,刘永革潜心甲骨文信息化处理工作二十余年。他动情地说,三千多年前我们就有了成熟的文字(甲骨文),这是西方文明所没有的。在信息化的今天,用科技考古的方式、科技影像的手段,把甲骨文的信息采集保留下来,十分必要,“最大的梦想就是让全球的甲骨文‘数字回归’”。

作为安阳人,刘永革感到自豪,“甲骨文是安阳的一张亮丽名片,我们面向全世界免费开放甲骨文大数据平台,也通过全球甲骨文研究者、爱好者的数据使用,推广中国优秀传统文化。”他表示,如今“殷契文渊”甲骨文大数据平台早已可以使用手机轻松访问,今年实验室与合作伙伴联合打造的“了不起的甲骨文”微信小程序,亦将于“谷雨祭仓颉”这个日子面向全球发布,希望借助科技的力量让更多的人爱上甲骨文,感受中华古老文明的永恒魅力。

海量资讯、精准解读,尽在新浪财经APP