投稿问答最小化  关闭

万维书刊APP下载

马学良:数字人文时代古籍数字化的几个关键问题

2023/4/18 9:44:39  阅读:173 发布者: 来源:

作者:马学良(国家图书馆副研究馆员)

——————

习近平总书记说: “中华优秀传统文化积淀着中华民族最深沉的精神追求,代表着中华民族独特的精神标识,是中华民族生生不息、发展壮大的丰厚滋养,是中国特色社会主义植根的文化沃土,是当代中国发展的突出优势。” 而中华优秀传统文化的物质载体,就是我们这组专题的核心关键词——古籍。

从历史的长河来看,在典籍整理的基础上进一步利用文献(修纂新的图书),本身就是我们中华优秀传统文化传承和发展的一种方式。比如,自汉代刘向、刘歆父子整理汉代官府藏书开始,历朝历代都会进行大规模的典籍整理、修纂活动。这样,一方面清点、整理了国家藏书,另一方面也往往为形成新的文献奠定了基础,前者如汉朝的《别录》 《七略》,晋朝的《晋中经簿》,隋朝的《开皇四年四部目录》,唐朝的《群书四部录》《古今书录》,宋代的《崇文总目》《中兴馆阁书目》,明代的《文渊阁书目》,清代的《四库全书总目》;后者如汉代的《熹平石经》,宋代的《太平广记》《太平御览》《文苑英华》《册府元龟》,明代的《永乐大典》,清代的《四库全书》《古今图书集成》等皆属此类。

古籍数字化是古籍整理在信息时代的具体方式之一,因此,做好古籍的数字化,是关系到传承发展好中华优秀传统文化、延续中华文脉、增强国家文化软实力的重大战略任务。随着信息处理技术逐步向人文学科的渗透,数字人文成为当下炙手可热的研究领域,受到了文学、历史学、社会学、艺术学、信息管理等几乎所有人文社会学科的重视。在这种背景下,进一步做好古籍数字化,其意义是显而易见的,因为古籍数字化是我们借助数字技术及方法来对古籍内容进行数据统计、信息发现和知识挖掘的前提与基础。换言之,古籍数字化既是数字人文赖以发展的基础,也是我们在数字时代继续传承发展中华优秀传统文化的基础。

事实上,我国古籍数字化的实践很早就开始了,大概始于20世纪80年代,经过了四十余年的发展历程,我国的古籍数字化已经取得了很多值得肯定的成绩,也为传承发展中华优秀传统文化作出了很大的贡献,这是大家有目共睹的。但是,在数字人文背景下,今后古籍数字化继续开展,我认为有两个方面值得注意:

首先,数字人文背景下,今后的古籍数字化更应注重统筹规划。古籍数字化经历了四十年的发展历程,确确实实积累了很多的数字化成果,如早期台湾地区开发的《全唐诗》《全宋词》网络版,国家图书馆推出的“碑帖菁华”“西夏碎金”“敦煌遗珍”等数据库,到近年来北京大学主持完成的二十五史研习系统、“中国基本古籍”数据库、《全唐诗》分析系统、《全宋诗》分析系统等,国家图书馆主持完成的《赵城金藏》、“中华再造善本库”等;尤其是国家古籍保护计划实施以来,“中华古籍资源库”的推出,国家图书馆联合天津图书馆、云南图书馆等古籍收藏单位,发布了总量约 10万部(件)的数字古籍,极大地方便了学者利用古籍开展学术研究。但是,我们也应该看到,在古籍数字化领域我们一直以来秉持的是“边建设、边服务”的原则,所以学术界亟需的资源以及各收藏单位的特色馆藏被数字化的多,这就造成目前各家已经实现数字化的古籍中,存在着大量的重复建设,而相当一部分古籍,尤其是读者使用率不高、未被列入特藏资源的那部分古籍,往往没有得到数字化。相对于我国的古籍总量而言,即超过 25万个品种,版本不少于 50万个,总数超过 5000万册(件),尚未数字化的比例仍然很大。这就需要我们统筹规划今后的古籍数字化工作,减少重复建设,尽量逐步实现现存古籍的全面数字化。当然,所谓的全面,只能是个理想状态,但是避免重复劳动,将更多尚未数字化的古籍实现数字化,则是可期的。从传承发展中华优秀传统文化的角度来说,当然需要全面发掘我们的古籍资源;从数字人文研究发展的角度来说,也需要更多古籍资源的数字化,因为这是数字人文研究的基础工程。

其次,数字人文背景下,古籍数字化更应注重古典学人才的作用。毋庸置疑,数字人文已经成了当下的“显学”,似乎在人文社科领域,如果自己的研究不与数字人文沾点边,就是落伍了。但是,诚如陈力老师所指出的: “在古籍数字化、数字人文研究中,计算机终究只是辅助研究工具,并不能完全替代人的大脑”,我认为,在数字人文背景下的古籍数字化,计算机非但不能完全替代人的大脑,而且高质量的数字人文项目,往往还要充分发挥人的作用,尤其是古典学人才的作用。

在前数字人文时代,古籍数字化只需要忠实地反映古籍的本来面貌即可;而数字人文背景下,因为要实现对古籍文本的深度处理,如数据统计、信息发现、知识挖掘以及可视化呈现等,这就需要对古籍进行细颗粒度的、科学的标引,建立起一个庞大的“古典知识库”,来帮助计算机识别具体的人名、地名、书名、事件、时间等信息,乃至引文的起讫位置等。而这些恰恰是计算机无法独立完成的,需要由古典文献学、古代文学、古文字学、古代史专业的学者去参与。

在这方面,民国时期洪业先生领导的哈佛燕京学社引得编纂处,就是很好的榜样。自20世纪30年代始,洪业领导下的引得编纂处采用西方现代科学方法,有计划、成系统地对中国典籍进行索引式的整理,先后编纂出了涵盖经、史、子、集四部的64种引得(即索引),这些引得因书制宜,既有逐字索引、书名(或篇名)索引、人名索引,也有包含人名、地名、书名、典章制度、术语、事项等凡是有实际参考价值的关键词语综合索引。这些引得学术价值很高,出版后受到了学术界广泛重视。其成功的根本原因,就是引得编纂处主任洪业所选取的参与引得编纂的主力,都是当时从事古典学研究学有专长的学者,如宋史研究专家聂崇岐参与了《艺文志二十种综合引得》 ,毕业于燕京大学历史系的李书春参与了《太平御览引得》《食货志十五种综合引得》《唐诗纪事著者引得》的编纂,在先秦史和世界古代中世纪史研究方面造诣颇深的齐思和则参与了《庄子》《墨子》《荀子》引得的编纂。

哈佛燕京学社汉学引得丛刊的成功告诉我们,今天在数字人文背景下建设古籍语料库,必须加大引入具备古代文化知识的学者深度参与,由他们来建设高质量的古典知识库,才能为数字人文的进一步开展奠定基础。

——————

转自:“珞珈文化研究”公众号

链接:

https://mp.weixin.qq.com/s/pw52zwoZEOXp298w5zCV_Q

转自:“学术痴”微信公众号

如有侵权,请联系本站删除!


本文评论

暂无相应记录!

首页<<1>>尾页共0页共0条记录
  • 万维QQ投稿交流群    招募志愿者

    版权所有 Copyright@2009-2015豫ICP备2021036211号

     纯自助论文投稿平台    E-mail:1121090112@qq.com;eshukan@163.com