观点 | 葛怀东:谈谈古籍数智化保护与人才培养

字号:T|T
2024-02-28 16:07 来源:古籍保护

“数智化”是近两年的一个热门话题。随着高科技的飞速发展,古籍“数智化”建设与服务有了广阔的实践基础,也有丰富的文献资源,有先进的技术支撑,有开放的理论框架。不管是馆藏单位还是高校、古籍研究利用者都极为关注古籍数字化及智能化的发展。

当前,备受关注的古籍数智化成果有哪些?还存在哪些问题?数字中国背景下,古籍数智化的未来发展如何?怎样更好地培养古籍数智化人才?针对这些问题,金陵科技学院文献保护研究所所长葛怀东进行了分享。

关于古籍数智化与人才培养的几点看法
葛怀东  金陵科技学院文献保护研究所所长

古籍数字化最开始限于录入文本、编制索引,很快进入到大规模建设数据库的时期,比如书目型古籍数据库、全文型古籍数据库和影像型古籍数据库等。当下,大数据技术的应用及基于人工智能技术的数字人文兴起,古籍数智化更侧重于对古籍文本进行深层次处理,比如自动标点、自动校勘、自动注释、语义标引、文本聚类、知识挖掘等,将转换后的古籍数字文本当作进一步加工整理的数据,通过一系列数据处理及人工智能技术开发出新的知识产品。

数字中国建设背景下,数智环境对古籍保护与传承具有巨大的实践价值与历史意义。个人认为,应将古籍保护与传承置于数字化环境中,用数智技术挖掘古籍所蕴含的文化价值、用新媒体手段展示与传播古籍的精神内核。

01几个关键与建议

首先是人才的整合。目前古籍数智化的技术要求超越了原来以个人和实体单位为主的组织方式,更多基于跨学科、跨领域、跨地域的交叉研究与系统协作,需要信息、图书、情报、计算机、统计等专业领域的学者协同创新。

其次是资源的整合。即对国家和各级馆藏机构开发的古籍类数据库进行整合,并互联开放;还可以通过众筹共建和开源共享的方式,整合建构可以提供史料存储、检索、计算、分析、传输功能的超大型古籍数据平台,让新型数据库成为文献支撑平台、技术服务平台、关联分析平台和成果发布平台。

再次,要抓紧建立起古籍数字化工作所需的标准及规范。通过分析古籍数字化工作内容,围绕古籍数字化业务活动构建古籍数字化标准体系,使古籍数字化项目在各个环节做到“有章可循”。

我认为,要形成历久弥新的中华文化,必须在古籍资源的挖掘、转化层面下功夫。只有拥有了足够丰富的数字化古籍资源,才能为现阶段大数据、深度学习、知识图谱以及数字人文等交叉领域提供特色数据支撑。同时需要适量的专业人才的支撑。因此要加强古籍保护与数字化、计算机技术、人工智能等领域学科融合发展,形成面向知识服务的新文科古籍类专业建设规范、教学标准以及产教融合等方面的顶层设计,积极推进新型古籍人才的培养。

在实践方面,现阶段也可以深化与数字人文相结合的研究,包括关联数据、知识挖掘、地理信息系统、知识组织等。通过运用命名实体识别、社会网络分析、地理信息系统、虚拟现实及其他数字人文技术对古籍数据进行深度的加工、挖掘、可视化。

对于古籍数字化资源的公益性应用方面,要梳理面向公众开放的数字化资源公益性开发与利用情况,探讨古籍数字化资源公益性开发与利用在资源类型、技术工具、服务平台、公益性开发内容、公益性利用效果、公众利用反馈等方面存在的问题与解决的方案。
 

02探索与展望

古籍数字化的未来是整合与服务,要积极探索共建共享途径,持续加大古籍数字资源建设和发布力度,通过建设全国智慧图书馆体系,不断改进服务质量、提升服务水平,构建中华传统文化知识核心和文化共同体,实现中华珍贵典籍的跨时空传播。

要探索新的知识组织方式,如文本分层存储、关联查询,以及权限控制、格式转换、分类聚类等功能,使文本库能随时录入数据,追加新版本和内容,自动查重、排序及索引,实时更新和维护;能接受在线校勘,建立知识库的修改—审核机制,借助区块链技术等保留每一次改动的痕迹。

要鼓励创建文理交叉的人文计算或数字人文实验室,倡导各机构和图书馆使用异地存取方式在数字资源建设上共建,在资源利用上实现共享。鼓励跨界协作,建设自有知识产权的 CBDB、CHGIS 等基础设施。

要服务于公众普及需求与学者专业需求。不仅采用虚拟技术、跨时空工具和场景等让公众了解古籍,而且提供古籍相关研究的发展趋势、历史演变、研究热点等信息,让古籍学术研究具有交互性和过程性,实时进行学术交流和探索,形成各种古籍学术共同体和通用知识成果。
 

03人才培养目标与举措

古籍数字化人才属于文科技能型人才,具体表现为三个目标:

一是价值目标,包括习近平新时代中国特色社会主义思想、社会主义核心价值观以及科学精神、人文情怀、国家使命感、国际视野、探索与创新精神等。

二是知识目标,即不仅掌握古籍整理与保护通识知识、专业基础知识,还需要学习古籍再生性保护学科前沿知识、行业发展趋势等。

三是能力目标,即不仅能够掌握古籍数字化相关技术,具备运用有关技术手段对古籍文本资源进行数据加工、数据挖掘、开发其文化价值的能力,而且能够具备沟通协调能力与探究式学习能力等。

最后,要基于“价值”“知识”“能力”等三大要素构建“三位一体”的文科技能型人才培养目标体系

,需要做到四个“围绕”:

围绕培养目标明确古籍数智化职业岗位能力。古籍数智化跨学科、跨领域的特点鲜明,涉及古籍著录、分类标引、文本识别、检索利用、网络传播与共享等众多环节的系统工程。

围绕职业岗位能力设定古籍数智化教学内容。古籍数智化人才培养的课程设置建议以文化遗产保护与传承为导向,要拓宽专业口径鼓励跨学科、跨专业学习调整和优化课程结构,加强学生综合能力的培养,使古籍数智化人才既具备较宽的知识面和扎实的基础,又能融会贯通文史知识且具有实际操作技能。

围绕古籍数智化作业流程构建课程群体系。古籍数智化加工的课程群体系主要围绕三个方面开展,一是从业务流程的角度讲解古籍数字化的基本原理、基本方法和作业过程;二是从系统平台的角度讲解系统性、规范化的古籍数据库项目的开发与利用;三是从信息技术发展的角度讲授一些新技术和新方法的应用,这样既有助于开阔学生视野和培养创新意识,又可以很好地适应古籍信息资源建设的需要。

围绕课程群设置选择产教融合的教学模式和方法,深化产学研协同育人机制。将产教融合贯穿人才培养全过程,并启动更高水平、更宽领域、更深层次的校企合作,构建产学合作的开放办学新格局。同时,高校要积极与企业建立产学研联盟,优化合作机制,驱动产学研双方合作由实践实习合作转向协同研究、协同创新、协同育人的更深入合作。

三亚市博物馆·公益 三亚市西河西路2号文体大楼三楼 0898-88666125
Copyright ©三亚市博物馆·公益 琼ICP备19004074号-1
  • 三亚旅文