古籍凝结着祖先的智慧,是中华民族精神与创造力的历史见证。保护好古籍,挖掘好古籍的文化内涵,对传承中华文脉意义重大。
穿越漫漫的历史长河,褪色、脆化甚至腐蚀是许多古籍不得不面对的“命运”。且不论修复赶不上古籍老化的速度,即便是保存下来的古籍,也多因内容晦涩、难解难辨而长期“沉睡”于馆舍中,普通读者一般难睹其容。如何让古籍“醒过来”,与现代读者产生互动?科技是一双智慧的翅膀。
近年来,以各级图书馆为主体,社会各界积极参与古籍保护与智慧化服务,在保护古籍尽量免遭自然和人为破坏、延长其保存期限和寿命的基础上,运用新技术开发古籍保护新模式,并通过古籍数字化专项研究、古籍数字化展示等方式,让古籍逐渐走进大众视野。截至2024年9月,“中华古籍资源库”在线发布古籍影像资源超10.5万部(件)。
古籍保护和整理是第一步,要提高活化程度,需要解决古籍数据“存不住、读不懂、用不了、传不开”等问题。
国家图书馆相关负责人介绍,国家图书馆聚焦智能化、个性化服务方向,通过引入人工智能前沿技术,集成智能工具,尝试提供古籍文白翻译、提问式检索、智能推荐、图谱可视化、文本分析、知识科普等服务,让读者在阅览全文影像的同时,享受专业文献著录和内容标注服务。
有没有办法从古籍中读出历史关联或作者喜好?由上海图书馆开发的中文古籍联合目录及循证平台回答了这个问题。目前,该平台收录了1400余家机构的古籍馆藏目录,汇聚了不同来源的古籍循证研究数据上百万条,并提供古籍书目数据查询和全文影像阅览服务。读者通过大数据能发现古籍之间的关联,解答“哪位古人最爱批校题跋”“这位作者最关注谁的作品”等个性化问题。
上海图书馆馆长陈超介绍,平台从文本识别、数据生成、数字编撰、知识图谱构建、自然语言检索、智能问答等方面,全方位支持建设数字人文服务体系。“我们正在思考和谋划打造中国古籍联盟链,利用区块链技术,提供权威的古籍书目及相关数据,保护古籍全文及其相关资源,打通古籍联盟链的确权查询、链接获取乃至文献标注等各类服务,希望与更多力量共同探索古籍资源保护和智慧化服务的新模式。”陈超说。
与全民阅读工作相结合,是对延展古籍智慧化服务范围的一大探索。
在江苏南京,许多读者通过体验“食光机”感受古籍的魅力。这项由南京图书馆推出的服务,将清代文学家袁枚著作《随园食单》中的美食记载“翻译”成令人垂涎的菜肴,黄鱼和咸蛋黄炒成的“假蟹”,豆腐、虾米和小葱煎制成的“蒋侍郎豆腐”……从美食出发,读者进入了南京图书馆馆藏古籍的世界,分享古籍背后的故事,与古籍“亲近起来”。
南京图书馆开展古籍修复体验活动
南京图书馆供图
南京图书馆馆长陈军认为,强化古籍与读者的互动不仅要靠馆办趣味活动,还要加强图书馆外专业人才与图书馆阅读推广等工作的紧密互动,特别是吸引高校专家参与,加强古籍研究和推广专业人才队伍建设。
应用新技术使古籍实现可视化、互动化以达到更好的服务效果,是北京大学数字人文研究中心副主任杨浩的研究重点。他认为,图像化和文本化是活化古籍必经的两个步骤。“把一本古籍从纸页‘搬’到网页,并不是扫描一下那么简单,而是要经过识别、排序、校对、结构整理、标点、实体识别等一系列环节。机器自动识别后,还要有专人进行结果复查,尽可能精细化处理内容。”在与各地图书馆深度合作的过程中,他愈发感到,进一步提升古籍识别的准确率需要业界付诸持久努力。“我们正在吸引古籍爱好者、研究者,以众包校对、协同审核等形式,推动古籍整理项目和数据库建设,建设‘古籍图像上传—文本校对整理—标记—文本输出’的全流程系统。”杨浩说。
深耕智慧图书馆相关技术应用的汉王科技股份有限公司大模型研发中心产品总监黄岩岩认为,通过大模型等智能技术自动生成古籍信息,提高人工审核效率,再通过人工复核对数据进行评分,优化大模型,这是双向驱动的良性循环机制。“我们要面向专业领域开发大模型,基于图书馆本身已建成的词表知识库和知识图谱,最大程度减少大模型自身生成内容的‘幻觉’,最终锻炼出应对古籍查询、管理、数据流通、知识库建设等复杂场景的能力。”黄岩岩说。
“古籍保护具备良好的政策环境、技术条件、版权条件、存藏条件,堪称‘万事俱备’。我们要在实践中创造出古籍焕发新生机的‘东风’。”一位业界专家认为,以古籍智慧化整理和服务为突破口,一方面能有力推动我国智慧图书馆体系建设,一方面有助于平衡古籍“藏”与“用”的关系,拓展古籍研究深度,提高古籍传播广度,让古籍保护与活化能“与时间赛跑”。