深度学习在文物病害相关研究中的应用现状、趋势与挑战

字号：T|T

2026-06-25 10:03 来源:文物保护与考古学科

摘要

文物承载着深厚的历史价值、艺术价值与科学价值。保护与传承好文物及其背后蕴含的价值，是当代文物保护工作者面临的巨大挑战。然而，因文物具有的复杂性、多样性与珍贵性等特性，对其病害的识别、量化统计、发展预测与虚拟修复等应用存在效率低下、自动化与智能化水平不足的问题，常规的数据处理技术难以应对文物数据的非线性与多样性特征，限制了其在复杂场景中的应用。深度学习作为一种新兴技术，为解决以上问题提供了新的途径。通过聚焦2017—2024年间深度学习在文物病害相关研究领域的应用，基于文献计量学的方法梳理其阶段性发展特征与趋势，明确该领域的研究热点。结果显示，2020—2024年为该领域研究快速增长期，相关主题文献数量呈显著上升趋势；地域贡献方面，中国与意大利的学术影响力及贡献度尤为突出；数据源方面，数字图像是核心支撑，包含丰富物质与结构信息的光谱、射线成像数据亦成为研究重点；模型应用上，卷积神经网络与生成式对抗网络为常用模型；应用对象方面，深度学习技术已覆盖文物建筑、书画、壁画、陶质彩绘、石质文物等多种文物类型。在此基础上，从四个方面，探讨了相关研究领域中的主要挑战与发展方向：在数据层面需要关注样本的质量与数量；在模型层面需要提高模型的性能与可解释性；在应用层面需要扩展至病害机理分析与劣化预测等方面；在标准规范方面需要建立统一行业标准体系。本文可为相关领域后续研究提供理论依据与实践参考，助力文物保护智能化水平提升。

0 引言

文物承载着深厚的历史价值、艺术价值与科学价值，是研究人类社会发展的重要物质载体。在文物保护实践中，文物病害的识别、统计、劣化预测及其虚拟修复是核心工作内容，是文物保护工作的基础，直接决定了文物保护工作的针对性、准确性、高效性与科学性。然而，文物尤其是其病害数据通常呈现复杂性和多样性特征，传统数据处理算法的局限性日益显现。首先，传统算法通常依赖于固定的规则，难以应对文物非线性和多样化的数据特征；其次，在处理大规模数据时效率较低，传统算法无法满足保护中实时性和高效性的需求。最后，传统算法在自动化和智能化水平上的不足，也限制了其在保护复杂场景中的应用。

随着技术的不断发展，人工智能（artificial intelligence，AI）作为模拟、扩展和增强人类智能的综合性技术领域，涵盖了推理、感知、决策、学习等多样化任务。机器学习（machine learning，ML）作为AI的重要子领域，通过从数据中自动学习规律来完成特定任务，核心思想是通过构建数学模型，从历史数据中提取特征并推断出潜在规律，从而实现对新数据的预测或决策；而深度学习（deep learning，DL）则是机器学习的高级分支，通过模拟人脑神经网络的层次化结构，能够自动提取复杂数据的多层次特征，尤其在处理图像、语音等非结构化任务方面表现出色。

在此背景下，深度学习作为近年来推动AI快速发展的核心驱动力之一，为文物数据尤其是其复杂病害相关数据的智能化处理提供了全新的解决方案。例如深度学习可以通过分析相关数据，对文物破损或者病害区域进行虚拟修复^[1-3]，也可以自动识别文物病害、进行劣化评估等，提高工作效率^[4-6]。相比传统算法，深度学习在处理非线性问题、实现高效自动化以及适应多样化场景方面具有显著优势。因此，将深度学习应用于文物病害的相关研究中，不仅能够提升工作的效率和质量，还能为文物的可持续利用提供新的可能性。

通过系统性地探讨2017—2024年间深度学习在文物病害研究相关领域中的阶段性发展特征，并分析该领域的研究热点与趋势，期望为深度学习在该领域的应用提供理论支持和实践指导，推动文物病害相关研究的技术创新与发展。

1 文献计量分析

1.1 资料与方法

为了全面分析深度学习在文物病害研究中的应用趋势，英文文献来源于Web of Science（WOS）的核心库，涵盖了SCI-Expanded（Science Citation Index Expanded）、SSCI（Social Science Citation Index）和AHCI（Arts & Humanities Citation Index）三大子库；中文文献来源于中国知网（China National Knowledge Infrastructure，CNKI）。为了保障检索范围的准确性，WOS英文文献检索策略为（主题=（"machine learning" OR"Deep learning"）AND（"cultural heritage" OR"historical cultural heritage"OR"cultural relics" OR"Heritage"）AND（（"disease" OR"damage" OR"defect"）OR（"deterioration" OR"degradation"）OR（"material"））），检索年限范围为2015—2024年，WOS检索经去重获得125篇有效题录数据，年限范围覆盖2017—2024年。中国知网的检索策略为（主题=（‘遗产’+‘文物’+‘古迹’+‘文化遗产’）*（‘机器学习’+‘深度学习’）*（‘病害’+‘损伤’+‘缺陷’+‘劣化’+‘退化’+‘材料’）），检索年限范围为2015—2024年，并添加知名领域学者文献，经去重获得73篇有效题录数据，年限范围覆盖2017—2024年。

采用文献计量学方法对相关文献进行整理和定量分析，数据分析软件为Endnote 21.5、HistCitePro 2.1以及CiteSpace 6.4.R1。其中，Endnote 21.5用于分析年发文量；HistCitePro 2.1用于分析各国文章发表数量统计；CiteSpace 6.4.R1用于分析学者合作网络以及关键词。

1.2 发文量与作者分析

基于Endnote 21.5分别对WOS和CNKI索引数据库中有关深度学习在文物病害相关领域研究的有效题录数据进行年份统计，获得了相关文献的年发文量变化趋势（图1）。通过数据分析可以得出以下结论：从总体趋势来看，该研究领域的发展可划分为两个主要阶段：1）2017—2020年为发展阶段，期间年发文量增长相对平缓，表明该领域处于探索和积累期；2）2020—2024年为快速增长阶段，相关主题文献数量呈现显著上升趋势，显示出该研究领域已进入快速发展期。

图1 深度学习在文物病害相关研究中的文章年发文量（数据来自WOS和CNKI检索）

Fig.1 Annual number of articles published on the application of deep learning in research related to cultural relic diseases （data from WOS and CNKI searches）

值得注意的是，在WOS和CNKI索引数据库中，深度学习在文物病害相关研究领域的文章发文量呈现出高度一致的增长趋势。这一现象表明，尽管不同数据库的文献在数量上略有差异，但该研究领域的关注度和研究热度在全球范围内同步提升，文物病害相关研究的智能化发展已经形成国际共识。

基于WOS题录数据，利用HistCite进行统计分析，发文量排名前10的国家如表1所示。数据显示，中国在相关研究领域的发文量位居全球第一，共计62篇，占比约49.6%，其总被引次数（total global citation score，TGCS）为324，位列第二。意大利紧随其后，发文量占比约14.4%，但其TGCS高达492，位居全球第一。其他发文量较多的国家依次为英国、印度、美国、西班牙、法国、德国、加拿大和葡萄牙。这一结果表明，中国和意大利在该研究领域具有显著的学术贡献与影响力。中国在发文量上的领先地位体现了其在该领域的研究活跃度，而意大利的高被引次数则反映了其研究成果的广泛认可与学术影响力，其他国家的表现也表明，深度学习已发展成为该领域的全球性学术议题。

表1 WOS索引下各国文章发表数量统计

Table1 Statistics of the number of articles published by various countries under the WOS index

针对WOS题录数据，基于CiteSpace生成了作者共现图谱（图2）。从图2可以看出，深度学习在该领域已形成多个具有代表性的学术团队。中国团队如澳门科技大学团队基于深度学习模型，成功实现了对古代建筑外墙灰砖、青瓦、黏土瓦等损坏类型的精准识别^[7-8]；故宫博物院与中国科学院空天信息创新研究院团队采用卷积神经网络（convolutional neural networks，CNN）与U-Net模型的融合架构，针对书画文物病害区域的虚拟修复技术进行了深入研究^[9]；同时，故宫博物院与北京理工大学联合研究团队同样基于CNN与改进的U-Net模型，在文物CT数据的智能分割研究方面取得了重要进展^[10-11]；北京建筑大学团队专注于壁画病害检测、虚拟修复、石质文物病害识别等方面的研究^[12-14]。与此同时，国外研究团队在相关研究中也取得了显著进展，例如Andrea Cevasco团队对遗址的滑坡敏感性进行了深入研究，为遗址保护中的灾害预防提供了科学依据^[15]；Praveen Kumar和Varun Gupta团队利用U-Net、CNN和成对抗网络模型（generative adversarial networks，GAN）等网络，在受损艺术品虚拟修复领域做出了重要贡献^[16-18]。通过分析学者合作关系，可以清晰地看到各团队的研究方向与贡献，为未来跨团队合作与技术融合提供了有益参考。

图2 学者合作网络（来自WOS检索）

Fig.2 Scholar collaboration network （from WOS index）

1.3 关键词与研究热点分析

1.3.1 关键词分析

关键词分析是快速把握研究领域主题脉络与热点的有效方式之一。基于WOS题录数据和CNKI题录数据，运用CiteSpace可视化分析工具对领域研究关键词开展共现分析，生成关键词共现图谱（图3和图4）。图谱中每个节点对应一个关键词，节点的半径大小与关键词出现的频次呈正相关：半径越大，表明该关键词的出现频次越高。

“深度学习”与“机器学习”是相关文献中出现频次最高的关键词。从文献计量分析结果来看，WOS题录数据中，“损伤监测”“文化遗产”“计算机视觉”“图像”“网络”等词汇高频出现；而CNKI题录数据中，高频关键词则主要分布于“无损检测”“特征融合”“图像处理”“图像修复”“病害”“壁画”以及“图像分类”等，显示国内相关研究聚焦于图像处理方面。

图3 关键词共现图谱（来自WOS检索）

Fig.3 Co-occurrence map of key words （from WOS index）

图4 关键词共现图谱（来自CNKI检索）

Fig.4 Co-occurrence map of key words （from CNKI index）

基于WOS题录数据，利用CiteSpace工具对研究关键词进行逐年分析，生成关键词演进图谱（图5）。从图5中可以清晰地看出研究热点的演变趋势：

1）2017年，研究主要集中在“深度学习”和“卷积神经网络”，体现了早期对文物病害处理方法的探索。

2）2019—2020年，关键词扩展为“建筑”“病害检测”“退化”和“图像填补”等，反映了研究逐渐向文物病害检测与修复方面发展，更多研究人员开始关注具体的文物类型和应用场景。

3）2021—2022年，关键词进一步丰富，包括“裂纹检测”“计算机视觉”“R-CNN”“分类”和“识别”等，表明深度学习技术在文物保护中的应用逐渐深化，尤其是在病害识别、监测与分类领域。

4）2023—2024年，关键词聚焦于“网络”“无损测试”“图像分割”和“虚拟修复”等，体现了研究向更精准、更高效的无损检测与智能化分析方向发展。

图5 关键词演进图谱（来自WOS检索）

Fig.5 Keyword evolution map （from WOS index）

1.3.2 研究热点分析

为系统梳理深度学习在文物病害研究领域的核心关注方向，本节从数据源、模型和应用领域三个维度构建研究框架，对筛选的125篇英文文献和73篇中文文献进行分析，系统剖析该领域的关注焦点与探索方向。

1）数据源。已公开基于深度学习在文物病害及其相关研究方面的数据源主要可分为数字图像数据、三维点云数据、高光谱数据、红外数据和其他类型数据。其中数字图像数据占比为62.12%（123篇），三维点云数据占比为10.61%（21篇），高光谱数据占比为10.10%（20篇），红外数据占比为3.54%（7篇）。其他数据类型则包括了不可移动文物易损性的指标数据、化学成分数据、计算机断层扫描（computed tomography，CT）数据、拉曼光谱数据、太赫兹数据等，占比为13.64%（27篇）。总体来说，数字图像已成为相关研究中的主要数据源，其优势在于数字图像能够高精度记录文物的大量细节信息，包括色彩、纹理及形态等特征，对于识别文物病害（如裂纹、空鼓、生物侵蚀等）、劣化进程的定量评估以及研究材料老化规律具有重要的研究价值，同时带有大量物质与结构信息的光谱分析与射线成像数据也成为该领域的研究重点。

2）模型。在该领域使用到的深度学习模型主要包括支持向量机（support vector machine，SVM）（7.07%）、随机森林（random forest，RF）（3.54%）、卷积神经网络（convolutional neural networks，CNN）（62.12%）和生成式对抗网络（generative adversarial networks，GANs）（16.67%）。其中，CNN网络中的U-Net、YOLO（You Only Look Once）和R-CNN（region-based convolutional neural networks）模型使用较多。SVM和RF常用于分类，GAN常用于文物虚拟修复。

3）应用领域。深度学习在文物病害相关研究中的应用已覆盖多种文物类型，主要包括文物建筑、书画、壁画、陶质彩绘文物以及石质文物等。其中文物建筑占比为31.82%，书画占比为18.18%，壁画占比为13.13%，陶质彩绘文物和石质文物占比均为5.05%。同时，还涉及到纺织品^[19-22]、贝叶经^[23]、陶瓷^[24-27]和青铜器^[28]等文物类型。

在针对文物建筑的相关研究中，主要研究文物表面损伤的自动识别^[29-34]、城墙砌体损伤识别^[35-36]、砖瓦损伤识别^[7，37]以及建筑遗迹的风格类型识别^[38]等方面（图6^[37]和图7^[36]）。

在书画类文物中，研究主要集中在文物的病害识别^[39-40]、褪色文字识别^[41]、受病害影响的彩绘线稿提取^[42]、历史年代的确定^[43]以及虚拟修复^{[3，9，16-17]}等方面（图8^[40]、图9^[41]和图10^[9]）。

图6 历史建筑的砖块分割^[37]

Fig.6 Segmentation of historical building bricks

图7 建筑墙体损伤识别^[36]

Fig.7 Identification of building wall damage

在壁画类文物的研究中，学者们主要聚焦于以下几个方向——病害污渍识别提取^[44-46]、受病害影响的彩绘线稿提取^[42]以及虚拟修复^[47-52]等方面，相关成果如图11^[44]和图12^[47]所示。在陶质文物研究中，重点则在于碎片分类与拼接^[53-54]、虚拟修复^[55-57]等方面，具体内容可参见图13^[56]。此外，部分学者还对青铜病害以及铸造模具分割进行了研究^[11，28]，相关研究结果如图14^[11]所示。

图8 书画病害识别^[40]

Fig.8 Identification of diseases in calligraphy and paintings

图9 褪色文字识别^[41]

Fig.9 Faded character recognition

图10 绢本画霉菌病害区域虚拟修复^[9]

Fig.10 Virtual restoration of mold disease regions in silk paintings

图11 壁画脱落区域识别^[44]

Fig.11 Mural peeling area recognition

图12 壁画病害区域虚拟修复^[47]

Fig.12 Virtual restoration of damaged mural regions

在石质文物中，研究则侧重于风化和损伤类型识别^[32，58-60]、空心退化^[61]等（图15^[59]）。此外，还有部分研究类型为遗址，如土质遗址的损伤评估与识别^[62-64]、受灾害影响遗址的识别^[5]等（图16^[64]）。

图13 兵马俑虚拟修复^[56]

Fig.13 Virtual restoration of the Terracotta Army

图14 青铜铸件背散射电子图像分割^[11]

Fig.14 Backscattered electron image segmentation of bronze castings

图15 石质文物退化检测^[59]

Fig.15 Degradation detection of stone cultural relics

图16 土质遗址裂隙识别^[64]

Fig.16 Fissure identification of soil heritage sites

上述三个方面构成了深度学习在文物病害研究的核心框架，后续将结合具体模型，详细阐述不同数据源与应用场景。

2 深度学习在文物病害研究中的常用模型分析

本节将围绕常用模型，结合数据源与应用案例，系统分析深度学习在文物病害研究中的应用。根据应用目的和技术特征，深度学习在文物病害相关研究中的模型可划分为三类：分类任务（classification tasks）、回归预测任务（regression prediction tasks）和生成式任务（generative tasks）。分类任务主要解决离散空间（discrete space）的映射问题，其输出为有限类别标签或概率，核心是解决是否存在及属于何种类型的问题。典型应用包括壁画病害区域识别与定位^[45]、建筑屋顶瓦片的损伤识别^[65]、建筑表面裂隙识别^[66]等；回归预测任务则专注于连续空间（continuous space）的映射，解决的是程度如何和发展趋势问题。代表性应用包括量化预测颜料的褪色速率^[67]、预测纸张老化程度^[68]等。生成式任务则是通过学习真实存在的数据生成或创造性合成符合历史原真性的数据，如壁画和书画虚拟修复^[2，47]。下面对在该领域常用的U-Net模型、YOLO模型、R-CNN模型和GAN模型的应用进行分析。

2.1 U-Net模型

U-Net模型是一种基于卷积神经网络的图像分割架构，其核心是通过编码器-解码器结构和跳跃连接实现精确的像素级分割^[69]，最初设计用于生物医学图像分割，其典型结构如图17^{[9-10，44，70]}所示。

U-Net模型的编码器通过卷积和池化操作提取特征，解码器通过上采样和卷积操作恢复空间信息，并通过跳跃连接融合不同尺度的特征，从而提高分割精度。然而，尽管U-Net模型在图像分割任务中表现出色，其在计算资源需求、过拟合风险以及处理复杂场景等方面仍存在一定的局限性，在一定程度上限制了其在大规模或高复杂度任务中的应用。

在文物领域，U-Net模型常用于病害检测识别与彩绘线稿提取。例如，在壁画颜料层脱落病害方面，谷明岩等^[44，71]基于尼康D810数码相机采集的瞿昙寺壁画高清数据，提出了一种融合低级特征保留与池化索引上采样的改进U-Net模型，有效提升病害区域提取精度；侯昱岑^[72]基于高光谱数据，提出了一种结合多尺度U-Net模型与异构迁移学习的高光谱图像分割方法，能够有效提升病害标注的准确性与效率。在图像分割方面，Liao等^[10]提出了一种基于U-Net的深度学习模型，高效解决了中国古代蜻蜓眼玻璃珠显微CT图像的分割难题。在彩绘线稿提取方面，王佳欣^[70]基于文物高清图像，提出了一种基于U-Net结构的细节感知模型，实现了受病害影响彩绘线稿的高精度提取；Peng等^[42]则基于文物高清图像，提出了一种基于细节感知分层深度网络的彩绘文物线稿提取框架，通过粗提取阶段的细节感知双向级联网络和细提取阶段的多尺度U-Net，有效解决了病害腐蚀和复杂背景下的断线及噪声问题。此外，还有学者基于高光谱数据和3D U-Net模型实现了对书画霉菌病害区域的虚拟修复^[9]。

2.2 YOLO模型

YOLO模型是一种基于卷积神经网络的目标检测架构，其核心是通过单次前向传播实现高效的目标检测^[73]，是计算机视觉领域的重要算法之一，其典型网络结构如图18^[40，65-66]所示。

图17 U-Net网络结构及典型应用

Fig.17 Network structure and typical applications of U-Net

图18 YOLO V3网络结构及典型应用

Fig.18 Network structure and typical applications of YOLO V3

YOLO系列模型因其高效性和准确性在目标检测任务中备受瞩目，尤其在处理微小目标时表现出色。通过多尺度特征融合和优化损失函数，YOLO能够准确检测不同大小和形状的目标区域，同时完成目标的定位、分类和分割。这些特性使其在文物病害检测中具有显著优势。例如，在书画文物病害检测方法，邓旭帅基于YOLOv5x6模型和图像数据，实现了书画文物虫蛀和折痕病害的高效识别与定位^[40]；在道路缺陷检测方面，王毓^[74]利用YOVOv5l模型实现了道路裂缝、龟裂、坑洞等缺陷的精确检测与分类；此外，YOLO系列模型还被广泛应用于墙面裂隙检测^[66]、中国传统黏土瓦损伤类型（裂隙、污渍和表面磨损）自动识别^[6]，以及中国苏州园林建筑的薄瓦损伤（水渍、表面剥落、色差等）自动识别^[65]等应用场景。

2.3 R-CNN模型

R-CNN模型是一种基于区域的目标检测算法，由Girshick等于2014年提出，其核心思想是通过区域生成和卷积神经网络结合实现目标的高精度检测^[75]，其典型流程如图19^{[11，13，29，59]}所示。

图19 R-CNN网络结构及典型应用

Fig.19 Network structure and typical applications of R-CNN

R-CNN模型通过结合候选区域和卷积神经网络的方式，显著提高了目标检测的精度，但也因计算效率较低而限制了其实际应用。为克服这一缺陷，后续研究提出了Fast R-CNN、Faster R-CNN和Mask R-CNN等改进模型，进一步扩展了模型的功能和性能。在文物保护研究中，R-CNN模型常用于病害检测与识别。例如，王念念^[29]基于Faster R-CNN和Mask R-CNN算法以及大量的数字图像，实现了对故宫城墙和琉璃瓦损伤的自动检测与分割，为古建筑病害检测提供了高效、精准的方法；Liao等^[11]提出了一种基于Mask R-CNN的深度学习算法，能够从复杂背景的BSE图像中精确分割青铜铸造模具的黏土基质、粉砂/砂颗粒和孔隙等特征，并提供关键参数，分割精度达95%，准确率约为91%。R-CNN模型也常用于石质文物退化识别，例如Hatir等^[59]基于哈图萨考古遗址雅兹利卡亚遗迹的2 460张图像，利用Mask R-CNN模型对石材退化进行了高精度识别，包括生物病害、轮廓剥落、裂隙、冲击损伤及缺失等多种劣化类型；Hou等^[13]利用Mask R-CNN算法，基于1 900张大足千手观音像图像，首次实现了贴金石质文化遗产的金箔脱落自动检测，精度高达0.967，表现优异。

2.4 GAN模型

GAN模型是一种基于对抗学习的生成模型，其核心思想是通过生成器（generator）和判别器（discriminator）博弈训练实现高质量的数据生成^[76]，核心结构如图20^[1，77-78]所示。自2014年提出以来，GAN模型经历了多次迭代优化，不断引入新的网络结构和训练策略，例如CycleGAN和WGAN等模型，在图像生成、风格迁移、数据增强等任务上取得显著进展，成为生成模型领域的重要算法之一。

在文物领域，GAN模型常用于书画和壁画文物病害区域的数字虚拟修复。例如王子一等^[77]针对盟书字符残缺的问题，构建了基于双判别生成对抗网络对盟书字符进行修复，修复后的盟书字符结构更加完整；杨卓林等^[78]针对壁画修复样本缺乏多样性的问题，提出了一种基于双生成器生成对抗网络的方法，使得壁画修复结果细节更清晰；Maitin等^[79]则基于GAN模型重建希腊神庙废墟图像中缺失的建筑；同时，基于GAN模型的算法则中国传统书画虚拟修复中也取得了较好的效果^[1-2]。

图20 GAN典型网络结构及应用

Fig.20 Typical network structures and applications of GAN

3 挑战以及发展方向

随着文物及其病害多源数据采集技术，特别是无损检测与分析技术的快速发展，数据标注的成本与复杂性显著增加，尤其是对文物病害识别、量化、预测及数字复原需求的精细化要求，深度学习驱动的文物病害智能研究面临诸多挑战。针对这些关键问题，从数据、模型、应用方向与标准规范四个角度展开讨论，论述该领域研究面临的挑战以及未来的发展方向。

3.1 数据方面

数据是深度学习的基石，其质量、多样性与规模直接影响模型性能。由于文物本身的特殊性，以及技术条件与环境因素的限制，导致文物数据样本面临以下的挑战：1）数据量不足。文物具有极高的价值与不可再生性，不宜频繁近距离接触或进行直接测量，导致数据采集的机会有限，数据量难以满足深度学习模型训练的需求。同时文物数据还存在多样性缺失的问题，如文物保存环境（如干旱、潮湿、盐蚀、高温等）对其病害形成与发展具有重要影响。然而，现有数据多来自实验室或特定环境，难以全面反映真实环境下的病害特征。2）数据质量参差不齐。文物数据采集过程中，光照条件、拍摄设备性能、检测仪器精度等因素会显著影响数据质量。同时，不同环境采集的数据可能存在系统性差异，影响模型效果。3）数据标注标准不统一与主观性差异。不同专家对同一病害或特征的判断可能存在主观性差异，导致标注结果不一致，影响数据集的可靠性。例如病害类型标注（如风化等级、微生物侵蚀范围等）依赖文物工作者经验，标注过程易受主观判断影响，如“轻微剥落”与“中度剥落”界限模糊。

因此在未来研究中：1）在数据采集方面，使用非接触式数据采集技术，如快速高分辨率摄影、三维激光扫描、计算机断层扫描、红外热成像、高光谱扫描等，以最大限度地减少对文物的物理干扰；同时还可以借助卫星遥感、无人机、智能机器人或远程检测技术，对难以接近的文物进行远程数据采集。2）针对数据样本量少的问题，利用数据增强技术扩充现有数据集的规模，提高模型的鲁棒性；设计轻量化模型，适应小规模数据集的训练需求；构建文化遗产数据共享平台，鼓励研究机构与文保单位合作，制定数据共享协议，实现数据的积累与共享。3）针对数据质量问题，制定标准化数据采集流程，明确光照、设备参数、采集距离等技术要求，以确保数据的一致性与可靠性；同时制定详细的标注规范与指南，明确各类病害、材质、损伤等的定义与分类标准，减少主观性差异。

3.2 模型方面

模型的泛化能力、可解释性与针对性是深度学习在文物病害研究领域面临的核心挑战之一。由于文物种类繁多，材质、结构和环境条件差异巨大，导致现有的深度学习模型在特定数据集上训练效果较好，但在不同类型的文物或不同的应用场景中，其性能可能会大幅下降。例如，在一种材质的文物上训练的病害识别模型，应用到另一种材质的文物时，其准确率可能会显著降低。同时由于深度学习模型往往是复杂的黑箱结构，难以理解其决策过程和依据，在文物研究中，仅仅知道模型的预测结果是不够的，专家需要了解模型判断病害、劣化的原因，以便制定合理的保护策略。但目前大多数深度学习模型缺乏良好的可解释性，限制了其在实际应用中的推广。

因此在未来研究中：1）建立基于专家知识与规则的大模型。将专家知识（如病害分类规则、劣化机制）融入模型设计，构建基于规则的混合模型，提高决策的可解释性。2）构建自适应与迁移学习模型。采用领域自适应技术，将模型从源领域（如现代有色金属腐蚀数据）迁移到目标领域（如古代青铜器锈蚀数据），通过微调提高模型的适应性。3）建立多任务学习与共享特征提取模型。采用多任务学习框架，同时学习不同材质、结构或环境下的病害特征，提高模型的泛化能力；设计共享特征提取模块，最后通过引入可解释性框架、注意力机制、因果推理、领域自适应等方法，提高模型的透明性与适应性。

3.3 应用方向

深度学习在文物病害识别与分类统计等方面虽取得了显著成果，但仍存在以下局限性：1）应用场景仍较为单一。目前的应用主要集中在病害的识别、统计以及病害区域的虚拟重构等方面，而对复杂体系中的病害劣化程度定量评估的相关研究较少；2）对病害机理及发展趋势预测不足。深度学习模型虽然能够较为准确识别文物的病害（如壁画上的裂纹、金箔脱落等），但是对病害的发展机理、劣化趋势预测等复杂问题的支撑力度不足，难以为文物的长期保护提供科学依据。

因此在未来研究中，需要显著拓展深度学习的应用广度和深度：1）强化文物病害机理与预测研究，将应用场景拓展至病害发展机理分析、劣化趋势预测等复杂问题，从纯粹的模式识别转向能够推断或整合因果关系的模型。重点关注脆弱纸张、丝织品、贝叶经、骨角等有机质文物老化、酥粉、开裂、褪色等关键病害，构建基于深度学习的病害预测模型，为文物的长期保护提供科学依据。2）建立基于病害的文物状态与劣化评估模型，增强对复杂病害体系的处理能力。针对文物多种病害共存及其与温湿度、光照环境、降雨、震动等因素交互作用的复杂关系，通过病害等效模拟、宏观-微观跨尺度关联、多指标体系赋权方法等研究，结合环境数据、模拟数据、存量病害等数据，设计具有多因素感知能力的评估体系，实现文物状态的智能化定量评估，推动解决石质文物、建筑木结构、墙体、青铜器、纸张、丝织品等类文物保存状态与劣化程度定量分级评估难题。3）开展跨学科合作，推动技术创新。加强深度学习与考古学、物理学、化学、材料学、地质学、环境科学、工程学科等领域的跨学科合作，并通过专家反馈强化模型策略，为文物保护提供更全面的技术支持。

3.4 标准规范方面

最后，标准规范则是深度学习在文化遗产病害研究领域面临的另一项关键问题。技术路径的标准化滞后是深度学习技术应用的主要障碍之一。例如高光谱数据或者CT数据的采集过程（如设备选择、环境控制和参数设置）、数据质量控制、预处理（如数据校正、噪声去除等）、分析与输出（如特征提取、病害检测和可视化等）等缺乏统一的标准规范，导致数据的一致性和可比性无法得到有效保障，限制了跨机构的数据共享与合作。在对深度学习模型进行评估时，评估指标多采用通用指标，但这些指标无法全面反映文物保护的实际需求，例如“最小干预原则”与长期稳定性等要求。

因此在未来研究中：1）建立数据采集与预处理规范。组织文物保护领域的专家、相关研究机构等，制定数据采集、预处理、模型训练与评估等方面的行业标准与规范。2）建立共享平台与数据库。构建文化遗产数据共享平台，完善数据分级与共享机制，促进跨机构合作与成果交流。3）标准的动态更新与国际互通。建立标准的动态更新机制，根据技术发展与实际需求，定期优化与更新行业标准与规范，确保标准的科学性与实用性。与国际古迹遗址理事会（International Council on Monuments and Sites，ICOMOS）、国际博物馆协会藏品保护委员会（International Council of Museums-Committee for Conservation，ICOM-CC）等国际组织协同，开展多语种对标与互认试点，推动国内标准与国际标准的双向兼容，助力我国深度学习文物保护技术在全球范围的推广应用。4）建立符合文物领域的评估指标体系。结合文物保护的实际需求，设计定制化评估指标，同时引入多维度评估体系，综合考虑模型的精度、可靠性、可解释性等因素。

4 结论

深度学习在文物病害相关领域的研究已取得显著进展。本文基于文献计量学的方法系统梳理了2017—2024年深度学习在该领域的阶段性发展特征与趋势，同时总结归纳了常用模型与典型应用场景。当前该领域的主流研究模式，是以数字图像为核心数据源，结合卷积神经网络与生成式对抗网络，将其应用于文物建筑、书画、壁画、陶质彩绘、石质文物等多类文物的病害识别、评估等相关研究中。尽管取得显著进展，但该领域仍面临高质量标注样本稀缺、复杂场景下模型泛化能力不足、行业统一标准缺失等关键挑战。

为破解这些瓶颈，未来在深度学习应用于文物病害相关领域的研究，需从数据采集、模型构建、拓展应用方向和标准规范几方面推进：1）在数据采集方面，采用非接触式技术和无人机、智能机器人等工具，减少对文物的干扰；同时制定标准化采集流程，引入多源数据融合和增强技术，解决数据质量和样本量不足问题。2）在模型构建方面，融合专家知识，构建文物领域的大模型，采用领域自适应、迁移学习等技术，提升模型的适应性、泛化能力和可解释性。3）在应用方面，未来需将深度学习技术的应用范围扩展至文物病害机理分析与劣化预测等领域。4）在标准规范方面，需制定统一的行业标准，建立数据共享平台和动态更新机制，设计符合文物领域的评估指标等。

通过开展跨学科合作与研究，深度学习在该领域的应用将更加广泛与可靠。深度学习将成为文物保护的智能化核心驱动力之一，为文物的科学保护与传承提供更高效、精准的技术支撑，其相关研究将不断深化人类对文化遗产价值的认知，助力文化遗产的永续传承与弘扬。