文物鉴定的主要内容包括辨别文物真伪、判明文物年代、评估文物价值和等级等几个方面[1]。大数据是信息时代的产物,指不用随机分析法,而采用所有数据进行分析处理,实质上是一个数据仓库,可以高性能、交叉式地处理不同类型数据。文物鉴定中的大数据分析指大数据技术、理念和思维在文物鉴定领域的应用,是分析文物信息和协助文物鉴定的重要手段。鉴于目前大量的文物数据被解读,数据统计分析也广泛应用于文物界,而现有文物信息数据库并没有专属于文物鉴定的平台,因此本文从文物鉴定的特殊性出发来探讨大数据分析在文物鉴定中的应用,以发挥文物数据整合的优势。
一、文物鉴定现状及大数据分析的必要性
(一)文物鉴定现状
文物鉴定作为一项科学性较强的工作,是整个文物保护管理工作中的重要环节之一,也是研究文物的重要手段和方法。而现今文物作伪现象严重,文物造假行业大量借鉴考古成果和文物鉴定经验,且新技术、新设备也被应用到复仿制过程中,单从表面上分析,难以区分某些真品和复仿制品、赝品,这给学术研究和文化遗产保护带来诸多不利。
鉴于此,在科技不断发展的今天,文物鉴定工作应该有更多的方式方法,如利用各种先进的科学技术手段,为鉴定结论提供科学数据支撑。目前工作中,传统文物鉴定和科学技术的结合已经有进一步的进展,现代科技方法所提取的相关文物信息比较真实,通过对已知文物信息进行提取,而后建立数据库进行参考和比对,是文物鉴定的一个方向,也有利于文物鉴定事业的发展。
(二)文物信息数据库现状
在国家的大力倡导下,我国陆续建设了各种性质的文物信息平台,如中国被盗(丢失)文物信息发布平台、陕西省可移动文物普查平台等[2]。基于现有的数据库技术,建立起多种文物数据应用系统,如考古文献情报检索系统、博物馆藏品管理系统等。国家文物局还申报了《国家文物大数据公共服务平台》建设计划,并列入国家发改委项目库,该项目旨在建设全国一体、区域统一、互联互通的国家文物局大数据公共服务平台,以整合、共享、开放文物数据[3]。
(三)文物鉴定中大数据分析的必要性
从信息角度来看,文物是一种特殊的信息载体,文物鉴定的实质就是挖掘文物所有信息内容,并对此进行对比分析。因此文物鉴定除了鉴定人员的经验、阅历等主观因素,还应有科学、客观的文物数据作为鉴定依据。因此,文物鉴定应该依靠科学技术丰富文物信息,建立一套系统的文物鉴定信息数据库,以科学、客观的文物数据作为鉴定依据,整合完善文物信息,快速检索、对比分析被鉴定文物,从而为文物鉴定提供更多的信息资料。
随着文物检测分析技术的进步,获取的文物信息数据也越来越丰富,实现了对文物实体及其所关联信息的数字化记载。这些原始数据如果被整合统计,利用数据的罗列与对比,对文物进行整体性分析的,再通过数据软件的归纳计算,总结出器物的共性和特性,就可以为文物鉴定提供数据依据,而这些数据也能作为以后文物鉴定的标尺。随着文物研究工作的深入,对文物数据资源进行整合、共享,建立数据库,将会为以后文物鉴定提供更多更详实的数据基础。
二、大数据分析在文物鉴定中的应用流程
大数据分析法是通过采集、融合、整理得到大量文物数据信息,经过统一资源整合调配,建立数据处理模型(数据资源解析、筛选、组合和输出),对文物数据信息进行统计,形成文物的参考值。待鉴定器物根据元素数据的相似性及不同点来分析,仿品特征元素必然不同于真品,以此为依据来鉴定文物的真伪。
(一)文物数据信息的采集
数据分析是大数据技术领域最核心的部分,纳入数据分析法中的文物信息越全面、越准确,最后得到的结果也会越精准。但并不是所有收集的数据都是真实有效的,需要通过科学方法进行文物信息数据的梳理和筛选,确保数据价值得到真正的应用。所以文物鉴定信息化工作需要提取更多的文物基础数据和信息,作为大数据资源。通过数据分析鉴定文物时,不同类别的文物要运用不同的科技方法检测,检测的内容大致有:文物形象观察,文物组成成分分析,文物制作工艺分析,文物产地分析等。
文物信息采集可以先从馆藏文物登记开始,而后再对新发掘出土、传世文物、仿品、复制品的信息进行录入,这样有利于准确地对器物进行对比辨别。然后再通过国家力量不断完善文物检测标准和科学化的数据应用,对文物数据信息进行补充和深入发掘,形成器物参考数据标尺,充实数据库的数据信息,再结合器物特征,增加数据库自动采集、分类、管理的功能,通过特征数据智能比对分析出鉴定结果,这将极大地提高文物鉴定效率和准确性。
(二)文物鉴定信息数据库模型的建立
完善与丰富文物鉴定信息数据库是保证分析结果准确和科学的基础。文物鉴定信息数据库由每件器物的各项分析数据构成,代表着独立的、有别于其他文物的个体信息,即文物DNA。由于文物分类标准不同,可以按质地对数据进行归类整理,根据各种器物不同年代的标准器建立多个小型数据库,再整合成总的文物信息数据库,最后对这些数据进行分类、比较、分析、整合,判定每种文物的特征,确定每个文物的年代(表一)。
表一 文物信息数据库结构图
文物信息数据库对不同时期、不同地区器物特征的分析,需要制定统一的科研标准,并将采集到的数据进行科学管理,形成器物的完整身份——标准数据。数据库中录入器物信息,还需对现有不同器形文物数据进行统计,选取一些标准器及各个年代具有代表性的器物进行检测并读取数据。
(三)文物鉴定信息数据库管理系统的建立
数据库建立后,根据文物的特殊性设计专门的文物鉴定程序,形成一套较完善、动态的文物鉴定信息数据库管理系统(图一),然后将采集到的各种类型文物数据信息存储到数据库中,成为每个文物的身份记录,再借助大数据对生成的文物数据进行归纳整理与分析。
图一 文物鉴定信息数据库管理系统
(四)文物鉴定信息数据库流程的建立
将待鉴定文物的数据与文物鉴定信息数据库里的数据进行对比分析,根据各项数据权重比,结合数据库中已有数据,建立数据模型求出文物年代和真伪的可能性百分比;再结合传统文物鉴定方法综合考察,断定年代,辨别真伪,确定价值,获取鉴定结果,形成一套文物鉴定流程(图二)。
图二 大数据分析文物鉴定流程图
三、文物鉴定中的大数据应用实例
下面以元代青花玉壶春瓶为例,探讨大数据分析在瓷器鉴定中的应用。
(一)器物信息采集
瓷器鉴定主要从造型、纹饰、胎釉、款识、窑口等几个方面进行。带有产地和年代特征的胎釉主量、次量、微量元素的种类和含量是鉴定古陶瓷真伪的重要科学依据之一,不同年代、产地、窑系的瓷器,其胎、釉的化学组成也不尽相同,因此鉴定时可根据窑系的不同,将胎、釉的化学组成成分等数据结果作为一个整体,得出器物组成成分的元素特征概率。
信息采集首先要对待鉴定的玉壶春瓶进行三维扫描,形成三维立体图像,获取表面特征信息,如器物尺寸、外观纹饰等;其次结合检测仪器开展无损分析提取其元素组成,并分析元素特征,主要对青花釉料成分作着重分析。
(二)鉴定方案设计
文物鉴定信息系统需拟定多种鉴定方案对器物进行鉴定,因为方案越多,鉴定结果越准确,而后通过对标准器的初步判断设定鉴定程序,对比分析已录入的不同年代该器形的基础信息及特征信息。
如元青花玉壶春瓶的鉴定,可以设定陶瓷器鉴定方案:方案一为该器形各个年代标准器的基本信息及纹饰特征,主要包括传统鉴定中可以区别的因素特征;方案二为该器形不同年代,不同窑口的窑系信息;方案三为该器形的化学组成成分分析,包括胎、釉、纹饰等不同部位的化学元素含量。
(三)鉴定结果分析
信息采集后通过建立的数学模型,进行定量化归纳统计和大数据计算分析,结合目前系统中存储的大量数据,采用聚类的Kmeans、统计分析的SVM和用于分类的NaiveBayes等数据挖掘算法,系统总结出玉壶春瓶的共性和特性。
待鉴定元青花玉壶春瓶的各种基体信息经过以上三种方案的对比分析,可以得出每种方案中各鉴定属性的综合排序,如通过对方案一的对比可知,该玉壶春瓶与元代同类器物相似性为90%,方案二与景德镇窑系器物特征相似性为80%,方案三胎釉特征与景德镇窑系器物的相似性为80%;最后通过对多种方案的综合分析:元代相似性最高,明代、清代各期及现代的相似性均较低,初步判断该器物的真伪及年代,再结合传统鉴定方法最终得出结论并生成文物鉴定报告(图三)。
图三 文物鉴定中大数据应用分析结论图
四、结 语
文物鉴定中大数据应用分析及文物鉴定信息数据库的建设,是一项漫长的系统工程。虽然建立数据库的任务量很重,需要测试大量样品,获取大量数据,投入大量人力、物力和精力,但当数据库建成后,文物鉴定就有了基础的数据资料。通过大数据分析,再结合传统文物鉴定方法,就可以更准确地鉴定文物,同时也能对文物的隐藏信息有更深层次的了解,并为我国的历史文明、古器物制作水平与古代工艺技术探索等研究提供直观的科学依据。文物信息数据的采集,说明科学技术在文物鉴定中有着不可或缺的作用,可以作为辅助手段为传统鉴定服务。传统文物鉴定与科学技术结合产生的大数据分析在文物鉴定领域将具有广阔应用前景。