金属物料溯源研究是揭示古代社会结构、经济系统与文化交流的重要基础。复杂社会的大规模、远距离运输和贸易网络使得金属物料可能在流通过程中发生频繁的混合与重熔。这一过程往往会破坏矿物原料与金属产品间原有的地球化学对应关系,严重阻碍了金属物料的溯源研究。北京科技大学冶金与材料史研究团队近年来致力于通过使用机器学习算法模型,开展数据驱动的材料考古研究(Data Driven Archaeomaterial Studies)。针对金属物料混熔问题,本研究团队与北京大学、美国伊利诺伊大学厄本那香槟分校合作,结合流形学习降维与贝叶斯混合模型,开发了可用于定量化重构古代混熔金属产品原始物料混合比的方法体系,并成功将这一方法应用于周代青铜器金属物料产源与流通研究。该研究成果已发表于国际著名考古期刊Journal of Archaeological Science。
1. 古代金属物料溯源研究中的复杂混熔问题
金属资源的开发利用是古代社会文明发展的重要催化剂。在青铜时代,古人已经能够通过多种机制远距离获取金属资源,并在广域范围内进行交换与再分配。因此,对于金属器的溯源研究成为重建古代区域间文化互动与社会经济结构的重要手段。铅同位素分析是古代金属物料溯源研究中应用最广的手段。不同地区金属矿源的铅同位素组成常具有显著差异,且这一特征在人为加工过程中不会发生显著变异,为构建矿物产地与金属器物间的关联提供了有效指标。然而,青铜时代的许多文明都具有大规模、远距离获取和分配金属资源的网络,不同来源的金属物料会在流通过程中频繁混熔,导致其铅同位素特征发生改变。“混熔问题”掩盖了金属物料原始的铅同位素地球化学信息,使其无法与地质矿物数据进行直接对应,严重限制了铅同位素分析在溯源研究中的应用场景。
以往学界对于混熔问题的处理方案是寻找铅同位素比值和化学成分散点图中“混合线”,以此反推原始混熔端元的特征。然而,这一方法难以处理复杂的多端元混合问题,并且忽略了端元数据本身的离散度与不确定性,对于实际混熔问题的处理能力有限。在环境科学与生态科学领域,学者已开始建立具有更广适用面与更强鲁棒性的贝叶斯混合模型来处理类似问题,解决生态系统中消费者的食谱特征、环境污染物的来源等问题。这一方法同样被引入考古学领域,用以解决人类及牲畜的生业模式、人群迁徙、贸易网络等问题。然而,这一方法在古代金属物料溯源研究中应用仍十分有限。贝叶斯混合模型需要确定所有可能参与混熔的端元特征作为先验信息,一个规模较小的混熔系统的边界较易确定,一般可将一定地理范围内的所有潜在端元输入模型。然而,远距离的金属流通网络使得古代金属混熔系统的边界很难确定,大量不同产地的金属物料都可能作为端元参与其中,为模型的构建带来了较大挑战。本研究针对这一问题提出了解决方案:首先基于流形学习降维建立先验产源组,再进一步利用MixSIAR算法建立混合模型。
2. 模型构建
贝叶斯混合模型MixSIAR通过将端元的数量、分析误差及分布特征等作为先验信息,通过马尔可夫链蒙特卡罗方法(MCMC Chains)来进行迭代,定量还原各端元对于混合样本的贡献程度,以概率密度分布曲线的形式产生结果,并通过Gelman-Rubin和Gewecke两种检验方法来确定模型是否收敛。为建立具有足够覆盖面的物料产地端元组,本研究选择将中原先秦时期青铜文明可能开发的17个省份的316处铜、锡、铅矿床纳入考察,之后对具有相似同位素特征的矿床进行合并,建立产源组。研究中首先以地质板块或地理区域边界作为分组标准,结果显示各组之间的铅同位素数据分布均存在显著重叠,无法直接作为端元输入MixSIAR模型。因此本研究尝试通过数据降维与聚类的方式,通过寻找铅同位素数据本身的内在结构进行分组。本研究使用统一流形逼近与投影(UMAP)这一新式降维方法将所有矿床的同位素数据降至二维,之后使用层次聚类(HCA)对其进行分组。对初步分组结果使用两种显著性差异检验(ANOSIM和PERMANOVA)来考察各组间差异的显著性,将不存在显著差异的组进行合并,最终定义了5个先验产源组(A-E)作为混合端元输入模型(图 1)。
图 1 a: UMAP降维结果, b-c: HCA分组后铅同位素散点图, d: 显著性差异检验后合并分组结果, e-f: 合并分组后铅同位素散点图。
通过地球化学中的Stacey-Kramers二阶段模式法计算5组端元的模式年龄(T)、U/Pb(μ)、Th/Pb(κ),结果显示它们的T值具有显著差异(图 2),说明矿石的成矿年龄与分组结果具有一定对应关系,分组结果具有地质意义。值得注意的是,同一端元组内的矿床虽然可能来自不同的地理区域,但理论上无法通过铅同位素方法对其进行区分。因此金属器的铅同位素溯源结果只能具体到特定的产源组,需要结合其他地球化学指标和考古信息来进一步缩小潜在产源范围。
图 2 各组T值、μ值与κ值的分布特征。
各产源组在地理空间上的分布也具有一定特征,这主要与中国不同区域板块的构造年龄差异有关。图3显示了每个地理单元中各端元组所占比例,每个地理单元均由1-2个端元组占据主导地位,其中华北地区以端元A和B为主,华中地区(包括秦岭与长江流域在内)以端元B和C为主,华南地区(包括云南、贵州和南岭地区在内)以端元D和E为主(图 3)。因此,应用这一模型可有效重构不同地理单元对于青铜器群物料的贡献程度。
图 3 a: 中国金属矿床(铜、锡、铅)分布特征, b: 各地理单元中5个端元组所占比例。
3. 两周时期金属物料产源与流通
两周时期具有复杂的政治格局和地区关系,而作为政治权力合法性的物质载体,青铜器在广域范围内以战利品、赠礼、贸易物等多种形式进行生产、流通、分配和重铸。对其物料产源进行研究成为理解两周时期政治管理模式和地区间关系的重要路径。在本研究中,将两周时期划分为西周早期、西周中晚期、春秋早期、春秋中期、春秋晚期、战国早期和战国中晚期7个时间段进行考察。
以往研究中大量两周青铜器铅同位素分析显示西周早期继承了商代晚期的金属供应网络,从西周中期开始金属供应网络逐渐多元化,开始获取范围更广的金属资源。多位学者认为,长江中下游、华中秦岭地区和华南南岭地区的矿产资源对两周的金属供应网络具有主导地位,且显示出明确的历时性差异,揭示了整个两周时期金属供应中心的变化历程,为考察MixSIAR模型的适用性提供了很好的案例。
图4显示了两周时期不同阶段青铜器群的铅同位素数据均呈连续分布,很难观察到明确的分组情况,具有明显的混合物料特征。MixSIAR模型计算结果显示,每个端元组在各时期贡献度的概率密度均呈单峰正态分布,因此可使用概率密度分布的平均值和标准差来估计每个时期各端元组对青铜器群的贡献度。模型计算结果显示周代的大部分时段均存在两个或以上的主要物料混合端元,证实了周代金属物料高度混熔的特点(图5)。在产源研究中,需要首先对数据进行解混,再对其原料产地进行考察。
图 4 a-f: 两周各个时期的青铜器群铅同位素分布特征, g-i: 各时期青铜器群T值、μ值与κ值的分布特征。
端元A在西周早期占据较大比重,且在西周中晚期消失(图 5)。这一端元指示矿料应当继承自商代晚期,并在西周早期使用殆尽。以往研究对该矿料产地未有明确结论,MixSIAR模型计算结果显示华北北部、山东半岛或湖北北部可能为其产源(图 4)。
端元B和C在整个两周时期都占据相当比重,其中春秋中期以前端元C占据更大比重,而春秋晚期及以后端元B的占比更大(图 5)。端元C内存在多个不同地理单元的矿床,因此很难直接判断其产地(图 4)。根据考古田野调查,长江中游地区存在大量西周及春秋时期铜矿开采和冶炼遗址,该地区被认为是周代重要的铜金属来源。虽然长江流域铜矿床含铅量普遍较低,难以影响青铜器的铅同位素结果,但是铜的开采冶炼可能刺激了对当地铅资源的开发利用。目前已在长江中游的鄂东南地区发现了早至春秋时期的铅冶炼遗址。因此可初步判断端元C占据主导的西周中期至春秋中期阶段,长江中游的金属资源被大规模开发利用并输入中原地区(西周早期端元C代表的产源仍存疑问)。端元B包括华北地区、河南西部和长江下游地区的矿床(图 4)。前人研究成果显示河南西部小秦岭地区是战国至西汉时期所使用的重要铅金属来源,可能是端元B占据主导阶段的主要金属产地。从端元C到B的历时性变化显示了在春秋中晚期,金属开采和供应中心发生了显著性变化。
端元E在各时期青铜器群中的占比均超过20%,表明其指示的金属资源在整个两周时期被持续利用(图 5)。端元E对应的地理单元集中在中国南方,包括南岭地区、云南、四川西部和长江下游(图 4)。长江下游发现多处周代铜开采和冶炼遗址,但其矿石铅同位素μ和κ值总体低于两周青铜器(图 6)。南岭地区矿产类型丰富,多位学者指出湖南南部的铅锡多金属矿资源可能被使用,并广泛传播到中国其他地区,可能是端元E所代表金属资源的主要产地。另外,两周铅锡器/纯锡器的铅同位素特征也与端元E内南岭金属矿床较为一致(图 7)。
图 5 各端元在两周不同时期青铜器群中所占比例。
图 6 端元E中南岭地区、长江下游矿石铅同位素与两周青铜器群的对比。
图 7 端元E中南岭地区矿石铅同位素与两周铅锡器/纯锡器的对比。
4.结论
本研究开发了一种新型的青铜器铅同位素数据解混方法。通过UMAP降维和HCA聚类分析,将中国主要金属矿床划分为5个端元。分组结果与矿石模式年龄具有较好的对应关系,且与矿床所在地理单元密切相关。在此基础上,通过贝叶斯混合模型MixSIAR重构了各端元组对两周时期不同阶段青铜器群的贡献度,揭示了其复杂的金属资源开发与混熔历史。这种方法在解决世界其他地区古代金属物料复杂混熔和流通问题上也具有巨大潜力。模型输出结果还可作为进一步开展其他定量研究的数据基础,用以重建和模拟广域范围内不同社群间以金属原料和器物为载体的文化交流机制。