未来已来——人工智能与博物馆数字化建设的思考

字号:T|T
2023-10-07 18:02 来源:博物院杂志

导读在以ChatGPT为代表的人工智能受到社会广泛关注的情况下,博物馆的数字化建设需要适应这一变化,从新技术的发展中获益。博物馆本身也应该利用这一契机,重新审视AI时代对博物馆工作的要求,推进自身的变革并探索博物馆领域新的生长点,重新规划我们的工作方式和业务生态。

一、引言

ChatGPT自2022年11月30日横空出世,很快吸引了社会各界的注意力,继2016年的阿尔法围棋(AlphaGo)击败围棋世界冠军李世石后,人工智能再次引发社会热潮,成为一个街谈巷议的话题。现在,以ChatGPT为代表的人工智能技术在持续迭代中快速发展,并不断地刷新人们的认知。当人工智能开始走向通用,被广泛接受并融入社会,它就可能会在各个领域发挥重要的作用,而作为主要公共文化机构的博物馆当然也是其中的必要一环。从理论上说,人工智能在博物馆中的作用似乎有无穷无尽的可能性,这也意味着它将成为智慧博物馆建设的重要一部分。二、ChatGPT、AIGC与人工智能

1

相关技术的概念

人工智能是计算机科学的一个分支,也是一个各学科融合的交叉学科。人工智能领域众多,计算机视觉、机器学习、自然语言处理、机器人和语音识别向来被视为人工智能的五大重点领域或者说是核心技术。从自然语言处理和机器学习领域脱胎而成的AIGC,则被认为有望引领内容产业的新一轮生产力变革。AIGC狭义上来说就是利用AI自动生成内容的生产方式;广义的AIGC可以看作是像人类一样具备生成创造能力的AI技术。ChatGPT则只是AIGC的一个应用而已,当然ChatGPT本身也在迭代进化当中。

2

相关技术的演进

当约翰·麦卡锡等人在1956年8月底的达特茅斯之夏会议上提出并讨论“人工智能”这一概念,大概没能想到人工智能这条路会走得这么艰难,在前30多年几乎默默无闻。当然也没想到60多年后的今天,人工智能技术会借着AIGC的东风而这般如日中天,开始对社会造成如此巨大的影响。

从1956年“人工智能”概念首次被提出至今,人工智能大致经历了三次发展时期。第一次为初创期(1956—1974年)。该时期的任务是让机器具备简单的逻辑推理能力,也相继取得了一批令人瞩目的研究成果,如机器定理证明、跳棋程序等。第二次为成熟期(1975—1992年)。人工智能技术始终还是在波浪式发展,实用型的知识库系统和知识工程成为80年代AI研究的主要方向,一些专家系统在医疗等领域取得成功。第三次为繁荣期(1993年至今)。这一时期,计算性能上的基础性障碍已被逐渐克服。2006年,深度学习理论的突破更是直接带动了人工智能走向了一个崭新的阶段,互联网、云计算、大数据等新兴技术也为人工智能各项技术的发展提供了充足的数据支持和算力支撑。随着AIGC的不断发展,最近更是迎来了爆发式增长的新高潮。2014年,深度学习模型“生成式对抗网络”(GAN)推出并迭代更新,2022年则成为AIGC的爆发之年,12月16日,美国《科学》杂志发布了2022年度科学十大突破,AIGC赫然在列。同样是在2022年,从引爆AI作画领域的DALL-E 2、Stable Diffusion等AI模型,到以ChatGPT为代表的接近人类水平的对话机器人,AIGC不断刷爆网络,AI生成内容种类丰富且效果逼真,其强大的内容生成能力给人们带来了巨大的震撼。

三、人工智能在博物馆应用的现状

1

国外博物馆的人工智能实践

国外博物馆比较早就注意并引入人工智能技术,传播服务领域是首先的受益者。2010年,谷歌公司在旧金山一家画廊举办AI艺术展“深梦:神经网络艺术”,引发了艺术界关于AI创作的作品能否算作艺术品的热烈争论。2014年8月13日,英国泰特美术馆进行了为期5天的“夜幕”活动,通过网络远程操控小机器人,足不出户却能身临其境地参观泰特美术馆当时正在展出的“英国艺术500年”展览。2016年,泰特美术馆又引入了意大利法布里卡团队研发的视觉识别程序,在扫描并学习了3万多幅泰特美术馆的藏品后,程序可以在路透社的新闻图片库与泰特美术馆的作品图片库之间基于视觉和主题的相似性进行对应匹配识别(图1),并将这些对应成功的图片在泰特美术馆网站上建立一个不断增长的虚拟画廊。同年,挪威国家博物馆与加州大学伯克利分校合作,采用神经网络和深度学习技术,用来自于维基百科的文本资料对馆藏的藏品图像进行识别训练,训练图像依照相似度进行聚类,并在此基础上自动形成按主题、颜色和风格分类的展示(图2)。

图片

图1 泰特美术馆的图片智能匹配 

图片

图2 挪威国家博物馆的藏品图像聚类

2018年,纽约现代艺术博物馆(MoMA)的数字媒体团队和Google艺术与文化实验室合作,开展通过机器学习和计算机视觉技术在旧展览照片中识别每件艺术品的项目。团队使用算法来梳理30000多张旧展览照片,并从中寻找与MoMA在线展示的65000多件作品相匹配的照片。现在,我们在MoMA网站上,从一张1929年画展上的照片打开一个链接,可以看到保罗·塞尚的标志性作品(图3)。2019年,西班牙达利美术馆推出“达利活了”项目。博物馆收集了6000张达利生前的影像,让计算机花1000小时学习达利的脸部及身体动作,以人工智能技术重现达利身影,创造了一个AI达利(图4),并可以与观众进行互动。2019年另外一个主要的成果来自于美国大都会艺术博物馆和微软、麻省理工学院的合作项目。项目利用现在生成式对抗网络从大都会艺术博物馆的馆藏中随机选取艺术元素,然后把这些元素拿来通过GAN进行训练,再通过算法推演组合随机创建成一个艺术品,观众还可以在影像生成后自行调整每个艺术品“成分”的比重,给博物馆的文创开辟了一条新路(图5)。

图片

图3 纽约现代艺术博物馆从旧展览照片中识别艺术品

图片

图4 西班牙达利美术馆“达利活了”项目的互动装置

图片

图5 大都会艺术博物馆利用GAN进行新“艺术品”生成的演示图

2

国内博物馆的人工智能实践

与国外博物馆相比,国内博物馆在人工智能应用方面还不太重视,为数不多的一些应用也往往流于表面。目前,相对较好的一些应用大概是在文物修复方面。2017年,上海博物馆在进行“董其昌数字人文综合展示系统”项目开发时,引入人工智能技术。项目的作品栏目运用卷积神经网络(CNN)等深度学习技术来分析明代绘画作品中的一些基本元素,经训练后,系统可自动地完成画面元素的识别和归类,构成素材数据抓取和聚类的自动化模式(图6)。在董其昌项目的基础上,“‘宋徽宗和他的时代’数字人文专题”做了进一步的探索。这一项目基于上海博物馆绘画藏品数据开展主题词分析,研发书画类文物专题知识图谱。项目团队在董其昌项目所做的书画藏品识别的基础上,针对印章、题跋,以及扩展至花鸟、人物等的绘画元素,利用人工智能技术进行信息提取。项目采用深度学习的方法,以卷积神经网络提取藏品图像的特征,运用监督/无监督方法学习特征分布到类别的映射,实现对绘画元素的自动识别、标注,并构建基于构图元素的绘画内容的索引,查询比对与分析系统,并通过K-means算法来实现图像的聚类,以此辅助绘画的研究和鉴赏工作(图7)。

总之,博物馆,尤其是国内博物馆,在人工智能的运用上还显得比较稚嫩,应用场景也显得单调,但这也显示出人工智能在博物馆的运用具有巨大空间。

图片

图6 董其昌作品画面元素的识别和归类

图片

图7 宋徽宗作品中的印章识别与聚类 

四、影响人工智能在国内博物馆应用的主要因素

1

缺乏创新性思维

国内的博物馆数字化或智慧化建设已经开展了很长的一个时期,但很多博物馆人还是没有认为它是一种必需品,仍然视之为锦上添花的附加品。这种观念导致很多馆不愿意为数字化工作去开动脑筋、花大力气,其结果就是国内的博物馆数字化建设始终在原有的数据采集、藏品管理及服务导览等有限的范围之内兜圈子,建设项目的同质性问题始终无法解决。所以,要冲破目前的数字化建设的瓶颈,就必须自上而下摆脱习惯性思维,就必须提倡创新性思维。

我们必须体认和接纳数字化带来的新工作模式和工作方法,在破与立之中重建新的平衡,在多学科的参与下协同创新,发展出属于其自身的新的成长空间。也只有在这样的基础上,代表新生产力的人工智能技术才可能顺利地接轨博物馆的业务工作。

2

封闭式的业务模式

在人文类博物馆,单打独斗的个体研究也还是一种常态,学术孤岛现象普遍存在。而且由于研究人员来源学科的单一,而博物馆实际研究学科又有细分化趋势,使得研究方式的细微精深成为博物馆研究的常态。这与目前多学科融合研究的趋势背道而驰,更是与当前数字技术背景下的知识生产方式格格不入。

此外,ChatGPT之所以能够成功,海量的数据训练功不可没,这就要求有一个开放性的数据环境。在国内,智慧博物馆建设开展以来,各馆都在做藏品数据的采集,仅全国移动文物普查中,统一标准登录文物完整信息的国有可移动文物就有2661万件/套,登录文物照片达5000万张,数据总量超过140TB,这也是智慧博物馆建设最大的基础性成果。但事实上,业外人士依然望资源而不可得。造成这一状况的原因并不在技术和资源本身,而是在博物馆人的固有思维上。要解决这一问题,需要博物馆人员,尤其是管理者建立开放性思维并转变封闭式的业务模式。人工智能时代的到来,正是一个契机,是打开博物馆资源封闭大门的一把钥匙

3

数据基础薄弱

人工智能,数据是基础。博物馆当前的数据资源,从量上来看确实不少,但在质的方面就很难恭维,甚至可以用薄弱来形容。这个弱首先体现在由于采集标准不统一,以及各馆之间的人力和财力的不平衡,造成各馆的数据采集质量差别很大,特别是大馆和中小馆之间,差距显而易见。如果这一弱点通过投入还可以尽快弥补,如数字化项目中添置硬件设备,那么在不易察觉的软的一块,其薄弱则更让人担心。

我们需要多加努力,尽快建立起博物馆自己的数字资源建设标准规范,也要建立对网上资源进行搜集、筛选、编目、加工、使用的方法和相应的技术标准规范,还要建立开放的、可互操作的数字资源组织与管理标准规范,以及建立可互操作的数字对象调度机制等。在统一标准下形成良好的数据集和语料库,为人工智能的训练和学习提供优质的数据基础

五、博物馆数字化建设中人工智能应用的考量

1

重视人工智能技术在博物馆的应用

面对人工智能技术的飞速发展,博物馆持何种态度,决定了它会如何作为。博物馆管理者应当正确理解当前人工智能技术飞速发展的本质,充分认识到人工智能时代所带来的机遇和对博物馆工作的推动,努力发挥自身数据资源独特而丰富的优势,有效利用自身专业所长顺势而为,抓住机遇主动融入当前由人工智能技术引发的社会发展。我们需要顺应人工智能的潮流,在贡献属于博物馆领域的智慧和解决方案的同时,推进博物馆的变革并探索博物馆领域新的生长点,重新审视AI时代对博物馆工作的要求,重新定位博物馆的核心能力,重新规划博物馆的工作方式和业务生态。

2

把握人工智能在博物馆的主要应用场景

在博物馆服务领域,类似ChatGPT的智能问答将大行其道,不仅能够取代近几年以程序生成的机器问答,也足以代替人工型的知识问答。博物馆的导览程序也可以通过接入人工智能技术而使观众获得如自助查询、智能推荐等更便捷和全面的体验。

在研究领域,“人文学科,研究人类社会和文化各方面的学术学科(如历史、语言学、政治、神学和文学),面临着数字工具和方法所带来的机遇,这些工具和方法可以促成变革性的创新研究”。在研究工作中,除了能够提高资料检索效率以及当作写作助手以外,AIGC对不同来源的研究资源的不断补充和对使用对象的一视同仁会进一步模糊了行业之间的界限区分,有助于打破学科界限,有利于跨学科合作研究的形成。此外,在博物馆藏品及其相关数字资源累积了庞大的资源和能量以后,可以在保持原有研究特点和优势的前提下,去尝试进行以数字资源为主要对象的数字化研究工作。在最近进行的上海博物馆民国纸币研究系统的开发中,我们就通过AI技术,采集获取纸币上各种信息,并进行汇聚、比照,获得深入研究所需要的信息源(图8)。通过调用数据集进行各类特征的自动排列和比对,有利于博物馆民国纸币研究工作的开展和相关知识图谱的构建。

图片

图8 民国纸币研究系统中的纸币签名识别和聚类

在展览展示领域,既可以在策展过程中利用AIGC工具,按描述从数据库中自动将关联数据生成不同主题并进行推送,以此形成简单的策展文案和展品目录,提高策展的效率和水平;也可以利用机器学习算法对目标观众的喜好和兴趣进行预测和分析,更加精确地设计展览内容和展品,提高展览的吸引力和参观体验;可以利用AIGC工具高效生产图像、视频、3D模型等,并结合已有的文本和数据直接生产出更加智能化和更富有叙事性的可视化产品。

3

理性对待人工智能应用的利弊

博物馆的人工智能应用还是要以博物馆的宗旨为依归,以博物馆的业务需要和业务发展为中心,既要从实际出发,循序渐进,不盲目冲动,不为技术所绑架,又要抓住机会,促使新兴技术成为推动博物馆转型升级的引擎,也要警惕并防止脱序而产生灾难性的后果。

六、结  语

在新技术革命浪潮席卷全球之际,博物馆需要勇敢面对,顺势而为。虽然ChatGPT等人工智能技术在目前来看还并非十全十美,甚至在某些方面还存有一定风险,但其在问题理解、人机交互方面的强大,以及由此带来的内容生成方面的潜力是不容忽视的。未来已来,博物馆要充分借助数据资源优势,融合人工智能等新型技术,为更好地实现博物馆的数字化转型和创新发展服务

三亚市博物馆·公益 三亚市西河西路2号文体大楼三楼 0898-88666125
Copyright ©三亚市博物馆·公益 琼ICP备19004074号-1
  • 三亚旅文