人工智能于博物馆应用刍论

字号:T|T
2023-09-26 16:35 来源:博物院杂志
导 读:以ChatGPT为代表的人工智能技术快速进入人类社会中,各行业开始掀起了新技术革命的浪潮。本文初步介绍了这类人工智能技术的基本原理和应用场景,详细分析了博物馆的主要业务和对人工智能技术应用的范围、方法,展望了博物馆信息化建设在人工智能技术助力下的发展前景。

       2022年8月24日,在布拉格举行的第26届国际博物馆协会大会赋予了博物馆新的定义,认为:“博物馆是为社会服务的非营利性常设机构,它研究、收藏、保护、阐释和展示物质与非物质遗产。它向公众开放,具有可及性和包容性,促进多样性和可持续性。博物馆以符合道德且专业的方式进行运营和交流,并在社会各界的参与下,为教育、欣赏、深思和知识共享提供多种体验。”在这个定义中能发现这里面贯穿着一条主线,就是信息。遗产中的信息需要研究提取,运营需要信息支撑作出判断和协调,交流更不必说就是信息或者承载着信息的载体直接流动,体验是通过信息的传递、接受来感受。因此这些都是围绕着信息展开的活动。

       2009年笔者在一篇文章中谈到博物馆是信息的集散地,其藏品是一种承载隐含信息的载体,需要经过研究解读后,才能够被认识和有效利用。这种研究和解读是博物馆的基础工作,大致可归为科研工作。如果将科研工作的过程隐去,直接将结论搬到展览中,或者是将科研的过程直接搬到展览中,那么绝大部分非相关专业的观众就可能看不懂了,因此就需要讲解员来通俗地、拓展地讲解。观察讲解员的讲解过程,会发现他们一般采用联想方式将相关内容以逻辑形式组织起来,使用平易近人,乃至情感充沛的口语表达方式,将观众带入可以理解、可以交流、通过联想唤醒记忆的场景中。本质上这是一个信息提取、加工、组合、传递、接受的过程。

一、认识人工智能

       人工智能是计算机学科的分支,通过对信息的提取、理解、组合、延伸、扩展等处理,遵循人类思维活动规律,在机器上构建出模拟人类智慧的人工系统。在人类社会活动中,存在大量简单重复的固定动作,针对这种场景很早就诞生了计算机和网络技术支持下的自动化系统,并广泛应用到各行各业,如建筑智能化系统、道路交通信号管理等。但是这种以预设阈值产生对应动作的自动控制系统还远远不能满足人类对智慧机器系统的追求。

       人类智慧的重要基础是其独有的思维模式,这种指导行为的思维模式来自于不断的知识学习和尝试,人类通过一次次的实践和调整,得到了能够做出适应外界变化行为的思维模式。人工智能模拟人类的这种方式,构建起能够获得事件特征和结果之间信息关系的数学模型,将已有的信息通过线性回归、逻辑回归等方法进行分析,寻找特征和结果之间的关系,一步步地训练、调整模型,建立起判断规则,使之得到接近人类获取、整理、归纳、利用知识的能力,这就是机器学习。这些经过训练的模型能够模拟人类的认知能力,通过判断规则对训练过的海量资料加以分类、裁剪、连接、组合来应对人类提出的要求,辅助甚至在部分应用场景中代替人类的工作。

       2015年埃隆·马斯克和PayPal公司创始人彼得·泰尔、领英公司创始人里德·霍夫曼、山姆·阿尔特曼等人在旧金山创建了OpenAI公司,致力于创造造福全人类的安全通用人工智能技术。

       OpenAI在2021年1月发布连接文本和图像神经网络的CLIP,计算机可以从图像中识别图案中的特点,并转化成文字,同时推出了由文字生成图像的DALL·E。OpenAI还开发了MuseNet和Jukebox模型来创作音乐,而Codex模型则可以将自然语言描述转化成程序代码,实现电脑自动编制程序。

      OpenAI在2018年至2023年间陆续推出了GPT-1、GPT-2、GPT-3、GPT-4,2022年11月发布的人机对话软件ChatGPT是基于GPT-3.5、以Transformer为核心结构的大型语言模型。GPT-3是一种具有1750亿个参数的自回归语言深度学习模型,该模型经过了将近0.5万亿个单词的预训练,因此ChatGPT的核心是自然语言分析、语言数字模型和大数据量的文本语料训练,利用大量的参数来拆分、比较、归类自然语言,通过海量的资料预训练在更窄的数据集上微调模型,从而实现理解自然语言并做出针对性的回答。对此最为简略的理解就是:人类用自然语言向ChatGPT提出问题后,ChatGPT首先分析自然语言,提取其中的关键词语,再搜寻、比对训练资料库,按照关键词语在数据库中出现的频率确定关键词语的重要性、相关性顺序,裁剪、组合与该问题相近的资料文本,最后用与问题一致的语种输出回答。

二、博物馆基础业务

       笔者一向认为综合性公共博物馆的主要业务工作包含藏品征集和保管利用、陈列展览和公众服务、科学研究和安全保护三大类,为了能更好地理解博物馆的基本业务,下面将从纵向和横向两个方面来剖析。

       在纵向方面,围绕着藏品展开的工作呈现出流水作业的特点,首先是根据馆藏特点、展览要求、科学研究等因素征集藏品,藏品经过鉴选、分类、消杀、登录等环节入库保存;其次根据藏品现状、展览需要、科学研究等要求,对部分藏品做修复、保护处理;第三按照展览的要求,如内容、研究结论、展场空间、艺术效果等因素,选择藏品作为展品;第四围绕展览或某些特殊的藏品,开展面向观众的文化服务活动,如文创产品、文化讲座等。

       在横向方面,围绕博物馆的基本业务,即藏品保管、展览陈列、观众服务展开一系列相关工作,如安全与通信保障、环境控制、科学研究、秩序维护、社会宣传、行政管理等,为博物馆的日常运营提供舒适、便利、安全的环境,为博物馆藏品的利用提供科学研究依据,为博物馆扩大社会影响力提供基础条件。

       以上凡此种种,看似复杂,实则都贯穿着信息这条主线,每一项工作都有对已有信息筛选、甄别、对比、归类,形成规律和判断条件这一环节,并且利用这种规律和判断条件产生新的信息。基于这种判断,就有必要将博物馆的这些业务工作从信息处理的角度,按照处理的方式从简单到复杂予以分类,才有可能合理运用上一节所讨论的资料数据驱动型人工智能技术。

       为建立起博物馆信息处理的逻辑关系,笔者提出了“原生数据—交互数据—决策数据”这一递进的概念,认为任何物体或事件都带有自身的可测量和观察得到的原生数据,这种原生数据明确规定了自身和其他物体或事件的相同和相异之处,当大量的原生数据交织在一起,并且在一定的规则或条件下,各类原生数据相互作用,就产生了交互数据,与原生数据有着前后演进的联系;各类交互数据多次反复作用,达到一定阈值时,就出现了决策数据。获得这些数据有三种基本通道:从设备获取、从系统获取和由人工获取。前两种获取数据手段的基础是信息化设备和系统,通过一定的协议和传输方式,从数字化设备中直接采集到数据,或者从经过集成的信息系统中采集到数据;后一种获取方法不依赖于信息设备或系统,而是由人工直接采集,再输到信息系统之中。

       按照由简单到复杂、由重复操作到创新决策的顺序,对上述过程中存在的数据采集、信息处理方式予以分类,来探明人工智能在博物馆业务中可能的应用场景。

1. 简单机械、往返重复的信息处理

       复杂的事物往往是由简单的单元构成,一连串相关的简单事物遵循一定的组合规则联系起来,就形成了较为复杂的事物。博物馆中这样由简单单元构成复杂系统的应用普遍存在,如安全防范监控系统、楼宇自动控制系统,以及场馆保洁、物资管理、一线人员管理等系统。这些系统中的数据属性清晰、生产源明确,并且是长期、固定地产生。这些数据经过预置规则的比较、分类、判断,产生的结论则可直接驱动执行机构,从而实现智能化运行,人类在这些系统中处于被动地位,大多数情况下依从机器指令行事。这类系统属于过程控制的自动化系统,很早就在包括博物馆在内的各个行业中得以广泛应用。

2. 综合性信息提取、组合、利用

       这类应用涉及多个相关信息系统的数据、信息的获取、综合判断和利用,需要跨应用系统、跨业务部门采集数据和信息,在既有规则的框架下,组合这些信息,形成判断,产生新的操作指令。这一类应用所需的数据和信息支持来源较多,属性差别较大,其产生的结果往往在某一层级或系统中形成较大范围或全局性的影响。博物馆中的入侵报警联动系统、藏品出入库点交系统、藏品管理信息系统中的文物保护等相关信息采集、藏品环境监测控制系统等都属于这一类的应用。这三项应用都涉及综合性信息的获取和利用,这些信息的来源虽然广泛,但都在具有关联性的范围之中,其判断的规则也较为容易制订。但目前三项应用在很大程度上依赖人的主观意识,效率、准确性、安全性还得不到较高程度的保障。

3. 基于逻辑思维的综合性信息利用

       逻辑思维是智慧生命体具有的思维能力,是对事物认识的思维形式和规律,通过逻辑思维,人类认知了客观世界的普遍规律,掌握了表里之间、彼此之间、整体和局部之间、过去和现在及未来之间的推论工具,增强了掌控世界的能力。博物馆的信息化应用中有很多这样需要逻辑思维能力的综合性信息利用,如导览信息管理系统、观众客流量分析系统、策展过程中展品汇集系统等。

4. 以形象思维为主具有创造性的跨领域信息逻辑分析和利用

      著名哲学家伊曼努尔·康德认为人类的知识来源于直观和概念,一切伴随着意识的关于客体的表现不是直观的就是概念的,因此客体以直观的形象作用于人,形成了知识的重要来源。包含想象思维、联想思维、直觉思维和灵感思维在内的形象思维是博物馆开展科学研究、创造以陈列展览为主的精神文化产品的重要手段。这种手段的运用首先需要对大量的信息加以采集、阅读、筛选、整合和归纳,其次借助长期濡化得到的知识积累和艺术、科学修养,才有可能形成具有创造性的形象思维能力。这种能力和人类的意识和记忆有着密切的联系,神经网络的循环导致人类思维能力的基石——意识进行连续的、可以联想、可以形成指令、可以推理的信号传递和识别。到目前为止,这是人类等高等智慧碳基生命体才具有的能力。虽然目前GPT模型一类的人工智能技术尚不具有这种能力,但已经能够在信息的采集、分析、筛选、整合和归纳方面来协助人类的思维工作,并在科学家的努力下,试图产生基于硅基的意识。

三、博物馆应用前景

      当前以OpenAI公司的GPT模型为代表的一系列人工智能技术,掌握了通过分析自然语言结构和组合方式来构建人类知识体系的能力,为人类扩展自身能力带来了有力的协助,但也对人类社会的安全保障提出了挑战。

      博物馆是人类创造出来的一种特殊的、由社会公众共同拥有的机构,这种机构中存储着人类的一部分知识,也传承和扩散着这些知识和信息,十几年以前笔者就提出博物馆是保存人类和自然发展过程中存留下来的有见证意义的信息集散地,因此以GPT为核心的LLM会对博物馆信息处理和利用工作产生深刻的影响。

      通过以上的分析,可推测博物馆将很快在以下四个方面迎来GPT一类人工智能的初级应用阶段。

1. 数据收集、信息处理和过程控制

       毋庸置疑,强大的预训练使得资料驱动型语言模型能够快速地收集数据,整合相关资料为人类提供服务。借助Codex模型、Cursor之类人工智能代码编辑器可以自动生成程序,驱动信息设备执行规则所要求的任务。

2. 多媒体艺术制作

      结合GPT、CLIP、DALL·E、Jukebox、TTS等模型、方法形成多模态的人工智能应用,就能够根据人类规定的提词和限制条件完成美术和音乐创作、识别图案内容、翻译并生成各种语言的语音、创建虚拟人物、编辑制作视频、开发文创产品、编制传播文案,为博物馆快速提供更为广泛、更为多样性的发展空间。

3. 观众服务

       博物馆利用以上描述的人工智能技术能力,可以完成知识的收集与分析、整合、呈现形式的构建,自动形成讲解词、服务用语并利用各种形式表现出来,进而还能产生与观众的互动。在这一方面的应用值得研究的是观众对此的接受程度。

4. 智慧博物馆建设

       我国博物馆的信息化发展已经走过了近四十年的历程,智慧博物馆建设也如火如荼地开展了十年,虽然智慧博物馆应用案例随处可见,但目前的应用均没有脱离传统信息化建设的范畴,尚无一种可称为“智慧”的应用。基于GPT等模型人工智能应用的迅猛发展带给了智慧博物馆建设成功的希望,也促使我们重新审视博物馆信息化的建设方式。

       博物馆中从设备到人员,每时每刻都在产生各种数据。为了利用这些数据和信息来更好地为藏品、观众服务,博物馆建立各种各样的信息应用系统,但不可避免地遇到了各种系统之间的壁垒,这种信息的壁垒又增加了人员和业务之间的屏障。为了突破信息交流障碍,不得已开始了叠床架屋般的信息集成建设,导致系统繁杂、信息紊乱、维护艰难,在选择、使用、发展等方面使人难以适从。

       有鉴于此,可以采取一种简便易行的方法,即按照人工智能的模式,将博物馆的信息系统划分为数据生产和信息利用的二元结构:一元是数据的产生、采集、归纳,形成信息;一元是对信息的利用;中间则采用人工智能技术处理这些信息,并根据利用的需要产生各类应用。这种建设模式将大大压缩数据、信息的处理成本,提升信息系统的灵活度和可利用性,扁平化的信息系统也将促进博物馆建设成为柔性组织,更好地适应瞬息万变、丰富多彩的社会需求。

       以GPT模型为代表的人工智能技术已开始影响人类社会的发展,我们需要清醒认识到这类技术在准确性、可解释性、科技伦理方面还存在缺陷,对这种缺陷的不当利用,在网络的助力下可能会对社会带来难以估量的破坏力。因此,对于人工智能技术的应用需要抱持严肃、认真的态度,设置应用边界,加强安全参数和机制管理,让这项技术在人类的控制下造福人类。


三亚市博物馆·公益 三亚市西河西路2号文体大楼三楼 0898-88666125
Copyright ©三亚市博物馆·公益 琼ICP备19004074号-1
  • 三亚旅文