探究｜基于用户生成内容的博物馆研学旅行游客满意度量化研究

字号：T|T

2026-06-12 08:47 来源:自然科学博物馆研究

【摘要】在国家战略导向下，研学旅行的发展质量直接关乎新型文旅业态的持续生命力。在这一背景下，本文基于用户生成内容（UGC），构建博物馆研学旅行游客满意度评估模型，旨在为博物馆管理者优化研学产品服务策略提供依据。研究以旅游电商平台上的用户生成内容（UGC）为数据来源，运用BERTopic提取主题，结合SnowNLP进行情感分析，并基于IPA模型分析主题关注度与满意度。实证表明：优势属性集中于建筑、人员服务及解说体验，可作为核心宣传方向，而门票与预约因高关注度与低满意度被列为重点改进属性，此外，讲解设备与管理作为机会属性，在资源允许时可优先优化。研究结果揭示了博物馆研学产品的核心关注点与情感倾向，为博物馆的服务优化与高质量发展提供了实证依据。

【关键词】用户生成内容（UGC）；博物馆研学；研学产品；游客满意度

在“文旅融合”战略推进背景下，文化和旅游成为经济社会发展的新引擎，研学旅行作为其深度融合的典范，展现出巨大潜力。据《中国研学旅游发展报告（2023—2024）》显示，2023年我国研学旅游市场规模突破千亿，同比增长超20%。同时，博物馆逐渐成为青少年教育与社会公众文化体验的核心场景。然而，在国家发展和改革委员会等部门联合发布的《关于推进博物馆改革发展的指导意见》中指出，当前博物馆发展仍难以充分满足公众对美好生活的期待，存在一定程度的不均衡性。因此，深入剖析游客评价内容，识别我国博物馆研学旅行过程中需优化的关键环节，成为博物馆管理方面亟待解决的重要议题。

20世纪70年代，美国学者皮赞姆（A. Pizam）等提出游客满意度理论，认为满意度源于游客对旅游地预期与实际体验之间的差异。随着旅游需求的个性化发展，传统问卷、访谈等方法在捕捉游客情感方面逐渐显现不足，尤其在博物馆研学旅行情境中，满意度既涉及服务质量等显性因素，也涵盖文化体验等隐性维度。因此，如何从评论文本中有效提取主题，进而准确识别复杂表达中的深层情感，成为提升服务质量的关键。

综上所述，本文以美团、携程网、去哪儿网的游客评论为数据源，选取故宫博物院和中国国家博物馆作为案例地。使用基于双向编码表示的主题建模（Bidirectional Encoder Representations for Topic modeling，BERTopic）与中文自然语言处理工具包（Snow Natural Language Processing，SnowNLP），对博物馆研学参与者的外在需求与内在感知进行精确识别与量化分析。同时，构建重要性—绩效分析模型（Important-Performance Analysis，IPA）以识别影响研学旅行体验的关键因素，发现当前博物馆研学服务中存在的主要问题，并据此为其持续优化提供策略参考。

一、相关研究

（一）研学旅行

近年来，研学旅行作为一种新兴的实践教育方式，在我国受到越来越多的关注。早期研究主要聚焦于研学旅行的内涵界定与价值意蕴，强调其在素质教育和文化育人中的作用。但随着政府相关政策的持续出台，研学旅行逐步被正式纳入教育体系，学术研究也开始从理论探讨转向实践层面，即从关注内容逐渐拓展至研学课程设计、研学活动方案设计、研学旅行产品开发、研学基地建设等方面。在此基础上，学界逐步从多学科视角对研学旅行展开研究。

目前，国内关于研学旅行的研究主要立足于教育学与旅游学两个维度，分别强调其育人功能与旅游属性，为该领域的理论体系建构及实践路径拓展提供了多层次的支撑。在教育学视角下，董艳等以乔家大院民俗博物馆为依托，探讨课程方案在增强学生学习成效方面的实践路径。相关研究强调，研学旅行作为课外教育模式，在实现教学目标与推动实践教学方面体现出积极作用与现实意义。从旅游学角度出发，相关学者更侧重于研学旅行产品体系的构建及其市场运作机制的研究。崔娜娜等从游客动机与需求出发，构建以需求为导向的产品模式设计框架。总体来看，当前学界在研学旅行领域已形成一定的研究基础，但仍缺乏对游客体验过程的微观洞察，尤其在研学场景中游客满意度、情感体验等方面研究相对不足，亟需通过引入数据驱动技术，以推进更具深度的实证性研究工作。

（二）博物馆游客满意度研究

在博物馆用户满意度研究的早期阶段，学者多从参观者角度切入，对博物馆服务进行评估，常用的数据收集方法主要包括问卷发放与深度访谈，内容涵盖服务表现、人员素养以及场馆条件等多个维度。如servqual模型就是通过问卷访谈了解服务是否达到游客预期，以衡量服务质量和游客满意度。

在研究内容方面，相关学者普遍聚焦于识别博物馆服务的关键维度及其对用户满意度形成机制的作用路径。初期研究多数依赖于质性分析方法展开探讨，如李志勇等基于双因素理论，通过因子分析区分“保健因子”（基础设施）与“激励因子”（文化体验），验证后者对忠诚度的关键作用。随着大数据技术普及，学者开始引入文本挖掘自动提取维度，如郑淞尹等则通过方面级情感分析识别数字化服务的５大维度，并揭示“设备灵敏度”等12项影响因素。近年研究进一步融合深度学习与理论模型，如高小燕和刘一诺结合结构方程模型（SEM）与重要性—绩效分析模型（IPA），提出智慧技术通过“交互性→沉浸体验→忠诚度”路径影响满意度，为博物馆数字化转型提供跨学科方法论支持。

梳理文献可以发现，传统游客满意度分析方法（如问卷与评论数据）存在小样本局限、人工标注依赖及隐性需求识别不足等瓶颈。随着自然语言处理技术的突破，基于深度学习的细粒度情感分析逐渐兴起，为构建多维度满意度动态监测模型提供了新路径。在此背景下，如何运用智能文本分析技术实现隐性需求挖掘与精准满意度评估，已成为优化博物馆服务质量的重要研究命题。

（三）IPA模型

IPA模型由英国学者马提拉（Martilla）等最初用于评估市场营销项目的执行成效。该方法随后被扩展至服务质量研究领域，逐渐发展为一种依据服务属性在重要性与表现层面相对位置进行评估的有效分析工具。在IPA模型的研究中，属性重要性的界定被视为关键环节（见图1）。相关学术成果中，常见的确定方法主要包括两类：一是基于受众主观反馈的自我陈述方法，二是通过统计分析或机器学习技术推导的重要性估计，即隐式方法。传统的自陈式数据收集方式，如问卷调查，虽然操作简便且易于实施，但其结果往往受到受访者主观判断的影响。基于这一局限性，部分研究者开始采用统计建模或机器学习等隐含性分析手段对数据进行处理与推断。例如，毕建武等提出运用机器学习手段，通过挖掘用户在酒店各服务维度下的评论情感，构建感知重要性的预测模型。在博物馆研学旅行满意度场景下，本文结合BERTopic与情感分析工具SnowNLP，构建适用于该场景的IPA分析框架，以实现对游客关注重点与满意度的精准识别。

（四）小结

目前，国内关于研学旅行的研究已在教育学与旅游学两个维度取得了初步成果，然而，在聚焦博物馆研学旅行这一特定情境时，对于游客个体层面的感知体验与满意度缺乏深入的微观视角与实证分析。因此，研究者开始尝试基于评论内容开展情感分析与服务维度挖掘，然而多数方法仍停留在粗粒度分析层面，难以有效提取游客在各具体属性上的情感倾向。综上所述，本文选取研学产品发展较为成熟的故宫博物院和中国国家博物馆作为研究对象，从旅游电商平台采集游客对这些博物馆的在线评价。借助BERTopic模型开展属性识别与语义相近特征的聚类分析，系统挖掘用户评论文本中的核心服务要素。在此基础上，构建“关注度—满意度”分析框架，量化并识别影响博物馆研学旅行满意度的关键因素，为优化游客体验提供支持。

二、研究设计

（一）研究框架

研究框架分为4个部分（见图2）。首先是数据采集与预处理。其次，采用BERTopic模型进行文本聚类分析。再次，借助SnowNLP工具对各主题评论文本进行情感倾向识别，提取情绪得分。最后，基于IPA模型构建“关注度—满意度”分析框架，进行主题定位分析。

（二）研究方法

1.BERTopic文本聚类模型

BERTopic是一种基于BERT预训练语言模型的主题建模方法，相较于传统的隐含狄利克雷分布（Latent Dirichlet Allocation，LDA）方法相比，能够更有效地捕捉词语之间的上下文关系与深层语义联系，从而实现更精准的文本聚类与主题识别。本文采用BERTopic模型对文本进行嵌入，并结合非线性降维算法（Uniform Manifold Approximation and Projection，UMAP）与HDBSCAN聚类，完成无需预设主题数量的自动聚类过程。随后，借助类TF-IDF算法提取各主题关键词，生成具备可解释性的标签。该方法在提升主题建模的语义准确性与聚合效果方面具有优势，适用于本研究的主题识别任务。

2.SnowNLP情感分析模型

情感分析，又称为意见挖掘，旨在对具有主观倾向性的文本进行处理，以识别并解析其中所蕴含的情绪取向，从而对文本中的情感态度进行系统分类。SnowNLP是一个专门针对中文文本处理设计的方法，因此在中文情感分析任务中表现优越，并被广泛应用于相关研究。该方法主要基于自定义情感词典，通过统计分析文本，得出一个0～1之间的情感得分。得分越接近1，文本越积极；越接近0，文本越消极（见图3）。

3.基于IPA模型的“关注度—满意度”分析框架

在游客满意度分析中，IPA模型能够有效地对各项服务和活动进行优先级排序，帮助管理者识别出那些对游客来说具有高重要性但表现较差的领域（即“改进区”），以及那些表现优异且需持续加强的领域（即“优势区”）。已有学者基于用户生成内容（UGC），将情感分析引入IPA模型，用于品牌营销口碑调查、景区服务质量评估和企业舆情分析。参考相关研究成果，构建适用于博物馆研学旅行产品的“关注度—满意度”分析框架，步骤如下。

满意度的计算：

基于SnowNLP模型获得第i个主题的情感值集Si={Si1,Si2,Si3……}，取均值得出满意度Pi，具体见式（1）。

（1）

式中：wi为第_i个主题的评论总数。

关注度的计算：

为全面评估评论中各主题的关注程度，本文引入“综合关注度”指标，融合评论数占比和情感倾向两个维度。其中，评论数占比体现主题在用户中的关注热度，情感倾向体现用户的情感反馈。本研究基于熵值法确定两个指标的权重，最终将情感得分与评论数占比的权重分别确定为0.3和0.7。通过标准化处理各指标数据，计算各主题的综合关注度，用以衡量各主题的相对重要性，具体见式（2）。

综合关注度计算公式：

（2）

式中：Ai表示第i个主题的综合关注度得分。

三、实证研究与结果分析

（一）数据采集与预处理

根据教育部于2017年12月发布的首批全国中小学生研学实践教育基地名单，故宫博物院与中国国家博物馆均被认定为基地单位。因此，本文选取上述两所国家级博物馆为研究对象，并通过Python程序，从美团、携程及去哪儿网三大旅游平台采集共计31022条用户评论，为后续的主题提取与情感分析提供数据支撑。

随后进行了数据清洗，包括去除重复评论、筛选与“研学旅行产品”相关的评论，以确保数据分析的准确性。为确保评论文本与“研学旅行”情境高度相关，本文在数据预处理阶段采用关键词筛选与语义审阅相结合的双重标准。首先，依据研学机构常用表达，构建涵盖“研学营”“学生团”“老师”“研学体验”“课程任务”和“研学活动”等高频关键词的初筛词典，以识别潜在研学相关评论；其次，结合典型文本样本开展人工标注，由两名研究者分别独立判断评论是否与研学场景相关，针对意见不一致部分进行讨论复核，最终剔除与研学主题无关的普通游客评论，从而提升数据集的情境聚焦度与分析的有效性。

随后，采用Jieba分词工具对文本进行分词与词性标注，并结合哈工大、百度及四川大学的停用词表，去除“的”“了”等无实际意义的高频词，降低噪声干扰。最终，共获得13276条有效评论，构建了后续分析的核心数据集。

（二）主题聚类

本文采用BERTopic模型对用户生成内容（UGC）进行主题挖掘。首先基于bert-base-chinese预训练模型生成512维句向量，通过UMAP算法降维（n_components=5，n_neighbors=15，cosine度量）平衡语义保留与计算效率；继而运用HDBSCAN密度聚类（min_cluster_size=24，min_samples=10）识别高密度主题簇，通过动态阈值策略自动分离噪声数据，最终基于c-TF-IDF算法生成可解释主题关键词。该方法在保证语义关联性的同时，实现了大规模评论文本的高效主题建模。

在完成聚类后，利用类TF-IDF算法从各主题中提取关键词，确定每篇文档的所属主题。对语义相近的主题类别进一步进行合并处理，最终共提取出9个主题（见表1），分别为：Topic0（解说体验）、Topic1（门票与预约）、Topic2（人员服务）、Topic3（建筑）、Topic4（讲解趣味性）、Topic5（展品参观）、Topic6（服务管理）、Topic7（人文历史）、Topic8（讲解设备）。

（三）产品评论情感分类与满意度分析

1.情感分布

为了识别评论数据中的情感倾向，使用SnowNLP库进行情感分析。将经过主题分类形成的9个类别中的数据进行提取与保存，形成Topic0至Topic 8共9个数据集。在情感极性的划分方面，本研究参考已有文献，设置情感值范围在0-1区间，以0.4为阈值，即如果修正情感分数大于0.6，则将对应的情感极性设置为“积极”；如果修正情感分数小于0.4，则将对应的情感极性设置为“消极”；否则，将对应的情感极性设置为“中立”。受篇幅限制，只列出一条具有代表性的评论，单位名称已隐去（见表2）。

2.情感倾向

利用SnowNLP对Topic0至Topic8各主题下的评论数据进行情感评分，并结合自定义情感词典对得分结果进行修正。结果显示，Topic0（解说体验）、Topic2（人员服务）、Topic3（建筑）与Topic7（人文历史）的情感得分均高达0.99，相比之下，Topic4（讲解趣味性）、Topic5（展品参观）的情感均值分别为0.96和0.93，在Topic1（门票与预约）、Topic6（服务管理）和Topic8（讲解设备）中，情感均值分别为0.681、0.565和0.528，出现了较多的消极评论。

（四）关注度分析

根据计算结果，九个主题的综合关注度由高到低依次为：Topic0（解说体验）为0.482，Topic2（人员服务）为0.428，Topic1（门票与预约）为0.364，Topic3（建筑）为0.35，Topic4（讲解趣味性）为0.317，Topic5（展品参观）为0.305，Topic7（人文历史）为0.305，Topic6（服务管理）为0.182，Topic8（讲解设备）为0.163。其中，Topic0（解说体验）的得分最高，说明用户对讲解体验的关注最为集中，既有较高的评论热度，也伴随积极的情感反馈；而Topic6（服务管理）与Topic8（讲解设备）的关注度相对较低，表明这些方面在用户评论中提及频次较少或情感倾向较为平淡。

（五）IPA模型分析

基于上述分析，构建“关注度—满意度”分析模型，并分别通过公式（1）与公式（2）计算主题Topic0至Topic8的整体满意度与关注度。同时以平均满意度0.847和平均关注度0.322为分界值，将坐标平面划分为四个象限（见图4）。

Topic0（解说体验）、Topic2（人员服务）和Topic3（建筑）位于第一象限，属于研学精讲的优势属性，应当继续保持。特别的，解说体验位于高重要性—高满意度的区域，说明故宫博物院和中国国家博物馆的精讲服务不仅受到广泛关注，而且情感反馈积极，呈现出典型的“优势区”特征。因此，博物馆在管理上应进一步强化讲解内容多样性与服务标准规范，巩固其优势地位。

位于第二象限的属性有Topic4（讲解趣味性）、Topic5（展品参观）和Topic7（人文历史），虽然游客对这些属性的关注度较低，但在实际体验上却有出色表现。针对这些属性，景区目前无需加大投入，可维持现状。

位于IPA模型第三象限的属性包括Topic6（服务管理）与Topic8（讲解设备），此类特征在当前游客认知中重要性较低，满意度评价也偏低，因而可为景区优化提供方向指引。在资源相对有限的情形下，博物馆可暂缓对此类属性的干预，但仍应保持必要关注，并在条件允许时逐步推动改进，以促进整体满意度提升。

位于第四象限的属性是Topic1（门票与预约），游客对此类属性持有较高的感知重要性，但对其满意度较低，呈现出典型的“高关注—低满意”矛盾特征。该类属性常被视为影响整体感知体验的关键短板，因此博物馆需要针对这个方面进行有针对性地改进，从而提高游客的满意度。

四、结论与建议

（一）结论

通过BERTopic模型对游客评论数据进行主题聚类分析，共提取九个主要主题。其中，“解说体验”“人员服务”与“建筑”是游客评论中出现频率较高的主题，反映出游客对讲解内容、工作人员的服务态度以及博物馆建筑环境方面较为关注。

SnowNLP情感分析结果表明，游客对“解说体验”“人员服务”与“建筑”持普遍积极的态度，这表明游客在讲解内容、服务体验以及独特的建筑风貌方面获得了良好的参观体验。然而，“门票与预约”主题关注度较高，但情感得分仅为0.681，反映出博物馆在预约流程的便捷性及购票规则的清晰度方面仍有优化空间。此外，“服务管理”与“讲解设备”是游客满意度最低的两个主题。

通过IPA模型分析，对各主题的关注度和满意度进行二维分析，可将研学旅行体验的核心因素划分为四类：解说体验、讲解趣味性、建筑以及人员服务是博物馆的优势维持区；门票与预约属性亟需改进；机会提升区涵盖人文历史与展品参观；而次优改进区包括讲解设备与管理。

（二）对策及建议

在博物馆专项讲解服务方面，游客对讲解员的服务质量、趣味性及解说体验的关注度与满意度较高，博物馆应以此为基础持续提升服务质量，打造长期竞争力。例如，博物馆精讲服务受众较为广泛且层次多元，因此，博物馆精讲服务应结合受众的多元需求，打造差异化讲解体系。

游客满意度是博物馆研学旅行产品优化的核心要素，而人员管理在此过程中扮演着关键角色。首先，在游客进行安检入馆期间，应优化管理人员的服务意识，防止因服务态度问题对游客体验造成负面影响。其次，服务人员应提升游客咨询、引导及突发情况处理的响应效率，避免因秩序混乱或信息不畅而引发游客不满情绪。最后，建立科学的奖惩机制，对高质量服务予以奖励，对不当行为进行严格管理。

在门票与预约方面，游客关注度高但满意度较低，主要反映的问题为预约难度大、购票信息不清晰及现场排队时间长。为此，应优化线上购票流程，提供清晰的票种说明和预约指引，并引入智能推荐功能，根据游客需求推荐合适的参观时间。此外，针对高需求时段，可设立余票提醒及候补机制，提高预约成功率，并提供灵活退改政策，减少因行程变更导致的损失。

（三）结语

本研究基于BERTopic与SnowNLP情感分析方法，结合IPA模型，对博物馆研学旅行游客满意度进行了系统量化分析。结果表明，解说体验、人员服务与建筑环境是游客满意度较高的核心优势，而门票预约、管理及讲解设备仍存在优化空间。针对问题领域，研究提出了差异化讲解优化、智能预约管理与人员服务提升等策略，以期增强游客体验，提升博物馆研学产品质量。未来研究可进一步融入时间序列分析，探讨游客需求的动态变化，为博物馆的长期服务优化提供更精准的数据支持。需要指出的是，本研究以故宫博物院和中国国家博物馆为案例，鉴于其建筑与历史文化背景具有高度的独特性，建筑属性在游客满意度中的突出表现可能具有一定的案例依赖性。因此，在将相关结论推广至其他类型博物馆时，应充分考量其适用性与场馆特征，避免简单泛化。