生成式人工智能的理论基础
自1956年“达特茅斯会议”提出人工智能概念以来,依据对“智能”的不同定义,人工智能研究领域可分成三个主要学派,即符号主义学派、行为主义学派和连接主义学派。符号主义学派的核心思想是“认知即计算”,认为人类智能的基础单位是符号,认知过程就是在符号基础上运用数理逻辑的运算过程,任何智能系统都可以被视为符号系统。由于复杂多元的现实世界无法被归纳成个数有限的标准化“符号”进而加以“计算”,这一学派面临巨大理论与实践困境,从20世纪80年代开始衰落,至今已经失去主流地位。行为主义学派从“刺激—反应”的角度解读智能,主张通过模拟生物体对环境刺激作出的反应来构建智能系统。该学派的研究重心更多地放在行为表现上,较少关注人类的心理活动及认知结构。这种理论在机器人、自动驾驶等需要通过传感器和反馈机制与环境进行互动的领域中得到广泛应用。
连接主义学派是生成式人工智能的理论基础。这一学派早期发展较为顺利,1969年因受到强烈质疑而一度衰落,80年代中叶开始稳步复兴,自2000年代末发展尤其迅速,时至今日,其成果已对人工智能技术产生巨大影响。连接主义学派从神经科学关于人脑的研究中获得启发,通过模拟大脑中的神经元连接实现人工智能。大脑是由数百亿个神经元构成的复杂的信息处理系统。神经元相互连接,通过电信号和化学信号接收和传递信息,形成庞大的神经网络,从而支持人的感知、思维、记忆、情感和行为等复杂功能。人的神经网络具有层次结构,来自外界的环境信息先由感觉器官接收和感知,生成感官信息并交由较高层次的大脑皮层区域进行分析,随后经过分析的信息被传递到更高级的脑区进行复杂的整合和解析,信息处理的结果就是人们的感觉、思维以及身体的行动。这种逐层处理和整合的方式,是大脑能够高效、灵活应对复杂环境的基础。
生成式人工智能借鉴了人体神经网络的信息处理机制。该系统由大量类似神经元的计算单元组成。这些“神经元”被组织成多个层次结构,主要包括输入层、隐藏层和输出层。输入层类似人体的感觉器官,将收到的信息转化为计算机可以处理的数值形式。隐藏层类似大脑皮层,由多层网络组成,对输入层传来的数值进行复杂的识别和运算,提取特征,解析模式,并与系统已经广泛学习过的知识进行关联,生成更为抽象和复杂的信息,包括关键概念、语法结构、背景信息等。输出层则类似人的语言功能,将隐藏层处理过的数据生成语义明确、逻辑清晰、内容连贯的文字。
概率计算而非知识创造
生成式人工智能通过概率计算的方式进行“思考”。在这一系统中,海量数据被编码成能够被运算的、多维度的数值向量,形成一个高维数值空间。大模型通过“学习”,逐步识别出数据之间的“规律”,这些“规律”体现为隐藏层中的“神经元”及其参数。输入层传来的数据被转换为高维数值向量,通过“神经元”的计算,与大模型已经“学习”过的“知识”相匹配,然后传递到输出层。在输出层,大模型通过函数将隐藏层传来的数据转换为概率分布,并根据上下文信息动态预测和选择最有可能的词汇,逐步生成与输入相对应的文本。
以“人工智能能否取代历史学家”为例,当计算机收到这个问题时,它会将句子分解为若干词元(token),通常是子词或字符级别的单元,比如“人工”、“智能”、“能”、“否”、“历史”、“学家”等。接着,计算机会将这些词元转换成高维数值向量,并通过“自注意力机制”计算这些向量之间的依赖关系。随后,模型中的大量“神经元”会对这些向量进行计算和调整,使这些数值向量逐渐靠近多维空间中与它们所代表的词元相关的数据(例如,“人工智能”会更接近“技术”、“程序”、“计算机”等相关概念)。经过调整的数值向量会被传入输出层。在输出层,模型在按顺序生成每个词时,会计算词汇表(通常包含数万个词汇,基本涵盖常用词汇)中每个可能词汇的数值向量与当前输入向量的相似度。然后,计算机会使用Softmax函数将这些相似度转化为概率分布,选择概率最高的词汇(或处于特定概率范围内的词汇,以增加内容多样性),逐步生成符合自然语言习惯和上下文语境的连贯文本。
从基本原理可以看出,生成式人工智能缺乏人类特有的理解力和创造性思维,因此并不理解它“学习”过的信息的真正含义。美国哲学家约翰·塞尔曾提出“中文屋”的思想实验,形象描述了人工智能在知识理解上的局限性。这个思想实验假设把一个不懂中文、只懂英文的人关在一个封闭的屋子里,屋内有一本详尽的用英文释注的中文规则书。屋外有人通过传递中文纸条向屋内人提问,屋内人依靠规则书组织合理的中文回答。在屋外的人看来,屋内的人似乎理解中文,然而实际上他并不懂中文,只是执行了一套机械的操作。
生成式人工智能就像“中文屋”内的人。它并不理解文字的真正含义,而是通过复杂的神经网络结构和基于大规模数据训练的模型(类似“中文屋”里的规则书),将用户的指令与预训练过程中编码的“知识”相关联,再利用概率模型在上下文中选择最可能的词语或句子,从而生成内容。这种生成过程依赖于对已有数据的模式识别和概率计算,只是对已有知识的重组和再表达,本质上没有真正理解知识,并非真正的知识创造。
史学发展来源于创新
如果说历史学家的工作就是记录和考证过去发生的事情,那么人工智能有可能取代历史学家,因为它最擅长处理海量数据并从中梳理出事物的特征以及事物之间的相关性。时至今日,人工智能已在爬梳史料、校正字句、核验简单史实甚至生成文本等工作中发挥重要作用。然而,历史研究并不止步于此,历史学家真正的职责和使命是探索社会变迁的内在逻辑与规律,为我们认识当下、谋划未来提供借鉴与参考。这要求历史研究具有创造性,而这是人工智能所不具备的。
历史研究是一项需要充分发挥创造力的活动,其创新性首先体现在创造性地提出新问题。问题意识是学术研究的灵魂。真正有价值的问题不是凭空而来,而是源自深入的社会实践。纵观人类历史,每一次学术的重大创新发展,均离不开对时代脉搏的敏锐把握和对社会现实的深入剖析。历史研究不只是记录或考证历史事实,而是基于其所处时代背景和社会现实,理解过去人的实践活动,从而为我们提供认识今天的智慧与启迪。历史学家必须对自身、他人和社会有深刻的理解,立足时代和现实,以强烈的问题意识和鲜明的现实导向为出发点,才能真正深刻理解过去的人和事,才能创作出具有思想穿透力、经得起时间检验的精品力作,才能实现自身价值,为社会发展和文明进步贡献力量。
马克思、恩格斯《德意志意识形态》《社会主义从空想到科学的发展》《家庭、私有制和国家的起源》等伟大著作,就是历史研究强烈问题意识和鲜明现实导向的典范。这些著作科学地回答了“资本主义向何处去、人类社会向何处去”的重大时代课题,为人类解放和社会进步指明方向,不仅在理论上具有科学性和革命性,还在实践中具有重要的指导意义和现实价值。中国史学传统向来提倡经世致用,从孔子编《春秋》旨在“上明三王之道,下辨人事之纪”、司马迁作《史记》以“究天人之际,通古今之变”、章学诚《文史通义》强调“史学所以经世,固非空言著述也”,到延安时期马克思主义史学家将历史研究和全民抗战大局相结合,再到新中国成立后中国史学绽放的“五朵金花”,鲜明的问题意识和现实导向是推动中国史学从古至今蓬勃发展的重要动力。
历史研究的创新性体现为批判性思维和理论思维。历史学家不会像生成式人工智能那样,不加分辨地接受其“学习”过的材料,而是始终以怀疑和批判的眼光审视史料。例如,以顾颉刚为代表的“古史辨”派对中国上古史重新进行考辨和清理,提出“层累地造成的中国古史”说,打破了两千多年来一直作为儒家道统谱系核心的“三皇五帝”古史系统,为后人科学认识中国上古历史发挥了基础性作用。在批判性思维的基础上,历史研究还应具有理论思维。历史研究的使命是探索社会变迁的内在逻辑与规律,要求历史学家在考证历史、还原历史的基础上,透过纷繁复杂的历史现象,提炼历史演进的规律,形成富有思想穿透力的理论概括。例如,英国历史学家汤因比把研究视野扩展到人类生存的各个角落,将文明作为研究单位,创造性地提出“文化形态史观”,加深了我们对全人类前途命运的认识和理解。
在表达方式上具有一定艺术性,也是历史研究创新性的体现。历史学的根本属性是科学性,但在叙述方式上又颇具艺术性。艺术性有助于增强史学著作的表达力和传播力,具体表现为研究者个人的直觉、情感、思想、立场和想象力,明白晓畅的文字表达,清晰严密的体裁体例等。例如,司马迁撰写《史记》,开创了纪传体通史的体例,并运用灵活的叙事手法,生动展现了历史的厚重与真实,体现了深刻的思想性和艺术性,成为后世史家学习和效仿的典范。除这些方面外,历史研究还在史料的创造性解读、跨学科的交流融合等诸多方面体现着不竭的创新性。
虽然生成式人工智能功能强大,但从基本原理和运作方式看,它只是一个擅长编码数据并进行概率计算的计算机程序。它受制于算法和规则,缺乏独立思考能力和自我意识,无法像人一样在社会关系实践中塑造和确证自身,亦无法像历史学家那样参与社会变革。它无法理解文本的真正含义,亦无法批判地看待过去,从历史中发现规律、创造理论。我们不否定人工智能对历史研究的重要推动作用,但必须明确,人工智能只会依据人类的指令,从现有研究成果和数字化的历史资料中,筛选出出现频率最高的词汇,拼凑出一篇看似“正确”的文章,远不能替代历史学家在历史研究中的核心作用。它只能机械地重组现有信息,缺乏独立创新和深度分析能力,更无法为我们理解自我和理解社会提供新的见解和启示。除非人工智能的基本原理和信息处理机制发生根本性变革,否则根据当前技术架构和发展趋势,生成式人工智能要具备真正的知识创造能力依然是难以企及的目标,更不可能取代历史学家。