可信网站认证代理,海北公司网站建设,深圳市住房和建设局官网在线申请,北京建设局投诉网站首页2.2 黄金年代#xff08;1956-1974#xff09;#xff1a;推理证明、感知机与早期乐观主义
以1956年达特茅斯会议为起点#xff0c;至1970年代中期#xff0c;人工智能领域进入了其第一个繁荣阶段#xff0c;常被称为“黄金年代”。这一时期#xff0c;研究者在符号推理…2.2 黄金年代1956-1974推理证明、感知机与早期乐观主义以1956年达特茅斯会议为起点至1970年代中期人工智能领域进入了其第一个繁荣阶段常被称为“黄金年代”。这一时期研究者在符号推理、机器学习雏形及自然语言处理等方向上取得了系列突破性进展并普遍弥漫着一种乐观主义情绪认为人类水平的机器智能将在数十年内实现。然而这一乐观主义背后所隐藏的理论局限与技术瓶颈也为随后到来的“寒冬”埋下了伏笔。2.2.1 符号主义的辉煌推理、搜索与“物理符号系统假说”在黄金年代以逻辑和符号操作为核心的“符号主义”范式占据绝对主导地位。其核心信念是智能行为可以通过对内部显式符号表示进行形式化逻辑操作而产生。这一范式取得了两项里程碑式成就。1. 逻辑理论家与通用问题求解器1956年艾伦·纽厄尔、赫伯特·西蒙和J. C. 肖合作开发了“逻辑理论家”程序。该程序能够自动证明怀特海和罗素《数学原理》第二章中的数理逻辑定理[1]。其革命性意义在于首次实现机器自动推理LT并非通过穷举而是采用“启发式搜索”策略模拟人类在证明过程中尝试各种可能路径并回溯的方法。催生“物理符号系统假说”基于LT等工作的成功纽厄尔和西蒙于1976年正式提出这一强AI的核心假说“物理符号系统具有必要且充分的手段来实现一般的智能行动。”[2] 该假说断言任何表现出一般智能的系统其本质必然是一个物理符号系统反之任何一个足够强大的物理符号系统都可以通过编程表现出一般智能。这为整个符号主义AI提供了理论基础和研究纲领。在LT之后纽厄尔和西蒙于1957年开发了更通用的“通用问题求解器”GPS。GPS首次明确引入了“手段-目的分析”这一通用问题求解策略通过比较当前状态与目标状态的差异选择能减少差异的操作递归执行直至达成目标[3]。GPS被应用于多种领域如谜题、积分证明了基于通用搜索策略和符号表示的“通用问题求解”理念的可行性。2. 搜索与知识表示范式的确立此阶段的研究确立了基于状态空间搜索的问题求解范式。问题被形式化为初始状态、目标状态、操作符引起状态变迁的规则及路径代价。求解过程被视为在状态空间图中寻找一条从初始状态到目标状态的路径。以八数码 puzzle 为例其状态空间由棋盘的9!9!9!种排列组成操作符为空格的上、下、左、右移动。状态空间搜索的核心是寻找操作序列⟨o1,o2,...,on⟩使得S初始→o1,o2,...,onS目标 \text{状态空间搜索的核心是寻找操作序列} \quad \langle o_1, o_2, ..., o_n \rangle \quad \text{使得} \quad S_{初始} \xrightarrow{o_1, o_2, ..., o_n} S_{目标}状态空间搜索的核心是寻找操作序列⟨o1,o2,...,on⟩使得S初始o1,o2,...,onS目标A*等启发式搜索算法的出现通过引入对目标距离的启发式估计h(n)h(n)h(n)极大提升了搜索效率其估价函数为f(n)g(n)h(n)f(n) g(n) h(n)f(n)g(n)h(n)其中g(n)g(n)g(n)是从起始节点到节点nnn的实际代价[4]。搜索范式和知识表示如谓词逻辑、语义网络、框架成为AI教科书的标准内容其影响持续至今。2.2.2 连接主义的初啼感知机的兴起与明斯基的批判与符号主义并行发展的是源于麦卡洛克-皮茨模型的连接主义路径。其黄金年代的代表是弗兰克·罗森布拉特提出的“感知机”。1. 感知机模型与学习规则1958年罗森布拉特在《心理学评论》上正式提出了感知机模型[5]。它不仅是第一个具有自学习能力的神经网络模型更是一种模拟感知和模式识别过程的生物启发式计算模型。结构典型的感知机为三层结构——输入层感受器、连接层关联单元权重可调、输出层响应单元。学习算法罗森布拉特提出了感知机收敛定理并给出了权重调整的迭代规则。对于二分类问题给定一个输入样本x⃗\vec{x}x及其期望输出ddd1或-1感知机的实际输出为ysgn(w⃗⋅x⃗b)y \text{sgn}(\vec{w} \cdot \vec{x} b)ysgn(w⋅xb)权重更新规则为w⃗neww⃗oldη(d−y)x⃗\vec{w}_{new} \vec{w}_{old} \eta (d - y) \vec{x}wnewwoldη(d−y)x其中η\etaη为学习率。该规则表明当预测错误时权重向使正确分类更可能的方向调整。罗森布拉特从数学上证明了如果训练数据线性可分该算法保证在有限步内收敛到一个解[5]。2. 轰动与局限性感知机一度引发巨大轰动罗森布拉特和资助方美国海军曾做出乐观预测。《纽约时报》报道称其是“能够行走、交谈、观看、书写、自我复制并知晓自身存在的电子计算机的雏形”[6]。然而其根本局限在于单层感知机本质上是一个线性分类器只能解决线性可分问题。对于经典的“异或”问题单层感知机无法求解。这一局限性在1969年马文·明斯基和西摩·帕佩特出版的《感知机》一书中被系统而深刻地剖析[7]。他们从数学上严格证明了单层感知机的功能局限并悲观地指出即便引入多层网络当时也缺乏有效的训练算法。这本书的出版被广泛认为是导致连接主义研究陷入近二十年低潮的直接原因之一。2.2.3 早期的自然语言处理与微世界研究在自然语言处理方面黄金年代见证了两种风格迥异的研究路径。基于规则的句法分析以乔姆斯基的形式语言理论为基础研究者试图通过编写复杂的语法规则来让计算机理解句子结构。诺姆·乔姆斯基的转换1生成语法极大影响了这一时期的NLP研究[8]。“关键字”匹配与简单对话约瑟夫·魏泽鲍姆于1966年开发的ELIZA程序代表了另一条实用路径[9]。ELIZA模拟一位罗杰斯派心理治疗师它并不“理解”对话而是通过简单的模式匹配如识别用户句子中的关键词“母亲”从预定义的脚本中选取相应的回应模板如“告诉我更多关于你家庭的事”。尽管魏泽鲍姆本人旨在展示人机交互的表面性但ELIZA的受欢迎程度却意外揭示了公众对AI对话能力的热切期待和易于满足。与此同时为了在可控环境中集中研究智能的核心问题如知识表示、推理、规划研究者创造了“积木世界”等微世界。例如特里·维诺格拉德于1972年开发的SHRDLU程序能够在一个虚拟的积木世界中通过自然语言指令操纵机械臂移动不同颜色的积木并能回答关于这个世界的状态和自身行为的问题[10]。SHRDLU集成了句法分析、语义解释、规划与推理展示了在一个受限领域中实现深度语言理解和智能行为的可能性成为微世界研究的典范。2.2.4 乐观主义的根源、表现与内在局限这一时期普遍存在的乐观主义其根源与表现如下“大人物”的公开预测多位奠基者做出了大胆预测。赫伯特·西蒙在1965年宣称“二十年内机器将能胜任人类所能从事的任何工作。”[11] 马文·明斯基在1970年表示“在三到八年的时间里我们将研制出具有普通人一般智能的机器。”[12]快速的技术突破从无到有地实现了定理自动证明、问题求解、模式识别和简单对话这些突破给人以指数级进步的错觉。对智能本质的乐观简化“物理符号系统假说”将智能等价于符号操作忽略了感知、常识、学习等困难的“接地”问题。微世界研究的初步成功使研究者低估了将系统扩展到复杂、混乱、开放的现实世界所面临的巨大挑战。然而这种乐观主义建立在对问题复杂性的严重低估之上。其内在局限包括符号系统面临的“组合爆炸”问题搜索空间随问题规模指数级增长感知机等连接主义模型能力有限且缺乏扩展性以及最关键但未被充分认识的“常识知识”问题——人类拥有的海量、模糊、情境相关的背景知识难以用形式化符号系统完整刻画和获取。本章节核心知识点总结符号主义范式主导以“逻辑理论家”和“通用问题求解器”为代表确立了基于物理符号系统假说、状态空间搜索和启发式方法的问题求解范式这是黄金年代AI研究的主流。连接主义的重要尝试罗森布拉特的感知机首次实现了具有学习能力的神经网络模型引发了早期热潮但其作为线性模型的根本局限无法解决异或等非线性问题被明斯基和帕佩特在《感知机》一书中系统批判直接导致该路径此后长期停滞。自然语言与微世界探索NLP研究分化为基于复杂规则的句法分析和基于简单模式匹配的实用对话如ELIZA微世界研究如SHRDLU则在受限环境中成功整合了语言、推理与行动展示了AI的潜力但也暴露了其领域局限性。早期乐观主义及其基础奠基者们基于早期突破做出了过于乐观的预测其根源在于将智能简化为符号操作并低估了组合爆炸、常识知识以及从微世界向真实世界扩展的极端困难性这些未解决的深层问题为随后的“AI寒冬”埋下了伏笔。参考文献[1] NEWELL A, SHAW J C, SIMON H A. Empirical explorations of the logic theory machine: a case study in heuristics[C]//Proceedings of the March 1-3, 1955, Western Joint Computer Conference. Los Angeles: ACM, 1957: 218-230.[2] NEWELL A, SIMON H A. Computer science as empirical inquiry: symbols and search[J]. Communications of the ACM, 1976, 19(3): 113-126.[3] NEWELL A, SIMON H A. GPS, a program that simulates human thought[M]//FEIGENBAUM E A, FELDMAN J. Computers and thought. New York: McGraw-Hill, 1963: 279-293.[4] HART P E, NILSSON N J, RAPHAEL B. A formal basis for the heuristic determination of minimum cost paths[J]. IEEE Transactions on Systems Science and Cybernetics, 1968, 4(2): 100-107.[5] ROSENBLATT F. The perceptron: a probabilistic model for information storage and organization in the brain[J]. Psychological Review, 1958, 65(6): 386-408.[6] New navy device learns by doing: psychologist shows embryo of computer designed to read and grow wiser[N]. The New York Times, 1958-07-08(25).[7] MINSKY M, PAPERT S. Perceptrons: an introduction to computational geometry[M]. Cambridge: The MIT Press, 1969: 1-19.[8] CHOMSKY N. Syntactic structures[M]. The Hague: Mouton Co., 1957.[9] WEIZENBAUM J. ELIZA—a computer program for the study of natural language communication between man and machine[J]. Communications of the ACM, 1966, 9(1): 36-45.[10] WINOGRAD T. Understanding natural language[J]. Cognitive Psychology, 1972, 3(1): 1-191.[11] SIMON H A. The shape of automation for men and management[M]. New York: Harper Row, 1965: 96.[12] MINSKY M. Form and content in computer science[J]. Journal of the ACM, 1970, 17(2): 197-215.