Lazy loaded image
AI史论2-从感知机之争到第一次AI低谷
字数 3853阅读时长 10 分钟
2026-4-19
2026-4-19
type
Post
status
Published
date
Apr 19, 2026
slug
historyai2
summary
人工智能的发展并非一条持续上升的技术曲线。在其早期历史中,技术突破、理论局限、学术权威、国家预算与冷战竞争长期交织,决定了不同路线的兴衰。其中,围绕感知机(Perceptron)展开的争论,是人工智能史上最关键的分叉点之一。
tags
文字
思考
人工智能
category
人工智能
icon
password
Description
20世纪50年代末到60年代末,人工智能领域并未形成稳定统一的发展方向,而是在符号主义与神经网络两条路线之间持续拉扯。前者试图用逻辑规则和形式化代码自上而下地刻画智能,后者则试图模仿生物神经系统,让机器通过训练自行形成识别能力。
在这场路线竞争中,感知机一度被视为最有可能突破传统程序边界的技术原型。它不依赖人类逐条手写规则,而是通过试错调整参数,学习识别图形与模式。正因如此,它在冷战背景下迅速吸引了军方、媒体和学界的高度关注,也直接威胁到符号主义阵营已建立起来的话语权和预算优势。
然而,仅仅十年左右,这条路线就遭遇了科技史上极具标志性的一次打击。马文·明斯基与西摩·派珀特通过《感知机》一书,以严格数学推导揭示了单层感知机的能力边界,并在缺乏有效多层网络训练方法的历史条件下,将神经网络研究整体推向长期冻结状态。此后,西方AI研究被迫沿着“人工手写规则”的道路前进,而真正能够挽救多层网络的关键算法,则要到更晚时期才重新进入主流视野。
这段历史的重要性,不在于简单归结谁对谁错,而在于它展示了:一个在当时局部正确、数学严密的判断,如何在制度、预算与学术权威的共同放大下,改变了整个技术领域数十年的发展方向。

一、感知机的出现:从规则输入转向训练学习

1958年,在美苏争霸和冷战科技竞赛持续升温的背景下,美国海军高调展示了感知机(Perceptron)。这是一台与传统计算机思路明显不同的机器。它的核心卖点不是执行预写程序,而是能够通过训练不断修正判断结果。也就是说,它并不依赖人类将识别规则逐条写进程序,而是尝试通过输入样本、误差反馈和参数调整,让机器自己形成识别能力。
notion image
这一技术思路之所以引发轰动,是因为它代表了另一种完全不同的智能观。传统符号主义相信,智能来自明确定义的逻辑与规则;而感知机所体现的路径则更接近生物学习机制,强调通过刺激、反馈和连接调整来形成能力。罗森布拉特本人也正是沿着这种思路展开研究。他并不认为大脑里存在一本写满规则的字典,而是认为真正的智能应当像新生个体一样,在与环境互动中逐渐长出内部结构。
他制造的 Mark I 感知机并不是抽象模型,而是一台具有实体形态的大型硬件系统,由大量线路、光电管和机械装置构成。它通过不断调整内部“权重”来改善识别结果。这种依靠试错调参积累经验的机制,虽然今天看起来原始,却已经与现代神经网络中“参数更新”的核心思想高度相似。换言之,罗森布拉特当年通过旋钮和电阻记录经验的方式,实际上可以被视为后来大规模参数学习的物理雏形。
感知机之所以在当时显得极具前景,也在于它直接击中了军方的现实需求。美国希望机器能够自动识别目标、辅助分析复杂图像,尤其是在冷战情境中对苏联潜艇、军事设备和图像信息的识别具有明确战略价值。因此,感知机很快成为媒体聚焦的“科技奇迹”,也成为预算重新分配中的关键竞争者。

二、明斯基的转向:从早期探索者到最强批评者

这场冲突之所以充满戏剧性,还因为明斯基本人并不是从一开始就站在神经网络的对立面。恰恰相反,他曾是这一方向最早的探索者之一。早在1951年,他就在普林斯顿时期利用真空管和机电元件搭建出 SNARC,一台可以模拟神经元行为、在迷宫任务中进行试探和学习的装置。
但也正是在与这类系统的接触中,明斯基逐步产生了根本性的不安。SNARC能够表现出某种类似学习的效果,却无法以优雅、精确、可证明的数学语言解释其内部机制。这种黑箱特征,与明斯基高度重视形式证明和逻辑可解释性的学术偏好发生了直接冲突。对他而言,一个即使“做对了”却无法说明“为什么做对”的系统,仍然是不可信的。
正因如此,他后来转向了符号主义。与其让机器在不透明的连接结构中自行形成模式,不如让研究者直接写入明确规则和逻辑结构。这种路线更容易解释,也更容易向资助方展示成果。问题在于,当罗森布拉特的感知机开始大出风头,并获得军方和公众的热烈关注时,明斯基实际上面临的不再只是理论分歧,而是预算、地位和路线主导权的直接竞争。
冷战时期的科研资源并不是无限的。拨给感知机的每一份预算,都可能意味着符号主义实验室少拿一份支票。因此,符号主义与连接主义之间的矛盾,并非单纯的技术争论,而是很快转化为一场关于资源和学术正统性的生存竞争。

三、XOR问题与《感知机》:一次无懈可击的局部定论

真正决定历史走向的关键节点,是明斯基与派珀特围绕感知机能力边界展开的数学分析,其中最著名的就是 XOR(异或)问题。这一问题的直观形式非常简单:两类样本呈交叉分布,例如左上和右下为一类,右上和左下为另一类,此时能否仅用一条直线将两类样本分开?答案是否定的。单层感知机只能完成线性分类,因此无法处理这种非线性可分问题。
notion image
从数学上说,这一结论没有问题。单层感知机确实存在结构性能力边界。明斯基在书中的推导因此具备极高说服力,也正是这种严密性使《感知机》成为后来神经网络受挫的重要依据。
但这场历史真正复杂之处在于:明斯基当然知道,若在网络中加入隐藏层,多层网络就可能突破单层感知机的限制。罗森布拉特也知道这一点。问题不在于“有没有想到多层网络”,而在于当时根本没有有效方法训练隐藏层。换言之,技术难题并不是结构设想,而是算法现实。没有反向传播,多层网络只存在于概念层面,无法成为可用的训练系统。
这使得《感知机》的影响力远大于对单层模型的局部批评。在当时的历史条件下,它事实上被理解为:这条路线短期内没有现实前景,不值得继续大规模投入。明斯基随后给出的结论——将研究扩展到多层网络是“毫无意义的”——就这样从一个建立在时代局限之上的判断,变成了整个领域的方向性裁决。

四、从学术判决到预算清洗:神经网络为何被迅速逐出主流

真正让神经网络进入冰河期的,并不是数学书本身,而是它所触发的制度反应。对五角大楼、DARPA 和海军研究办公室而言,他们并不需要完全读懂复杂方程式,只需要知道该领域最高权威已经明确宣布这条路线“没有前景”。在冷战预算开始收缩、资助方要求更强短期回报的背景下,这种判断迅速转化为政策动作。
官方资金几乎在短期内就切断了对神经网络路线的支持。罗森布拉特的实验室被迫解散,感知机原型设备被拆除,研究人员失去位置,相关方向也在学术会议上遭受嘲讽与边缘化。过去被媒体当作未来机器智能希望的技术,在短时间内变成了“连最基本逻辑题都做不出”的失败案例。
这一过程之所以残酷,在于它结合了三种力量:
一是数学推论的权威性;
二是预算退潮下的资助压力;
三是冷战体制中对“错误技术路线”的零容忍。
结果便是,神经网络并不是缓慢退出,而是近乎被整体放逐。
随着罗森布拉特后来不幸去世,连接主义在西方世界进入了长达十余年的低谷。AI研究主流随之完全倒向符号主义,转向手工规则、知识工程和逻辑程序系统。

五、与此同时的另一条世界线:苏联的平行探索

这段历史最具反讽意味的一点,在于当美国因《感知机》一书和预算紧缩而冻结神经网络研究时,苏联学者却在另一侧悄然推进多层网络相关工作。1965年,阿列克谢·伊瓦赫年科提出 GMDH(数据处理组方法),这被视为最早成功运行的深层多层神经网络原型之一。甚至在资源极其匮乏、计算条件远不如美国的情况下,苏联研究者仍然利用这一方法完成了某些实际预测任务。
这构成了鲜明历史对照:
拥有最好硬件、最多资金和最强学术组织能力的美国,因为悲观定论而主动封锁了自己;
而身处冷战铁幕和资源匮乏环境中的苏联研究者,却在平行空间里摸索出了另一条可能通向深度网络的路径。
但由于信息封锁、算力不足和国际学术交流受阻,这一方向并没有在当时形成全球影响。结果是,真正能够推动深层网络前进的技术火种,并未在最有资源的地方燃起,而是在两个互不连通的历史空间中相互错过。

六、如何评价这场路线之争:不是阴谋,而是时代与判断的共振

如果今天回看这段历史,把明斯基简单理解为“出于利益打压竞争路线的阴谋家”,其实并不准确。他对单层感知机局限的分析是成立的,在当时没有反向传播、没有现代算力、没有成熟多层训练机制的条件下,他对多层网络可行性的悲观判断也并非毫无根据。某种意义上,他确实扮演了“科学警察”的角色,阻止在尚未成熟的方向上继续无上限烧钱。
但历史的黑色幽默正在于此:一个在当时足够严谨、足够理性、足够负责任的判断,最终却把整个领域推向了一条后来被证明效率更低、上限更窄的路线。明斯基的推导没有错,错的是把那个阶段的局部极限,当成了更长历史尺度上的最终结论。
换句话说,这不是一个单纯的“谁故意害了谁”的故事,而是一场典型的科学范式之争:
技术尚未成熟,算法工具缺位;
学者基于现状给出悲观结论;
资助机构在财政压力下迅速放大这种结论;
最终,一条本来可能在更长期取得突破的路线,被时代提前判死刑。
等到后来反向传播出现、算力大规模提升、深度学习真正复兴时,人们才发现,当年那道被视为神经网络“死刑判决书”的数学障碍,实际上只是一个等待训练算法和硬件条件配合的历史瓶颈。

感知机之争不是人工智能史上的一段枝节,而是一次真正改变技术路线的分叉。它让人们第一次清楚看到:
机器是否能学习,不仅取决于模型结构;
技术路线能否继续存在,也不仅取决于数学对错;
更关键的是,算法、算力、预算、权威判断与时代环境,是否在同一时间站到了一起。
罗森布拉特的感知机过早出现,拥有方向感,却没有成熟训练工具;
明斯基的批评抓住了真实缺陷,也因此获得时代支持;
而整个人工智能领域,则因为这一局部正确的结论,在手工规则的道路上多走了许多年。
从今天看,这场争论留下的最大启示也许是:
技术史上最深刻的延误,往往不是因为没人提出正确方向,而是因为正确方向出现时,整个时代还没有准备好接住它。