type
Post
status
Published
date
Apr 19, 2026
slug
historyai1
summary
今天我们看到的人工智能发展,尤其是大模型、深度学习与算力驱动的智能系统,并不是一条单纯由技术自发推进的线性道路。它的起点,某种意义上可以追溯到一笔只有 7,500 美元 的经费申请;它的发展路径,则深受战争遗产、冷战竞争、学术权力结构与资源分配机制的共同塑造。
tags
思考
文字
category
人工智能
icon
password
Description
今天人工智能的发展,尤其是大模型、深度学习与算力体系的崛起,通常被理解为技术持续演进的结果。但如果回看其早期历史,会发现它并不是一条单纯由技术逻辑主导的线性道路。人工智能从一开始就同时受到战争需求、国家安全、学术话语权、经费分配机制以及技术路线竞争的共同影响。
某种意义上,现代人工智能的历史起点,可以追溯到一笔仅 7,500美元 的研究经费申请。就在阿兰·图灵去世两年后,美国一批学者以极高姿态提出:只需十个人、两个月时间,就能够在原则上复制人类智能。这份提案不仅奠定了“人工智能”这一概念,也影响了此后数十年的研究方向与资源流向。
要理解今天这场技术革命的深层背景,需要从三个人开始:阿兰·图灵、约翰·麦卡锡、马文·明斯基。他们分别对应了人工智能历史上的三个关键层面:智能问题的提出、学科概念的命名,以及技术路线与资源秩序的塑造。
一、图灵:机器智能问题的提出者
将时间回拨到1945年,二战刚刚结束,世界很快进入冷战格局。情报截获、密码破译、自动化计算成为国家竞争的重要组成部分。在这一背景下,英国布莱切利园的密码破译工作具有极高战略价值,而阿兰·图灵正是这一体系中的关键人物。

二战期间,图灵参与设计了用于破解德军恩尼格玛密码的 Bombe 机器。面对每天变化、组合空间极大的密码系统,图灵没有依赖大规模人工分析,而是提出了一个后来极具历史意义的思路:用机器去打败机器。这套方法的价值不仅在于战争胜负,更在于它奠定了一种重要技术范式——当问题规模超出人脑处理能力时,通过大规模计算资源进行穷举、筛选与推断。
从今天看,这种方法与现代AI依赖算力、数据和大规模参数训练的思路具有明显连续性。也就是说,今天大模型所体现的“以计算规模换取能力涌现”的逻辑,在20世纪40年代已经出现了雏形。
二、图灵测试:现代AI评估框架的理论源头
1950年,图灵在期刊 Mind 上发表《计算机器与智能》,提出著名问题:“机器能思考吗?”为了避免陷入关于意识本体的哲学争论,他设计了后来被称为图灵测试的“模仿游戏”:如果机器在文本交流中能够让裁判误以为它是人,就可以认为它表现出某种智能。

这一思路的关键在于,图灵并不要求机器真正拥有意识,而是将判断标准转向外部行为表现。换言之,机器是否“像人一样回应”,比它内部是否拥有与人相同的主观体验更重要。
这一框架深刻影响了后来的人工智能研究,也直接塑造了今天大模型的评价方式。无论是对话能力、文本生成、问答质量还是交互拟人化,本质上都延续了图灵提出的行为主义评估逻辑:智能首先表现为可被观察和判断的输出结果。
三、图灵之死与英国先发优势的中断
按常理,图灵作为战争时期的重要技术贡献者,本应在战后获得充分尊重。但事实恰恰相反。由于当时英国社会和制度环境的限制,图灵因个人生活问题遭到法律打压,并被迫接受持续性的医学干预。这些干预严重损害了他的身体与研究能力。
1954年,图灵去世。对于人工智能史而言,这不仅是个人悲剧,也意味着英国在机器智能领域失去了可能的核心推动者。假如图灵能够继续在更稳定、开放的环境中工作,英国完全有机会在机器智能的第一波浪潮中占据更大优势。但历史并未沿这一方向发展,美国迅速填补了这一空缺。
四、“人工智能”概念的诞生:麦卡锡的命名与议题重构
战后美国的电子计算机硬件快速发展,算力不断提升,但在“机器如何实现智能”这一理论层面,仍存在明显空白。1955年前后,约翰·麦卡锡与马文·明斯基敏锐地意识到,谁能首先定义这个问题,谁就可能掌握后续的话语权与资源分配权。
当时相关预算大量流向诺伯特·维纳主导的“控制论”研究。若继续沿用“控制论”框架,麦卡锡等人很难取得主导地位。于是,麦卡锡提出了一个新术语:
Artificial Intelligence(人工智能)
这一命名并非单纯学术表述,而是一种极具策略性的议题重构。它相当于为一个新兴方向完成“概念注册”:通过新名称建立新边界,再围绕新边界组织研究、申请资助并塑造正统性。
同时,麦卡锡等人也借用了图灵留下的问题框架,但对其进行了更强的工程化处理。他们不再强调意识、学习成长等开放问题,而是向资助方承诺:只要使用数学逻辑和符号系统,就可以构造“会思考的机器”。这使原本宏大的智能问题被压缩为一个更适合申请经费和展示阶段性成果的技术计划。
五、7,500美元提案与达特茅斯会议的历史意义
1955年,麦卡锡等人向洛克菲勒基金会提交提案,提出由十个人在两个月内研究“学习和智能的其他特征是否原则上可以被精确描述,并据此制造机器加以模拟”。这份提案最初申请 13,500美元,最终获批 7,500美元。
从金额上看,这笔钱并不大;但从历史作用看,它意义重大。它完成了三件关键事情:
第一,正式将“人工智能”确立为一个独立研究方向;
第二,为其绑定了初始的主流技术路线——符号主义;
第三,为后续大规模资源投入建立了制度起点。
在这一路线中,智能被理解为可以形式化、规则化的符号操作过程。只要把人类知识和判断写成大量“If-Then”规则,计算机就有可能表现出类似思维的能力。这种理解在当时具有很强吸引力,因为它清晰、可表述、可规划,也便于向基金会和军方解释。
六、达特茅斯会议:概念确立多于技术突破
1956年夏天,达特茅斯会议召开。它后来被广泛视为人工智能的正式开端。但从实际过程看,这场会议的象征意义远大于技术产出。
参会者对智能的理解并不一致。麦卡锡更强调逻辑演绎,明斯基偏向数学化抽象,不同研究者各有立场。在两个月的会议期间,真正产出的并不是一个成熟可运行的通用系统,而是大量讨论、争论与各自主张的展示。会议并未形成统一理论,也没有实现原提案所设想的突破。
但即便如此,达特茅斯会议仍然具有决定性意义,因为它确立了“人工智能”这一名称及其研究共同体,为后续资源分配和学科建制奠定了基础。换句话说,它最重要的成果不是代码,而是学术与制度层面的定名权。
七、纽厄尔与西蒙:第一批真正运行的AI程序
在达特茅斯会议期间,艾伦·纽厄尔和赫伯特·西蒙带来了一套与会议主流气氛形成鲜明对比的成果。他们并不是停留在概念表述,而是直接展示了一套已经实际运行的程序——逻辑理论家(Logic Theorist)。
这套程序能够证明《数学原理》中的多个定理,甚至为其中部分定理给出比人类数学家更短的证明路径。它被普遍认为是历史上第一批真正意义上运作起来的人工智能程序之一。
更重要的是,纽厄尔和西蒙采用的方法并非单纯堆砌固定规则,而是引入了启发式搜索的思想。机器不再只是机械执行预设答案,而是在大量可能路径中根据一定标准进行搜索和选择。这种方法在后来的AI发展中影响极大。很多年后,AlphaGo所依赖的树搜索机制,仍可在方法论层面追溯到这一早期思路。
八、为什么真正有效的路线没有立即成为主流
从科学发展的理想情况看,一套已经运行并展示出实际成果的程序,本应迅速获得更多关注和资源。但在当时,这并没有发生。
原因并不完全在于技术本身,而在于达特茅斯会议真正建立起来的是“谁有资格代表人工智能发言”的秩序。一旦承认纽厄尔和西蒙的工作是最具成果性的方向,那么“人工智能”这一新学科的主导权就可能不再掌握在会议发起核心人物手中。因此,技术有效性并没有自动转化为制度中心地位。
这表明,人工智能从一开始就不是单纯靠“谁做得更好”来决定路线走向,而是深受命名权、解释权和预算控制权影响。技术成果是否被放大、是否成为主流,往往取决于谁掌握了资源入口。
九、冷战加速:ARPA、军方需求与符号主义的扩张
1957年,苏联发射“斯普特尼克”卫星后,美国迅速陷入技术焦虑,并成立ARPA以集中支持前沿科技。人工智能因此获得新的战略意义。
在冷战环境下,美国军方非常希望机器能够完成自动翻译、情报分析、规则推断乃至辅助决策等任务。麦卡锡与明斯基所代表的符号主义路线,因其表述清晰、结构明确,恰好更容易被军方接受。他们承诺,只要给予足够经费,机器就能够通过规则系统实现复杂智能功能。
于是,符号主义在这一阶段获得了大量资源支持,并逐步建立起主导地位。
十、符号主义的局限:规则系统无法覆盖复杂世界
但符号主义很快暴露出明显问题。它在处理形式化问题时具有一定效果,但在自然语言、语境理解和复杂现实场景中表现有限。尤其在机器翻译方面,固定规则系统面对含混表达、习语和上下文变化时难以正常工作。
这说明,智能并不只是规则的堆积。世界本身具有高度复杂性和不确定性,仅依赖人工手写规则,很难穷尽现实中的知识结构。这种方法可以在小范围任务中取得效果,却难以扩展为真正通用的机器智能。
然而,由于符号主义已经占据了预算高地,即便技术上问题重重,它仍在相当长时间内维持了领域主导权。
十一、罗森布拉特与感知机:神经网络路线的早期尝试
与符号主义相对,另一条路线在20世纪50年代后期逐渐出现,即模拟大脑学习机制的神经网络思想。其代表人物是心理学家 弗兰克·罗森布拉特。
罗森布拉特反对通过人工编写规则来构造智能,认为真正的智能应当像大脑一样,通过连接与反馈机制进行学习。基于这一思想,他提出并实现了 感知机(Perceptron)。这是一种能够通过训练识别简单图形和字母的系统,也是后来的神经网络与深度学习路线的重要早期原型。

感知机一度引起高度关注,甚至被媒体以极为乐观的方式报道。它之所以重要,不在于当时已经足够成熟,而在于它提出了另一种完全不同的智能观:智能不是被写进去的,而是通过学习形成的。
十二、明斯基的批评与神经网络路线的受挫
感知机的出现,直接对符号主义构成挑战。随后,明斯基对其展开系统性批评。最著名的是围绕 XOR(异或)问题 的论证:单层感知机无法处理这类非线性可分问题,因此其能力存在根本限制。
从数学上说,这一批评针对单层感知机是成立的。但问题在于,这一结论在传播中被扩大为对整个神经网络路线的否定。事实上,如果增加隐藏层,许多限制是可以被突破的。但在当时,多层网络既缺乏成熟训练方法,也缺乏资源支持,因此资助方更容易接受“这条路线没有前景”的结论。
结果是,神经网络研究在很长时间内失去主流资源支持,感知机路线被边缘化。这一阶段后来也被视为AI发展中重要的挫折节点之一。
十三、人工智能早期史的真实结构:技术、权力与资源共同塑形
回顾人工智能最初十几年的发展,可以看到一条清晰的逻辑链:
- 图灵提出机器智能问题,并建立行为主义评估框架;
- 麦卡锡通过“人工智能”这一概念完成议题注册;
- 达特茅斯会议确立了学科共同体与初始正统;
- 纽厄尔、西蒙提出更具操作性的程序路径;
- 明斯基与麦卡锡则在资源与路线竞争中巩固符号主义主导地位;
- 罗森布拉特所代表的学习型路线则在竞争中被压制。
因此,人工智能的起点并不是一场单纯的技术竞赛,而是一场由冷战需求、科研体制、概念包装、学术地位与经费分配共同决定的路线博弈。
人工智能的发展从来不只是算法问题,也不仅是算力问题。它首先是一个历史问题:谁先提出问题,谁先完成命名,谁获得资助,谁掌握评价标准,谁就更可能决定整个领域的前进方向。
从图灵到达特茅斯,再到符号主义与神经网络之争,人工智能的早期历史表明:技术路线的成败,往往并不只取决于其当下性能,也取决于它是否能进入资源体系并获得持续推进的机会。
今天的大模型看似属于新时代,但其背后的许多深层逻辑——算力驱动、行为评估、路线竞争、资源集中——都能在这一段历史中找到源头。