惨痛的教训（The Bitter Lesson）

AI 的未来不在于将人类现有的经验硬塞给机器，而在于设计出能够利用无限算力进行搜索与学习的“元方法”。

The Bitter Lesson
- 里奇·萨顿（Rich Sutton）
- 2019年3月13日

回顾70年人工智能研究历程，最深刻的一条教训是：依托算力的通用方法，最终效果远超其他路径，且优势极其显著。究其根本，源于摩尔定律——或者更广义地说，单位计算成本持续呈指数级下降。绝大多数人工智能研究开展时，都默认智能体可使用的算力是恒定的（这种情况下，借助人类知识就成了提升性能为数不多的手段之一）。但只要研究周期稍长于普通科研项目，海量算力必然会成为现实。

研究者为追求短期见效的性能提升，往往试图融入自身对领域的人类认知；但从长远来看，真正起决定性作用的，只有对算力的充分利用。这两条路径本不必相互对立，现实中却常常冲突：投入在一方的时间，就无法用于另一方。研究者会在心理上执着于某一种研究思路；而依赖人类知识的方法，往往会让模型变得复杂，反而难以适配依托算力的通用优化路径。

人工智能研究者们屡屡迟来地领悟到这一惨痛教训，回顾其中几个典型案例，颇具启发意义。

在国际象棋领域，1997年击败世界冠军卡斯帕罗夫的算法，依靠的是大规模深度搜索。彼时，多数国际象棋计算机研究者对此倍感沮丧——他们此前一直钻研的，是融入人类对国际象棋特有棋局结构理解的方法。当一套依托专用软硬件、思路更简洁的搜索算法展现出碾压级优势时，这些深耕人类经验的棋手算法研究者难以接受。他们声称，蛮力搜索这次虽然取胜，却并非通用策略，况且人类下棋根本不靠这种方式。这些研究者一心想用基于人类经验的算法获胜，最终落空后倍感失落。

围棋领域的研究进程如出一辙，只是滞后了约20年。早期大量研究试图借助人类经验、围棋的特有规则特征规避搜索运算，可一旦大规模高效搜索技术落地，这些前期努力便失去意义，甚至起到反作用。同样关键的还有自我对弈学习（其他诸多博弈项目乃至国际象棋亦是如此，尽管1997年首胜世界冠军的程序中，学习并未发挥重要作用）。自我对弈乃至广义上的机器学习，与搜索算法逻辑相通，都能充分调动海量算力。搜索与学习，是人工智能研究中利用大规模算力的两大核心技术方向。和国际象棋一样，围棋研究初期，研究者着力融入人类对棋局的理解，以此减少搜索量；直到后期拥抱搜索与学习，才取得突破性成果。

语音识别领域亦是如此。20世纪70年代，美国国防高级研究计划局（DARPA）曾发起一场早期竞赛。参赛方案大多是融入人类知识的定制化方法，依托词汇、音素、人类发声器官等认知；另一类则是基于隐马尔可夫模型（HMM）、更偏向统计学、运算量更大的新式算法。最终，统计方法完胜依托人类经验的方案。此后数十年间，这一趋势深刻改变了整个自然语言处理领域，统计学与算力逐渐成为行业主流。近期深度学习在语音识别领域的兴起，正是这一趋势的延续。深度学习更少依赖人类先验知识，通过更大规模算力与海量数据集训练，打造出性能大幅跃升的语音识别系统。

和博弈领域一样，研究者始终试图复刻自身的思维模式来搭建系统，把人类认知嵌入算法；但事实证明，这种方式终将适得其反，更是极大浪费了研究精力。随着摩尔定律带来海量算力，当人们找到高效利用算力的方式后，这一路径便彻底失去价值。

计算机视觉领域也遵循相同规律。早期算法围绕边缘检测、广义圆柱体、尺度不变特征变换（SIFT）等特征构建视觉逻辑；而如今这些思路已被彻底摒弃。现代深度神经网络仅依靠卷积、特定不变性等基础概念，性能却实现质的飞跃。

这是一条至关重要的教训。但在人工智能领域，我们至今仍未彻底吃透它，依旧在重复过往的错误。想要看清问题根源、有效规避误区，就必须明白这类研究思路为何具有迷惑性。我们必须铭记这条惨痛教训：从长远来看，将人类主观的思维逻辑嵌入算法，注定行不通。

这一教训源于历史经验总结：

人工智能研究者常常试图将人类知识内置到智能体中；
这种方式短期有效，也能满足研究者的自我成就感；
但长期来看，性能会进入瓶颈，甚至阻碍后续发展；
最终的突破性进展，必然来自相反路径——依靠搜索与学习实现算力规模化应用。

这份最终的成功之所以带着苦涩，也常难以被研究者坦然接受，是因为它推翻了研究者偏爱、以人类为中心的研究范式。

从这条惨痛教训中，我们首先要认识到：通用方法拥有巨大潜力，即便算力规模极大，这类方法仍能随算力提升持续优化。其中，搜索与学习是两种可无限适配算力增长的核心路径。

其次，我们要明白：人类大脑的实际运行逻辑极其复杂，复杂到难以简化。我们不应再试图用简单逻辑去拆解大脑的运行模式，比如用简单方式理解空间、物体、多智能体或对称性。这些都是外部世界本身随机、固有且无限复杂的特征，不该被强行内置到算法中。相反，我们应当只搭建元方法，让算法自主发现、捕捉这类复杂特征。这类元方法的核心，是自主寻找优质近似解，而非由人类预先设定。

我们想要的人工智能，是能够像人类一样自主探索发现，而非直接装载人类已有的发现成果。强行内置人类认知，只会阻碍我们研究出具备自主探索能力的算法。

惨痛的教训（The Bitter Lesson）

相关文章

2026 AI 指数报告：在模型超越人类的同时，我们正面临的五个残酷真相

学习【机器学习平台】建设的经验