AlphaGo 的遗产

2016 年 3 月，AlphaGo 击败李世石的那一刻，不只是围棋历史的转折点，更是人工智能发展的里程碑。从那时起，AlphaGo 的技术核心被应用到越来越多的领域，从游戏到科学发现，从基础研究到实际应用。

本文将回顾 AlphaGo 对围棋界、AI 研究、以及更广泛科学领域的深远影响。

对围棋界的影响

震惊与接受

AlphaGo 击败李世石之前，职业棋手普遍认为 AI 还差得远：

"我会 5:0 获胜。" — 李世石，赛前预测

但比赛结果是 4:1。更冲击的是，AlphaGo 展现的下法让职业棋手意识到：我们对围棋的理解可能是错的。

棋理的革新

AlphaGo 带来了一系列棋理革新：

传统观点	AlphaGo 的挑战
点三三要在适当时机	开局直接点三三可行
定式要严格遵守	可以主动脱离定式
实地与外势要平衡	胜率才是唯一标准
愚形必须避免	某些「愚形」其实是好棋
序盘要抢大场	局部战斗可能更重要

这些变化不是因为 AlphaGo「告诉」人类该怎么下，而是人类在研究 AI 棋谱后，主动学习并验证的结果。

AI 训练成为常态

2024 年的职业围棋界，AI 训练已经是标配：

变化	描述
复盘方式	用 AI 分析每一手的胜率和建议
开局准备	研究 AI 推荐的开局变化
战术训练	用 AI 产生的死活题和手筋题练习
实战应用	某些职业比赛允许休息时查 AI

对职业棋手的影响

不同棋手对 AI 的态度：

"AI 让我重新爱上围棋。原来围棋还有这么多我不知道的东西。" — 柯洁，2017

"和 AI 下棋让我感到绝望，但研究 AI 让我找到新的方向。" — 李世石，2019（退役前）

"AI 不是对手，是老师。" — 许多职业棋手的共识

新一代棋手

2016 年后出道的职业棋手，从小就接受 AI 训练：

开局更加多样化
战术更加精确
对「传统棋理」更加灵活
整体水平可能比前一代更高

这是围棋历史上从未有过的学习资源——一个永远可用、永不疲倦、棋力超人的老师。

AlphaZero：通用游戏 AI

从围棋到三种棋类

2017 年 12 月，DeepMind 发表 AlphaZero，将 AlphaGo Zero 的技术推广到三种不同的棋类游戏：

游戏	训练时间	对手	战绩
围棋	8 小时	AlphaGo Zero	60:40
国际象棋	4 小时	Stockfish	155:6（含和棋）
将棋	2 小时	Elmo	90:8:2

同一套算法，三种不同的游戏，都达到超人水平。

对国际象棋界的冲击

国际象棋有超过一百年的 AI 研究历史，Stockfish 是数十年工程优化的结晶。AlphaZero 用 4 小时从零开始训练，就击败了这一切。

更重要的是 AlphaZero 的下棋风格：

"AlphaZero 的棋像是来自另一个星球。它愿意牺牲子力换取长期的位置优势，这在传统国际象棋中是不可想象的。" — Garry Kasparov，前国际象棋世界冠军

技术上的意义

AlphaZero 证明了：

通用性：同一套方法适用于不同领域
第一性原理学习：不需要领域专家知识
效率：训练时间从月缩短到小时

这为 AI 的通用化迈出了关键一步。

MuZero：无需规则的学习

更进一步的突破

2019 年，DeepMind 发表 MuZero，比 AlphaZero 更进一步：

AlphaZero 需要知道游戏规则，MuZero 连规则都不需要。

MuZero 通过与环境互动，自己学习环境的动态模型（dynamics model），然后用这个学习到的模型进行规划。

工作原理

AlphaGo/AlphaZero:
环境规则（已知）→ MCTS 搜索 → 最佳动作

MuZero:
环境观察 → 学习动态模型 → 用学习到的模型进行 MCTS → 最佳动作

MuZero 学习三个模型：

表示函数（Representation）：将观察转换为隐状态
动态函数（Dynamics）：预测下一个隐状态和奖励
预测函数（Prediction）：预测策略和价值

应用范围扩大

因为不需要明确的规则，MuZero 可以应用于更多领域：

领域	描述
Atari 游戏	57 个游戏，大部分超越人类
棋类游戏	与 AlphaZero 同等水平
视频压缩	用于 YouTube 视频编码，节省 4% 带宽
数据中心冷却	优化 Google 数据中心能源效率

对 AI 研究的启示

MuZero 展示了模型学习（Model-based RL） 的威力：

不需要手动定义环境规则
可以处理连续状态空间
可以处理部分可观察环境
更接近人类的学习方式

AlphaFold：改变生物学的 AI

蛋白质结构预测

2020 年，DeepMind 发表 AlphaFold 2，在蛋白质结构预测竞赛（CASP14）中取得惊人成绩：

指标	AlphaFold 2	第二名
GDT-TS 分数	92.4	67.0
中位误差	0.96 Å	~2.5 Å

这个精度已经接近实验测量的水平，解决了生物学领域 50 年的难题。

与 AlphaGo 的技术联系

AlphaFold 不是直接使用 AlphaGo 的代码，但继承了核心理念：

AlphaGo 技术	AlphaFold 中的对应
深度神经网络	Transformer + Attention
迭代优化	迭代细化结构预测
端到端学习	从序列直接预测结构
大规模训练	利用大量已知结构训练

科学界的反应

"这将改变一切。我们不再需要等待数年进行实验，就可以知道蛋白质的结构。" — 结构生物学家

AlphaFold 的影响：

药物开发：加速新药设计
疾病研究：理解疾病机制
合成生物学：设计新蛋白质
基础研究：促进生命科学发展

2024 年，AlphaFold 的创造者 Demis Hassabis 和 John Jumper 因此获得诺贝尔化学奖。

开放科学

DeepMind 将 AlphaFold 预测的2 亿+蛋白质结构开放给全球研究者免费使用。这是 AI 促进开放科学的典范。

对 AI 领域的启示

方法论的转变

AlphaGo 代表了 AI 研究方法论的转变：

传统方法	AlphaGo 方法
手工设计特征	端到端学习
专家规则	从数据学习
分步骤优化	联合优化
人类知识编码	从零开始学习

这种「少一点人类设计，多一点学习」的理念，影响了 AI 的各个子领域。

强化学习的复兴

AlphaGo 让强化学习重新受到关注：

时期	强化学习地位
2010 年前	理论有趣，实用困难
2013 年 DQN	开始展现潜力
2016 年 AlphaGo	证明可以解决复杂问题
2017 年后	成为 AI 研究热点

现在，强化学习被应用于：

机器人控制
自动驾驶
推荐系统
大型语言模型对齐（RLHF）

计算与算法的权衡

AlphaGo 系列的演进展示了计算与算法的权衡：

AlphaGo Fan:  大量人类知识 + 大量计算
AlphaGo Lee:  人类知识 + 更多计算
AlphaGo Zero: 零人类知识 + 中等计算 + 更好的算法
AlphaZero:    零人类知识 + 少量计算 + 最佳算法

更好的算法可以减少对计算资源的需求。这对 AI 民主化很重要。

技术遗产的扩散

开源社区

AlphaGo 的技术被开源社区快速复现和改进：

项目	特点	状态
Leela Zero	分布式社区训练	活跃
KataGo	单 GPU 高效训练	非常活跃
ELF OpenGo	Facebook 开源	维护中
Minigo	Google 开源教学项目	完成
Pachi	传统 MCTS，AI 时代前的王者	历史意义

研究论文引用

AlphaGo 相关论文的影响力：

论文	引用数（约）
AlphaGo（2016, Nature）	20,000+
AlphaGo Zero（2017, Nature）	15,000+
AlphaZero（2018, Science）	10,000+

这些论文被 AI、神经科学、认知科学、游戏研究等多个领域引用。

教育影响

AlphaGo 成为 AI 教育的经典案例：

大学课程的必读材料
强化学习教科书的重要章节
科普文章和纪录片的热门主题
激励新一代研究者进入 AI 领域

对社会的更广泛影响

AI 意识的提升

AlphaGo 让公众意识到 AI 的能力：

面向	影响
媒体报道	AI 成为主流新闻话题
投资热潮	AI 创业和投资大幅增加
政策讨论	各国开始制定 AI 战略
公众认知	更多人了解 AI 的可能性和风险

人机关系的思考

AlphaGo 引发了关于人机关系的深层思考：

"如果机器在围棋上超越人类，那人类的价值在哪里？"

围棋界给出了一个答案：

AI 是工具，不是对手
人类的价值不在于和机器比赛
围棋的乐趣不会因为 AI 而消失

这种思考方式，对其他 AI 可能超越人类的领域也有借鉴意义。

伦理考量

DeepMind 在 AlphaGo 项目中也面对了伦理问题：

比赛公平性：AI 对人类是否公平？
职业棋手的未来：AI 会取代人类吗？
技术责任：强大的 AI 应该如何被使用？

DeepMind 成立了伦理委员会，并在收购协议中加入了 AI 安全条款。这种做法影响了后来的 AI 公司。

未来展望

AI 的下一个挑战

AlphaGo 之后，AI 研究者在问：下一个「围棋」是什么？

候选领域	难度	进展
即时战略游戏（如 StarCraft）	极高	AlphaStar 达到宗师水平
开放世界游戏（如 Minecraft）	很高	正在研究中
科学发现	极高	AlphaFold 在蛋白质领域突破
数学定理证明	极高	AlphaProof 取得进展
通用人工智能（AGI）	未知	长期目标

从专用到通用

AlphaGo 系列的演进方向：

AlphaGo（围棋专用）
    ↓
AlphaZero（棋类通用）
    ↓
MuZero（游戏通用）
    ↓
?（领域通用）
    ↓
AGI（完全通用）

每一步都在减少对特定领域知识的依赖，增加通用性。

DeepMind 的愿景

DeepMind 的使命依然是：

"Solve intelligence, and then use that to solve everything else."

AlphaGo 是这个愿景的第一个重要里程碑。AlphaFold 是第二个。未来会有更多。

结语

回顾 AlphaGo 的故事，我们看到的不只是一个打败人类的 AI，而是：

技术突破：深度学习 + 强化学习 + 树搜索的强大组合
方法论革新：从零开始学习，超越人类知识
工程成就：分布式系统和专用硬件的完美配合
科学应用：从游戏到蛋白质结构的跨越
文化影响：改变人类对 AI 和自身的认识

AlphaGo 证明了：正确的方法 + 足够的计算，可以解决曾被认为不可能的问题。

这个教训将继续指引未来的 AI 研究。而围棋——这个有数千年历史的游戏——将永远是这段历史的见证者。

动画对应

本文涉及的核心概念与动画编号：

编号	概念	物理/数学对应
🎬 F8	涌现能力	相变
🎬 E7	从零开始	自组织
🎬 F1	通用智能	普适性
🎬 F5	迁移学习	知识转移

参考资料

Silver, D., et al. (2016). "Mastering the game of Go with deep neural networks and tree search." Nature, 529, 484-489.
Silver, D., et al. (2017). "Mastering the game of Go without human knowledge." Nature, 550, 354-359.
Silver, D., et al. (2018). "A general reinforcement learning algorithm that masters chess, shogi, and Go through self-play." Science, 362(6419), 1140-1144.
Schrittwieser, J., et al. (2020). "Mastering Atari, Go, Chess and Shogi by Planning with a Learned Model." Nature, 588, 604-609.
Jumper, J., et al. (2021). "Highly accurate protein structure prediction with AlphaFold." Nature, 596, 583-589.
《AlphaGo》纪录片（2017），导演 Greg Kohs。
Hassabis, D. (2017). "Artificial Intelligence: Chess match of the century." Nature, 544, 413-414.
Kasparov, G. (2018). "Chess, a Drosophila of reasoning." Science, 362(6419), 1087.

对围棋界的影响​

震惊与接受​

棋理的革新​

AI 训练成为常态​

对职业棋手的影响​

新一代棋手​

AlphaZero：通用游戏 AI​

从围棋到三种棋类​

对国际象棋界的冲击​

技术上的意义​

MuZero：无需规则的学习​

更进一步的突破​

工作原理​

应用范围扩大​

对 AI 研究的启示​

AlphaFold：改变生物学的 AI​

蛋白质结构预测​

与 AlphaGo 的技术联系​

科学界的反应​

开放科学​

对 AI 领域的启示​

方法论的转变​

强化学习的复兴​

计算与算法的权衡​

技术遗产的扩散​

开源社区​

研究论文引用​

教育影响​

对社会的更广泛影响​

AI 意识的提升​

人机关系的思考​

伦理考量​

未来展望​

AI 的下一个挑战​

从专用到通用​

DeepMind 的愿景​

结语​

动画对应​

延伸阅读​

参考资料​