跳到主要内容

给想深入研究的人

这个章节适合想要深入研究围棋 AI 的工程师,涵盖技术实现、理论基础与实务应用。


文章总览

核心技术

文章说明
神经网络架构详解KataGo 的残差网络、输入特征、多头输出设计
MCTS 实现细节PUCT 选择、虚拟损失、批量评估、并行化
KataGo 训练机制解析自我对弈、损失函数、训练循环

性能优化

文章说明
GPU 后端与优化CUDA、OpenCL、Metal 后端比较与调优
模型量化与部署FP16、INT8、TensorRT、各平台部署
评估与基准测试Elo 评分、对局测试、SPRT 统计方法

进阶主题

文章说明
分布式训练架构Self-play Worker、数据收集、模型发布
自定义规则与变体中国、日本、AGA 规则,棋盘大小变体
关键论文导读AlphaGo、AlphaZero、KataGo 论文重点解析

开源与实现

文章说明
KataGo 源代码导读目录结构、核心模块、代码风格
参与开源社区贡献方式、分布式训练、社区参与
从零打造围棋 AI一步步实现简易版 AlphaGo Zero

你想做什么?

目标建议路径
理解神经网络设计神经网络架构详解MCTS 实现细节
优化执行性能GPU 后端与优化模型量化与部署
研究训练方法KataGo 训练机制解析分布式训练架构
理解论文原理关键论文导读神经网络架构详解
动手写程序从零打造围棋 AIKataGo 源代码导读
参与开源项目参与开源社区KataGo 源代码导读

进阶概念索引

深入研究时,你会接触到以下进阶概念:

F 系列:缩放(8 个)

编号围棋概念物理/数学对应
F1棋盘大小 vs 复杂度复杂度缩放
F2网络大小 vs 棋力容量缩放
F3训练时间 vs 收益收益递减律
F4数据量 vs 泛化样本复杂度
F5计算资源缩放缩放定律
F6神经缩放律双对数关系
F7大批量训练临界批量
F8参数效率压缩界限

G 系列:维度(6 个)

编号围棋概念物理/数学对应
G1高维表示向量空间
G2维度灾难高维困境
G3流形假设低维流形
G4中间表示隐空间
G5特征解耦独立成分
G6语义方向几何代数

H 系列:强化学习(9 个)

编号围棋概念物理/数学对应
H1MDP马尔可夫链
H2贝尔曼方程动态规划
H3价值迭代不动点定理
H4策略梯度随机优化
H5经验回放重要性采样
H6折扣因子时间偏好
H7TD 学习增量估计
H8优势函数基线减方差
H9PPO 裁剪信赖域

K 系列:优化方法(6 个)

编号围棋概念物理/数学对应
K1SGD随机逼近
K2动量惯性
K3Adam自适应步长
K4学习率衰减退火
K5梯度裁剪饱和限制
K6SGD 噪声随机扰动

L 系列:泛化与稳定(5 个)

编号围棋概念物理/数学对应
L1过拟合过度适应
L2正则化约束优化
L3Dropout稀疏激活
L4数据增强对称破缺
L5早停最优停止

硬件需求

阅读与学习

无特殊需求,任何电脑都可以。

训练模型

规模建议硬件训练时间
迷你(b6c96)GTX 1060 6GB数小时
小型(b10c128)RTX 3060 12GB1-2 天
中型(b18c384)RTX 4090 24GB1-2 周
完整(b40c256)多 GPU 集群数周

分布式训练贡献

  • 任何有 GPU 的电脑都可以参与
  • 建议至少 GTX 1060 或同等级
  • 需要稳定的网络连接

开始阅读

推荐从这里开始: