这个章节适合想要深入研究围棋 AI 的工程师,涵盖技术实现、理论基础与实务应用。
文章总览
核心技术
性能优化
进阶主题
开源与实现
你想做什么?
进阶概念索引
深入研究时,你会接触到以下进阶概念:
F 系列:缩放(8 个)
| 编号 | 围棋概念 | 物理/数学对应 |
|---|
| F1 | 棋盘大小 vs 复杂度 | 复杂度缩放 |
| F2 | 网络大小 vs 棋力 | 容量缩放 |
| F3 | 训练时间 vs 收益 | 收益递减律 |
| F4 | 数据量 vs 泛化 | 样本复杂度 |
| F5 | 计算资源缩放 | 缩放定律 |
| F6 | 神经缩放律 | 双对数关系 |
| F7 | 大批量训练 | 临界批量 |
| F8 | 参数效率 | 压缩界限 |
G 系列:维度(6 个)
| 编号 | 围棋概念 | 物理/数学对应 |
|---|
| G1 | 高维表示 | 向量空间 |
| G2 | 维度灾难 | 高维困境 |
| G3 | 流形假设 | 低维流形 |
| G4 | 中间表示 | 隐空间 |
| G5 | 特征解耦 | 独立成分 |
| G6 | 语义方向 | 几何代数 |
H 系列:强化学习(9 个)
| 编号 | 围棋概念 | 物理/数学对应 |
|---|
| H1 | MDP | 马尔可夫链 |
| H2 | 贝尔曼方程 | 动态规划 |
| H3 | 价值迭代 | 不动点定理 |
| H4 | 策略梯度 | 随机优化 |
| H5 | 经验回放 | 重要性采样 |
| H6 | 折扣因子 | 时间偏好 |
| H7 | TD 学习 | 增量估计 |
| H8 | 优势函数 | 基线减方差 |
| H9 | PPO 裁剪 | 信赖域 |
K 系列:优化方法(6 个)
| 编号 | 围棋概念 | 物理/数学对应 |
|---|
| K1 | SGD | 随机逼近 |
| K2 | 动量 | 惯性 |
| K3 | Adam | 自适应步长 |
| K4 | 学习率衰减 | 退火 |
| K5 | 梯度裁剪 | 饱和限制 |
| K6 | SGD 噪声 | 随机扰动 |
L 系列:泛化与稳定(5 个)
| 编号 | 围棋概念 | 物理/数学对应 |
|---|
| L1 | 过拟合 | 过度适应 |
| L2 | 正则化 | 约束优化 |
| L3 | Dropout | 稀疏激活 |
| L4 | 数据增强 | 对称破缺 |
| L5 | 早停 | 最优停止 |
硬件需求
阅读与学习
无特殊需求,任何电脑都可以。
训练模型
| 规模 | 建议硬件 | 训练时间 |
|---|
| 迷你(b6c96) | GTX 1060 6GB | 数小时 |
| 小型(b10c128) | RTX 3060 12GB | 1-2 天 |
| 中型(b18c384) | RTX 4090 24GB | 1-2 周 |
| 完整(b40c256) | 多 GPU 集群 | 数周 |
分布式训练贡献
- 任何有 GPU 的电脑都可以参与
- 建议至少 GTX 1060 或同等级
- 需要稳定的网络连接
开始阅读
推荐从这里开始: