跳至主要内容

給想深入研究的人

這個章節適合想要深入研究圍棋 AI 的工程師,涵蓋技術實作、理論基礎與實務應用。


文章總覽

核心技術

文章說明
神經網路架構詳解KataGo 的殘差網路、輸入特徵、多頭輸出設計
MCTS 實作細節PUCT 選擇、虛擬損失、批次評估、並行化
KataGo 訓練機制解析自我對弈、損失函數、訓練循環

效能優化

文章說明
GPU 後端與優化CUDA、OpenCL、Metal 後端比較與調校
模型量化與部署FP16、INT8、TensorRT、各平台部署
評估與基準測試Elo 評分、對局測試、SPRT 統計方法

進階主題

文章說明
分散式訓練架構Self-play Worker、資料收集、模型發布
自訂規則與變體中國、日本、AGA 規則,棋盤大小變體
關鍵論文導讀AlphaGo、AlphaZero、KataGo 論文重點解析

開源與實作

文章說明
KataGo 原始碼導讀目錄結構、核心模組、程式碼風格
參與開源社群貢獻方式、分散式訓練、社群參與
從零打造圍棋 AI一步步實作簡易版 AlphaGo Zero

你想做什麼?

目標建議路徑
理解神經網路設計神經網路架構詳解MCTS 實作細節
優化執行效能GPU 後端與優化模型量化與部署
研究訓練方法KataGo 訓練機制解析分散式訓練架構
理解論文原理關鍵論文導讀神經網路架構詳解
動手寫程式從零打造圍棋 AIKataGo 原始碼導讀
參與開源專案參與開源社群KataGo 原始碼導讀

進階概念索引

深入研究時,你會接觸到以下進階概念:

F 系列:縮放(8 個)

編號圍棋概念物理/數學對應
F1棋盤大小 vs 複雜度複雜度縮放
F2網路大小 vs 棋力容量縮放
F3訓練時間 vs 收益收益遞減律
F4資料量 vs 泛化樣本複雜度
F5計算資源縮放縮放定律
F6神經縮放律雙對數關係
F7大批次訓練臨界批次
F8參數效率壓縮界限

G 系列:維度(6 個)

編號圍棋概念物理/數學對應
G1高維表示向量空間
G2維度災難高維困境
G3流形假設低維流形
G4中間表示隱空間
G5特徵解耦獨立成分
G6語意方向幾何代數

H 系列:強化學習(9 個)

編號圍棋概念物理/數學對應
H1MDP馬可夫鏈
H2貝爾曼方程動態規劃
H3價值迭代不動點定理
H4策略梯度隨機優化
H5經驗回放重要性採樣
H6折扣因子時間偏好
H7TD 學習增量估計
H8優勢函數基線減方差
H9PPO 裁剪信賴域

K 系列:優化方法(6 個)

編號圍棋概念物理/數學對應
K1SGD隨機逼近
K2動量慣性
K3Adam自適應步長
K4學習率衰減退火
K5梯度裁剪飽和限制
K6SGD 噪聲隨機擾動

L 系列:泛化與穩定(5 個)

編號圍棋概念物理/數學對應
L1過擬合過度適應
L2正則化約束優化
L3Dropout稀疏激活
L4資料增強對稱破缺
L5早停最優停止

硬體需求

閱讀與學習

無特殊需求,任何電腦都可以。

訓練模型

規模建議硬體訓練時間
迷你(b6c96)GTX 1060 6GB數小時
小型(b10c128)RTX 3060 12GB1-2 天
中型(b18c384)RTX 4090 24GB1-2 週
完整(b40c256)多 GPU 集群數週

分散式訓練貢獻

  • 任何有 GPU 的電腦都可以參與
  • 建議至少 GTX 1060 或同等級
  • 需要穩定的網路連線

開始閱讀

推薦從這裡開始: