본문으로 건너뛰기

심층 연구를 원하는 분들을 위해

이 섹션은 바둑 AI를 깊이 연구하고자 하는 엔지니어를 위한 것으로, 기술 구현, 이론적 기초 및 실용적 응용을 다룹니다.


문서 개요

핵심 기술

문서설명
신경망 아키텍처 상세 분석KataGo의 잔차 네트워크, 입력 특성, 다중 헤드 출력 설계
MCTS 구현 세부사항PUCT 선택, 가상 손실, 배치 평가, 병렬화
KataGo 학습 메커니즘 분석자가 대국, 손실 함수, 학습 루프

성능 최적화

문서설명
GPU 백엔드와 최적화CUDA, OpenCL, Metal 백엔드 비교 및 튜닝
모델 양자화와 배포FP16, INT8, TensorRT, 각 플랫폼 배포
평가 및 벤치마크 테스트Elo 레이팅, 대국 테스트, SPRT 통계 방법

고급 주제

문서설명
분산 학습 아키텍처Self-play Worker, 데이터 수집, 모델 배포
사용자 정의 규칙과 변형중국, 일본, AGA 규칙, 바둑판 크기 변형
핵심 논문 가이드AlphaGo, AlphaZero, KataGo 논문 핵심 분석

오픈소스와 구현

문서설명
KataGo 소스 코드 가이드디렉토리 구조, 핵심 모듈, 코딩 스타일
오픈소스 커뮤니티 참여기여 방법, 분산 학습, 커뮤니티 참여
처음부터 바둑 AI 만들기단계별 간단한 AlphaGo Zero 구현

무엇을 하고 싶으신가요?

목표추천 경로
신경망 설계 이해하기신경망 아키텍처 상세 분석MCTS 구현 세부사항
실행 성능 최적화하기GPU 백엔드와 최적화모델 양자화와 배포
학습 방법 연구하기KataGo 학습 메커니즘 분석분산 학습 아키텍처
논문 원리 이해하기핵심 논문 가이드신경망 아키텍처 상세 분석
직접 프로그래밍하기처음부터 바둑 AI 만들기KataGo 소스 코드 가이드
오픈소스 프로젝트 참여하기오픈소스 커뮤니티 참여KataGo 소스 코드 가이드

고급 개념 색인

심층 연구 시 다음과 같은 고급 개념을 접하게 됩니다:

F 시리즈: 스케일링 (8개)

번호바둑 개념물리/수학 대응
F1바둑판 크기 vs 복잡도복잡도 스케일링
F2네트워크 크기 vs 기력용량 스케일링
F3학습 시간 vs 수익수익 체감의 법칙
F4데이터량 vs 일반화샘플 복잡도
F5컴퓨팅 자원 스케일링스케일링 법칙
F6신경 스케일링 법칙이중 로그 관계
F7대규모 배치 학습임계 배치
F8파라미터 효율성압축 한계

G 시리즈: 차원 (6개)

번호바둑 개념물리/수학 대응
G1고차원 표현벡터 공간
G2차원의 저주고차원 딜레마
G3다양체 가설저차원 다양체
G4중간 표현잠재 공간
G5특성 분리독립 성분
G6의미 방향기하 대수

H 시리즈: 강화학습 (9개)

번호바둑 개념물리/수학 대응
H1MDP마르코프 체인
H2벨만 방정식동적 프로그래밍
H3가치 반복고정점 정리
H4정책 그래디언트확률적 최적화
H5경험 재생중요도 샘플링
H6할인 인자시간 선호
H7TD 학습증분 추정
H8어드밴티지 함수베이스라인 분산 감소
H9PPO 클리핑신뢰 영역

K 시리즈: 최적화 방법 (6개)

번호바둑 개념물리/수학 대응
K1SGD확률적 근사
K2모멘텀관성
K3Adam적응형 스텝 크기
K4학습률 감소어닐링
K5그래디언트 클리핑포화 제한
K6SGD 노이즈확률적 교란

L 시리즈: 일반화와 안정성 (5개)

번호바둑 개념물리/수학 대응
L1과적합과잉 적응
L2정규화제약 최적화
L3Dropout희소 활성화
L4데이터 증강대칭 깨짐
L5조기 종료최적 정지

하드웨어 요구사항

읽기와 학습

특별한 요구사항 없음, 어떤 컴퓨터든 가능합니다.

모델 학습

규모권장 하드웨어학습 시간
미니 (b6c96)GTX 1060 6GB수 시간
소형 (b10c128)RTX 3060 12GB1-2일
중형 (b18c384)RTX 4090 24GB1-2주
완전 (b40c256)다중 GPU 클러스터수 주

분산 학습 기여

  • GPU가 있는 모든 컴퓨터가 참여 가능
  • 최소 GTX 1060 또는 동급 권장
  • 안정적인 네트워크 연결 필요

시작하기

여기서 시작하는 것을 추천합니다: