Saltar al contenido principal

Para quienes desean profundizar

Este capítulo está diseñado para ingenieros que desean investigar a fondo la IA de Go, cubriendo implementación técnica, fundamentos teóricos y aplicaciones prácticas.


Índice de artículos

Tecnología central

ArtículoDescripción
Arquitectura de redes neuronales en detalleRed residual de KataGo, características de entrada, diseño de salida múltiple
Detalles de implementación de MCTSSelección PUCT, pérdida virtual, evaluación por lotes, paralelización
Análisis del mecanismo de entrenamiento de KataGoAuto-juego, función de pérdida, ciclo de entrenamiento

Optimización de rendimiento

ArtículoDescripción
Backend GPU y optimizaciónComparación y ajuste de backends CUDA, OpenCL, Metal
Cuantización y despliegue de modelosFP16, INT8, TensorRT, despliegue en diversas plataformas
Evaluación y benchmarkingPuntuación Elo, pruebas de partidas, método estadístico SPRT

Temas avanzados

ArtículoDescripción
Arquitectura de entrenamiento distribuidoSelf-play Worker, recolección de datos, publicación de modelos
Reglas personalizadas y variantesReglas chinas, japonesas, AGA, variantes de tamaño de tablero
Guía de artículos claveAnálisis de los puntos clave de AlphaGo, AlphaZero, KataGo

Código abierto e implementación

ArtículoDescripción
Guía del código fuente de KataGoEstructura de directorios, módulos principales, estilo de código
Participar en la comunidad de código abiertoFormas de contribuir, entrenamiento distribuido, participación comunitaria
Construir una IA de Go desde ceroImplementar paso a paso una versión simplificada de AlphaGo Zero

¿Qué quieres hacer?

ObjetivoRuta recomendada
Entender el diseño de redes neuronalesArquitectura de redes neuronales en detalleDetalles de implementación de MCTS
Optimizar el rendimiento de ejecuciónBackend GPU y optimizaciónCuantización y despliegue de modelos
Investigar métodos de entrenamientoAnálisis del mecanismo de entrenamiento de KataGoArquitectura de entrenamiento distribuido
Entender los principios de los artículosGuía de artículos claveArquitectura de redes neuronales en detalle
Programar hands-onConstruir una IA de Go desde ceroGuía del código fuente de KataGo
Participar en proyectos de código abiertoParticipar en la comunidad de código abiertoGuía del código fuente de KataGo

Índice de conceptos avanzados

Al profundizar en la investigación, encontrarás los siguientes conceptos avanzados:

Serie F: Escalado (8)

NúmeroConcepto de GoCorrespondencia física/matemática
F1Tamaño del tablero vs complejidadEscalado de complejidad
F2Tamaño de red vs fuerza de juegoEscalado de capacidad
F3Tiempo de entrenamiento vs beneficioLey de rendimientos decrecientes
F4Cantidad de datos vs generalizaciónComplejidad de muestra
F5Escalado de recursos computacionalesLeyes de escalado
F6Leyes de escalado neuronalRelación log-log
F7Entrenamiento con lotes grandesLote crítico
F8Eficiencia de parámetrosLímites de compresión

Serie G: Dimensiones (6)

NúmeroConcepto de GoCorrespondencia física/matemática
G1Representación de alta dimensiónEspacio vectorial
G2Maldición de la dimensionalidadDilema de alta dimensión
G3Hipótesis del manifoldManifold de baja dimensión
G4Representación intermediaEspacio latente
G5Desacoplamiento de característicasComponentes independientes
G6Direcciones semánticasÁlgebra geométrica

Serie H: Aprendizaje por refuerzo (9)

NúmeroConcepto de GoCorrespondencia física/matemática
H1MDPCadena de Markov
H2Ecuación de BellmanProgramación dinámica
H3Iteración de valorTeorema del punto fijo
H4Gradiente de políticaOptimización estocástica
H5Replay de experienciaMuestreo por importancia
H6Factor de descuentoPreferencia temporal
H7Aprendizaje TDEstimación incremental
H8Función de ventajaReducción de varianza con línea base
H9Recorte PPORegión de confianza

Serie K: Métodos de optimización (6)

NúmeroConcepto de GoCorrespondencia física/matemática
K1SGDAproximación estocástica
K2MomentumInercia
K3AdamTamaño de paso adaptativo
K4Decaimiento de tasa de aprendizajeRecocido
K5Recorte de gradienteLímite de saturación
K6Ruido SGDPerturbación estocástica

Serie L: Generalización y estabilidad (5)

NúmeroConcepto de GoCorrespondencia física/matemática
L1SobreajusteSobre-adaptación
L2RegularizaciónOptimización con restricciones
L3DropoutActivación dispersa
L4Aumento de datosRuptura de simetría
L5Parada tempranaParada óptima

Requisitos de hardware

Lectura y aprendizaje

Sin requisitos especiales, cualquier computadora es suficiente.

Entrenamiento de modelos

EscalaHardware recomendadoTiempo de entrenamiento
Mini (b6c96)GTX 1060 6GBVarias horas
Pequeño (b10c128)RTX 3060 12GB1-2 días
Mediano (b18c384)RTX 4090 24GB1-2 semanas
Completo (b40c256)Clúster multi-GPUVarias semanas

Contribución al entrenamiento distribuido

  • Cualquier computadora con GPU puede participar
  • Se recomienda al menos GTX 1060 o equivalente
  • Se requiere conexión de red estable

Comenzar a leer

Recomendamos empezar aquí: