¿Por Qué es Difícil el Go?

Antes de AlphaGo, el Go era considerado la "última fortaleza" de la inteligencia artificial. Durante décadas, los investigadores probaron varios métodos, pero nunca pudieron hacer que las computadoras alcanzaran el nivel de jugadores profesionales.

Esto no fue porque los investigadores no se esforzaran lo suficiente, sino porque el Go es inherentemente un problema computacional extremadamente difícil.

Este artículo explorará en profundidad: ¿Qué hace tan difícil al Go? ¿Por qué fue llamado el "Santo Grial de la IA"?

La Explosión del Espacio de Estados: El Significado de 10^170

¿Qué es el Espacio de Estados?

En cualquier juego de tablero, el espacio de estados (State Space) se refiere al número total de todas las posiciones posibles del tablero. Este número determina la viabilidad de la búsqueda por fuerza bruta.

Para el Go, este número es:

Espacio de estados del Go ≈ 10^170

¿Qué significa esto? Hagamos algunas comparaciones.

Comparación con los Átomos del Universo

Según las estimaciones de los físicos, el número total de átomos en el universo observable es aproximadamente:

Átomos del universo ≈ 10^80

Esto significa:

El número de posiciones posibles en Go es 10^90 veces el número de átomos en el universo.

Si usaras cada átomo del universo como una supercomputadora, y cada computadora pudiera procesar mil millones de posiciones por segundo, desde el Big Bang hasta ahora (aproximadamente 13.8 mil millones de años) no sería posible enumerar todas las posiciones.

Comprensión Intuitiva de los Números

Número	Significado
10^9	Mil millones, orden de magnitud de la población humana
10^12	Un billón, número de hormigas en el mundo
10^23	Número de moléculas en un mol
10^80	Número de átomos en el universo
10^120	Espacio de estados del ajedrez
10^170	Espacio de estados del Go

¿Por Qué el Espacio de Estados del Go es Tan Grande?

Hay varias razones por las que el espacio de estados del Go es enorme:

1. Tamaño del Tablero

El Go usa un tablero de 19×19, con un total de 361 intersecciones. En comparación:

Ajedrez: 8×8 = 64 casillas
Ajedrez chino: 9×10 = 90 intersecciones
Cinco en línea: 15×15 = 225 intersecciones

2. Tres Estados por Intersección

Cada intersección puede ser:

Vacía (sin piedra)
Piedra negra
Piedra blanca

Una estimación aproximada da 3^361 ≈ 10^172 combinaciones posibles. Considerando las reglas del Go (como ko y restricciones de libertades), las posiciones legales reales son aproximadamente 10^170.

3. Las Piedras No Se Mueven

A diferencia del ajedrez, las piedras de Go una vez colocadas no se mueven (a menos que sean capturadas). Esto significa que cada movimiento añade una nueva piedra, en lugar de mover una existente, lo que resulta en más caminos posibles.

Código Ilustrativo: Estimación del Espacio de Estados

import math

# Tamaño del tablero
BOARD_SIZE = 19
TOTAL_POINTS = BOARD_SIZE ** 2  # 361

# Tres estados por intersección (vacío, negro, blanco)
# Límite superior aproximado
upper_bound = 3 ** TOTAL_POINTS
print(f"Límite superior aproximado: 3^{TOTAL_POINTS} ≈ 10^{math.log10(upper_bound):.0f}")
# Salida: Límite superior aproximado: 3^361 ≈ 10^172

# Estimación real considerando restricciones de reglas
# El cálculo preciso de Tromp-Taylor da aproximadamente 2.08 × 10^170
actual_estimate = 2.08e170
print(f"Estimación real: {actual_estimate:.2e}")

# Comparación con átomos del universo
universe_atoms = 1e80
ratio = actual_estimate / universe_atoms
print(f"Posiciones de Go / Átomos del universo = 10^{math.log10(ratio):.0f}")
# Salida: Posiciones de Go / Átomos del universo = 10^90

La Maldición del Factor de Ramificación: Promedio de 250 Opciones

¿Qué es el Factor de Ramificación?

El factor de ramificación (Branching Factor) es el número promedio de movimientos legales en cualquier punto del juego. Este número determina el ancho del árbol de búsqueda.

Juego	Factor de Ramificación Promedio
Tres en raya	~4
Ajedrez	~35
Ajedrez chino	~38
Reversi	~10
Go	~250

Crecimiento Explosivo del Árbol de Búsqueda

Supongamos que queremos usar un algoritmo de búsqueda de árbol para ver N movimientos adelante. El número de posiciones a considerar es aproximadamente:

\text{Número de nodos} \approx b^N

Donde b es el factor de ramificación.

Comparemos ajedrez y Go:

Ver N movimientos	Ajedrez (b=35)	Go (b=250)	Diferencia
1 movimiento	35	250	7×
2 movimientos	1,225	62,500	51×
4 movimientos	1.5 millones	3.9 mil millones	2,600×
6 movimientos	1.8 mil millones	2.4×10^14	130 millones×
10 movimientos	2.8×10^15	9.5×10^23	340 millones×

Ver 10 movimientos adelante, el Go requiere considerar 340 millones de veces más posiciones que el ajedrez.

Por Qué el Método de Deep Blue Falló en Go

Deep Blue, que derrotó a Kasparov en 1997, usó tecnologías centrales que incluían:

Poda alfa-beta: Reducir nodos de búsqueda
Aceleración por hardware: Evaluar 200 millones de posiciones por segundo
Función de evaluación manual: Evaluación de posiciones diseñada por expertos

Pero incluso usando los mismos métodos:

Ajedrez: Ver 12-14 movimientos requiere evaluar aproximadamente 10^18 nodos
Go: Ver 12 movimientos requiere evaluar aproximadamente 10^29 nodos

La diferencia es de mil billones de billones. Ningún hardware puede cerrar esta brecha.

Las Opciones de Apertura son Aún Más Astronómicas

En la fase de apertura del Go, el factor de ramificación es aún mayor:

Movimiento 1: 361 opciones
Movimiento 2: 360 opciones
Movimiento 3: 359 opciones
...

Incluso viendo solo los primeros 10 movimientos:

361 \times 360 \times 359 \times ... \times 352 \approx 5.5 \times 10^{25}

Esta es la razón por la que los "joseki de apertura" son tan importantes - los jugadores humanos necesitan memorizar muchas variaciones de apertura porque no pueden calcularlas en tiempo real.

La Dificultad de la Evaluación: No Hay Valores Simples de Piezas

La Ventaja Material del Ajedrez

En ajedrez, evaluar una posición es relativamente intuitivo:

Pieza	Valor (tradicional)
Peón	1
Caballo	3
Alfil	3
Torre	5
Reina	9

Aunque la evaluación real es más compleja (posición, estructura, etc.), "contar material" es un buen punto de partida. Capturar la reina del oponente es casi seguro algo bueno.

Go: Cada Piedra es Igual

En Go, el valor intrínseco de cada piedra es exactamente el mismo - todas son simplemente piedras.

El valor de una piedra depende completamente de:

Su posición en el tablero
Su relación con otras piedras
Su influencia en la posición general

Esto hace que la evaluación sea extremadamente difícil.

La Naturaleza Abstracta del Espesor e Influencia

El Go tiene muchos conceptos abstractos:

Espesor (Thickness)

"Espesor" se refiere a un grupo de piedras que es sólido, estable e influyente. Pero el "espesor" es difícil de cuantificar:

¿Cuántos puntos vale una forma espesa?
¿Cuándo se debe usar el espesor para atacar?
¿Cuándo el espesor se convierte en "forma pesada" (forma ineficiente)?

Los mejores jugadores podrían decir: "Este grupo es muy espeso, probablemente vale unos 15 puntos". Pero esto se basa en décadas de experiencia e intuición, no en cálculos precisos.

Influencia (Influence)

La influencia en Go se refiere al control potencial de las piedras sobre el espacio circundante. Este control es "virtual" - puede convertirse en territorio, puede ser útil en ataques y defensas, o puede terminar siendo nada.

¿Cómo se evalúa el valor "potencial"? Esto es extremadamente difícil para las computadoras.

Aji (Sabor/Potencial)

"Aji" es uno de los conceptos más abstractos en Go. Se refiere al potencial latente de una posición en el tablero.

Un grupo "muerto" puede tener "valor de utilización" - aunque no se pueda revivir, puede causar interferencia en futuras batallas. Este "potencial latente" es casi imposible de representar numéricamente.

Por Qué Fallaron las Funciones de Evaluación Manuales

Antes de Deep Blue, el ajedrez por computadora usaba funciones de evaluación diseñadas por expertos humanos:

Valor de evaluación = Puntuación material + Puntuación posicional + Seguridad del rey + Estructura de peones + ...

Estos factores podían cuantificarse y ajustarse sus pesos, y funcionaba bastante bien.

¿Pero el Go?

Los investigadores probaron varias características:

Número de intersecciones controladas
"Libertad" de las piedras (número de libertades)
Fuerza de conexión
Integridad de las formas de ojos
...

Pero la combinación de estas características nunca alcanzó el nivel de un amateur fuerte.

El problema central: La evaluación de posiciones en Go es un problema altamente no lineal y global.

El valor de una piedra depende del estado de todo el tablero, no de la simple suma de características locales.

La Necesidad de Planificación a Largo Plazo: Una Partida de 150 Movimientos

Las Tres Fases del Go

Una partida estándar de Go típicamente pasa por tres fases:

Fase	Movimientos (aprox.)	Características
Apertura	1-50	Ocupar territorio, construir marcos, establecer dirección global
Medio juego	50-200	Combate, ataque y defensa, equilibrio entre local y global
Yose	200-300	Cierre, cálculo, precisión

Una partida promedio tiene aproximadamente 250-300 movimientos, y los primeros 150 movimientos determinan el resultado general.

Apertura: Planificando 30 Movimientos Adelante

Cada movimiento en la fase de apertura prepara para decenas o incluso cientos de movimientos futuros.

Por ejemplo, una apertura "San-ren-sei" (tres estrellas en línea):

. . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . .
. . . ● . . . . . ● . . . . . ● . . .
. . . . . . . . . . . . . . . . . . .
...

Estas tres piedras negras forman una apertura "orientada a la influencia", con la intención de:

No apresurarse a cercar territorio
Esperar a que blancas invada y luego atacar
Obtener territorio o influencia a través del ataque
Finalmente lograr ventaja en el yose

Este "plan" requiere prever 50-100 movimientos en el futuro. Ningún algoritmo de búsqueda puede ver tan lejos.

Medio Juego: Equilibrio entre Local y Global

El combate del medio juego es la parte más compleja del Go. Los jugadores necesitan considerar en cada movimiento:

Cálculo local: ¿Quién ganará esta batalla?
Juicio global: ¿Vale la pena luchar aquí?
Selección de secuencia: ¿Dónde jugar primero es más eficiente?
Decisión de sacrificio: ¿Cuándo sacrificar piedras y cambiar de dirección?

Una decisión típica de medio juego:

"Si corto aquí, el oponente contraatacará, necesitaré hacer vida con un grupo, esto le dará sente para ocupar un punto grande... al final perderé unos 5 puntos. Pero si primero refuerzo y luego corto, aunque pierdo sente, pero..."

Este tipo de pensamiento multinivel y multidimensional requiere procesar simultáneamente lo local y lo global, el corto y largo plazo.

Yose: Cálculo Preciso y Remontadas

La fase de yose parece simple - solo cerrar. Pero en realidad:

El "valor en puntos" de cada movimiento necesita cálculo preciso
La diferencia entre sente y gote puede decidir la partida
Los "ko" pueden cambiar completamente la posición

Los jugadores profesionales pueden calcular con precisión de 0.5 puntos en el yose, y una partida puede decidirse por 1 punto.

Por Qué No Ver Lejos es Fatal

Hagamos un cálculo simplificado:

Una partida promedio tiene 250 movimientos
Para predecir perfectamente el resultado, teóricamente necesitas ver los 250 movimientos
Incluso si el factor de ramificación baja a 100 (fase de yose), el espacio de búsqueda es 100^250 ≈ 10^500

Esto está mucho más allá de la capacidad de cualquier computadora.

Esta es la razón por la que la IA de Go debe aprender a "evaluar" posiciones, no solo "calcular".

La Importancia de la Intuición: "Este Movimiento Se Siente Correcto"

Cómo Piensan los Jugadores Humanos

Cuando los mejores jugadores de Go describen su proceso de pensamiento, frecuentemente usan palabras como:

"Este movimiento se siente correcto."

"Esta forma es muy cómoda."

"Ese grupo tiene mal aji."

"Aquí hay una sensación de peligro inexplicable."

Esta no es una descripción poética, sino un proceso cognitivo real. Los jugadores humanos usan reconocimiento de patrones y juicio intuitivo para manejar la complejidad del Go.

Reconocimiento de Patrones: Ver el Punto Clave en Un Segundo

Los experimentos muestran que los jugadores profesionales pueden, con solo mirar el tablero (menos de 1 segundo):

Identificar las áreas clave
Descubrir posibles "buenos movimientos"
Percibir la situación general de la posición

Esta habilidad proviene de la acumulación de experiencia de decenas de miles de partidas, formando el "sentido del Go".

Antes de AlphaGo, la mayor dificultad de los programas de Go era no poder replicar esta intuición.

Descripción Matemática de la Intuición

Desde la perspectiva del aprendizaje automático, la intuición humana en Go puede entenderse como:

P(\text{buen movimiento} | \text{posición del tablero})

Un cerebro bien entrenado puede, basándose en la posición del tablero, producir inmediatamente una distribución de probabilidad de cada posición siendo un "buen movimiento".

Esto es exactamente lo que la Policy Network está aprendiendo - y requiere redes neuronales profundas.

Por Qué Fue Llamado el "Santo Grial de la IA"

Hitos de los Juegos de Tablero

En la historia de la inteligencia artificial, los juegos de tablero siempre han sido hitos importantes:

Año	Evento	Significado
1951	Primer programa de damas	Los primeros juegos de IA
1997	Deep Blue derrota a Kasparov	Victoria de la búsqueda por fuerza bruta
2007	Las damas son completamente resueltas	El límite de los juegos de información perfecta
2016	AlphaGo derrota a Lee Sedol	Victoria del aprendizaje profundo

Por Qué el Go es Especial

El Go fue llamado el "Santo Grial de la IA" porque combina todas las características difíciles:

Característica	Go	Ajedrez
Espacio de estados	10^170	10^120
Factor de ramificación	~250	~35
Movimientos promedio	~250	~40
Dificultad de evaluación	Extremadamente alta	Media
Dependencia de intuición	Muy alta	Alta

Si la IA podía resolver el Go, significaría que:

Puede manejar espacios de búsqueda extremadamente grandes
Puede aprender evaluación abstracta
Puede realizar planificación a largo plazo
Puede formar "intuición"

Estas capacidades van mucho más allá del "jugar juegos", son características centrales de la inteligencia general.

Predicciones de la Academia

Antes de 2016, la predicción académica para "cuándo la IA podría derrotar al campeón humano de Go" era generalmente:

"Al menos 10-20 años más."

— La mayoría de los investigadores de IA (2015)

Esta predicción se basaba en la velocidad del progreso tecnológico de entonces. Los programas de Go mejoraban aproximadamente 1-2 rangos por año, y los 9-dan profesionales tenían una diferencia de fuerza de 18 rangos. A ese ritmo, efectivamente se necesitarían 10-20 años.

Nadie anticipó que el aprendizaje profundo traería un avance disruptivo.

Correspondencia de Animaciones

Los conceptos centrales de este artículo y sus números de animación:

Número	Concepto	Correspondencia Física/Matemática
🎬 B2	Explosión del espacio de estados	Matemáticas combinatorias, crecimiento exponencial
🎬 B8	Explosión combinatoria	Crecimiento factorial, árbol de búsqueda
🎬 A3	Comparación de factores de ramificación	Teoría de grafos, estructura de árbol
🎬 B5	Dilema de la función de evaluación	Mapeo no lineal

Puntos Clave Resumidos

El Go fue llamado el "Santo Grial de la IA" porque combina tres grandes desafíos:

1. La Maldición del Espacio

10^170 posiciones posibles, muy superior a los átomos del universo
Factor de ramificación ~250, crecimiento explosivo del árbol de búsqueda
Búsqueda por fuerza bruta físicamente imposible

2. La Dificultad de la Evaluación

Cada piedra tiene el mismo valor, sin ventaja material
"Espesor", "influencia", "aji" y otros conceptos abstractos son difíciles de cuantificar
La evaluación de posiciones es un problema altamente no lineal y global

3. El Desafío del Tiempo

~250 movimientos por partida, requiere planificación a largo plazo
Las decisiones de apertura afectan la posición 50-100 movimientos después
El combate local y el equilibrio global deben considerarse simultáneamente

Es la combinación de estos desafíos lo que hizo que los métodos tradicionales de IA (búsqueda por fuerza bruta + evaluación manual) fracasaran completamente en Go.

El avance de AlphaGo fue porque usó redes neuronales profundas para resolver el problema de evaluación, Búsqueda de Árbol Monte Carlo para resolver el problema de planificación, y aprendizaje por refuerzo para superar a los humanos.

Lecturas Recomendadas

Siguiente artículo: Los Límites de los Métodos Tradicionales — De Minimax a MCTS, por qué todo era insuficiente
Detalles técnicos: Policy Network Explicada en Detalle — Cómo AlphaGo aprendió la "intuición"
Volver al índice: Análisis Completo de AlphaGo — Navegación de la serie de artículos

Referencias

Tromp, J. (2016). "Number of legal Go positions." — Cálculo preciso del espacio de estados del Go
Allis, L.V. (1994). "Searching for Solutions in Games and Artificial Intelligence." PhD thesis, University of Limburg. — Análisis teórico de la complejidad de juegos
Müller, M. (2002). "Computer Go." Artificial Intelligence, 134(1-2), 145-179. — Revisión temprana de la investigación en Go por computadora
Silver, D., et al. (2016). "Mastering the game of Go with deep neural networks and tree search." Nature, 529, 484-489. — Artículo original de AlphaGo

La Explosión del Espacio de Estados: El Significado de 10^170​

¿Qué es el Espacio de Estados?​

Comparación con los Átomos del Universo​

Comprensión Intuitiva de los Números​

¿Por Qué el Espacio de Estados del Go es Tan Grande?​

1. Tamaño del Tablero​

2. Tres Estados por Intersección​

3. Las Piedras No Se Mueven​

Código Ilustrativo: Estimación del Espacio de Estados​

La Maldición del Factor de Ramificación: Promedio de 250 Opciones​

¿Qué es el Factor de Ramificación?​

Crecimiento Explosivo del Árbol de Búsqueda​

Por Qué el Método de Deep Blue Falló en Go​

Las Opciones de Apertura son Aún Más Astronómicas​

La Dificultad de la Evaluación: No Hay Valores Simples de Piezas​

La Ventaja Material del Ajedrez​

Go: Cada Piedra es Igual​

La Naturaleza Abstracta del Espesor e Influencia​

Espesor (Thickness)​

Influencia (Influence)​

Aji (Sabor/Potencial)​

Por Qué Fallaron las Funciones de Evaluación Manuales​

La Necesidad de Planificación a Largo Plazo: Una Partida de 150 Movimientos​

Las Tres Fases del Go​

Apertura: Planificando 30 Movimientos Adelante​

Medio Juego: Equilibrio entre Local y Global​

Yose: Cálculo Preciso y Remontadas​

Por Qué No Ver Lejos es Fatal​

La Importancia de la Intuición: "Este Movimiento Se Siente Correcto"​

Cómo Piensan los Jugadores Humanos​

Reconocimiento de Patrones: Ver el Punto Clave en Un Segundo​

Descripción Matemática de la Intuición​

Por Qué Fue Llamado el "Santo Grial de la IA"​

Hitos de los Juegos de Tablero​

Por Qué el Go es Especial​

Predicciones de la Academia​

Correspondencia de Animaciones​

Puntos Clave Resumidos​

1. La Maldición del Espacio​

2. La Dificultad de la Evaluación​

3. El Desafío del Tiempo​

Lecturas Recomendadas​

Referencias​