Saltar al contenido principal

¿Por Qué es Difícil el Go?

Antes de AlphaGo, el Go era considerado la "última fortaleza" de la inteligencia artificial. Durante décadas, los investigadores probaron varios métodos, pero nunca pudieron hacer que las computadoras alcanzaran el nivel de jugadores profesionales.

Esto no fue porque los investigadores no se esforzaran lo suficiente, sino porque el Go es inherentemente un problema computacional extremadamente difícil.

Este artículo explorará en profundidad: ¿Qué hace tan difícil al Go? ¿Por qué fue llamado el "Santo Grial de la IA"?


La Explosión del Espacio de Estados: El Significado de 10^170

¿Qué es el Espacio de Estados?

En cualquier juego de tablero, el espacio de estados (State Space) se refiere al número total de todas las posiciones posibles del tablero. Este número determina la viabilidad de la búsqueda por fuerza bruta.

Para el Go, este número es:

Espacio de estados del Go ≈ 10^170

¿Qué significa esto? Hagamos algunas comparaciones.

Comparación con los Átomos del Universo

Según las estimaciones de los físicos, el número total de átomos en el universo observable es aproximadamente:

Átomos del universo ≈ 10^80

Esto significa:

El número de posiciones posibles en Go es 10^90 veces el número de átomos en el universo.

Si usaras cada átomo del universo como una supercomputadora, y cada computadora pudiera procesar mil millones de posiciones por segundo, desde el Big Bang hasta ahora (aproximadamente 13.8 mil millones de años) no sería posible enumerar todas las posiciones.

Comprensión Intuitiva de los Números

NúmeroSignificado
10^9Mil millones, orden de magnitud de la población humana
10^12Un billón, número de hormigas en el mundo
10^23Número de moléculas en un mol
10^80Número de átomos en el universo
10^120Espacio de estados del ajedrez
10^170Espacio de estados del Go

¿Por Qué el Espacio de Estados del Go es Tan Grande?

Hay varias razones por las que el espacio de estados del Go es enorme:

1. Tamaño del Tablero

El Go usa un tablero de 19×19, con un total de 361 intersecciones. En comparación:

  • Ajedrez: 8×8 = 64 casillas
  • Ajedrez chino: 9×10 = 90 intersecciones
  • Cinco en línea: 15×15 = 225 intersecciones

2. Tres Estados por Intersección

Cada intersección puede ser:

  • Vacía (sin piedra)
  • Piedra negra
  • Piedra blanca

Una estimación aproximada da 3^361 ≈ 10^172 combinaciones posibles. Considerando las reglas del Go (como ko y restricciones de libertades), las posiciones legales reales son aproximadamente 10^170.

3. Las Piedras No Se Mueven

A diferencia del ajedrez, las piedras de Go una vez colocadas no se mueven (a menos que sean capturadas). Esto significa que cada movimiento añade una nueva piedra, en lugar de mover una existente, lo que resulta en más caminos posibles.

Código Ilustrativo: Estimación del Espacio de Estados

import math

# Tamaño del tablero
BOARD_SIZE = 19
TOTAL_POINTS = BOARD_SIZE ** 2 # 361

# Tres estados por intersección (vacío, negro, blanco)
# Límite superior aproximado
upper_bound = 3 ** TOTAL_POINTS
print(f"Límite superior aproximado: 3^{TOTAL_POINTS} ≈ 10^{math.log10(upper_bound):.0f}")
# Salida: Límite superior aproximado: 3^361 ≈ 10^172

# Estimación real considerando restricciones de reglas
# El cálculo preciso de Tromp-Taylor da aproximadamente 2.08 × 10^170
actual_estimate = 2.08e170
print(f"Estimación real: {actual_estimate:.2e}")

# Comparación con átomos del universo
universe_atoms = 1e80
ratio = actual_estimate / universe_atoms
print(f"Posiciones de Go / Átomos del universo = 10^{math.log10(ratio):.0f}")
# Salida: Posiciones de Go / Átomos del universo = 10^90

La Maldición del Factor de Ramificación: Promedio de 250 Opciones

¿Qué es el Factor de Ramificación?

El factor de ramificación (Branching Factor) es el número promedio de movimientos legales en cualquier punto del juego. Este número determina el ancho del árbol de búsqueda.

JuegoFactor de Ramificación Promedio
Tres en raya~4
Ajedrez~35
Ajedrez chino~38
Reversi~10
Go~250

Crecimiento Explosivo del Árbol de Búsqueda

Supongamos que queremos usar un algoritmo de búsqueda de árbol para ver N movimientos adelante. El número de posiciones a considerar es aproximadamente:

Nuˊmero de nodosbN\text{Número de nodos} \approx b^N

Donde b es el factor de ramificación.

Comparemos ajedrez y Go:

Ver N movimientosAjedrez (b=35)Go (b=250)Diferencia
1 movimiento35250
2 movimientos1,22562,50051×
4 movimientos1.5 millones3.9 mil millones2,600×
6 movimientos1.8 mil millones2.4×10^14130 millones×
10 movimientos2.8×10^159.5×10^23340 millones×

Ver 10 movimientos adelante, el Go requiere considerar 340 millones de veces más posiciones que el ajedrez.

Por Qué el Método de Deep Blue Falló en Go

Deep Blue, que derrotó a Kasparov en 1997, usó tecnologías centrales que incluían:

  1. Poda alfa-beta: Reducir nodos de búsqueda
  2. Aceleración por hardware: Evaluar 200 millones de posiciones por segundo
  3. Función de evaluación manual: Evaluación de posiciones diseñada por expertos

Pero incluso usando los mismos métodos:

  • Ajedrez: Ver 12-14 movimientos requiere evaluar aproximadamente 10^18 nodos
  • Go: Ver 12 movimientos requiere evaluar aproximadamente 10^29 nodos

La diferencia es de mil billones de billones. Ningún hardware puede cerrar esta brecha.

Las Opciones de Apertura son Aún Más Astronómicas

En la fase de apertura del Go, el factor de ramificación es aún mayor:

  • Movimiento 1: 361 opciones
  • Movimiento 2: 360 opciones
  • Movimiento 3: 359 opciones
  • ...

Incluso viendo solo los primeros 10 movimientos:

361×360×359×...×3525.5×1025361 \times 360 \times 359 \times ... \times 352 \approx 5.5 \times 10^{25}

Esta es la razón por la que los "joseki de apertura" son tan importantes - los jugadores humanos necesitan memorizar muchas variaciones de apertura porque no pueden calcularlas en tiempo real.


La Dificultad de la Evaluación: No Hay Valores Simples de Piezas

La Ventaja Material del Ajedrez

En ajedrez, evaluar una posición es relativamente intuitivo:

PiezaValor (tradicional)
Peón1
Caballo3
Alfil3
Torre5
Reina9

Aunque la evaluación real es más compleja (posición, estructura, etc.), "contar material" es un buen punto de partida. Capturar la reina del oponente es casi seguro algo bueno.

Go: Cada Piedra es Igual

En Go, el valor intrínseco de cada piedra es exactamente el mismo - todas son simplemente piedras.

El valor de una piedra depende completamente de:

  • Su posición en el tablero
  • Su relación con otras piedras
  • Su influencia en la posición general

Esto hace que la evaluación sea extremadamente difícil.

La Naturaleza Abstracta del Espesor e Influencia

El Go tiene muchos conceptos abstractos:

Espesor (Thickness)

"Espesor" se refiere a un grupo de piedras que es sólido, estable e influyente. Pero el "espesor" es difícil de cuantificar:

  • ¿Cuántos puntos vale una forma espesa?
  • ¿Cuándo se debe usar el espesor para atacar?
  • ¿Cuándo el espesor se convierte en "forma pesada" (forma ineficiente)?

Los mejores jugadores podrían decir: "Este grupo es muy espeso, probablemente vale unos 15 puntos". Pero esto se basa en décadas de experiencia e intuición, no en cálculos precisos.

Influencia (Influence)

La influencia en Go se refiere al control potencial de las piedras sobre el espacio circundante. Este control es "virtual" - puede convertirse en territorio, puede ser útil en ataques y defensas, o puede terminar siendo nada.

¿Cómo se evalúa el valor "potencial"? Esto es extremadamente difícil para las computadoras.

Aji (Sabor/Potencial)

"Aji" es uno de los conceptos más abstractos en Go. Se refiere al potencial latente de una posición en el tablero.

Un grupo "muerto" puede tener "valor de utilización" - aunque no se pueda revivir, puede causar interferencia en futuras batallas. Este "potencial latente" es casi imposible de representar numéricamente.

Por Qué Fallaron las Funciones de Evaluación Manuales

Antes de Deep Blue, el ajedrez por computadora usaba funciones de evaluación diseñadas por expertos humanos:

Valor de evaluación = Puntuación material + Puntuación posicional + Seguridad del rey + Estructura de peones + ...

Estos factores podían cuantificarse y ajustarse sus pesos, y funcionaba bastante bien.

¿Pero el Go?

Los investigadores probaron varias características:

  • Número de intersecciones controladas
  • "Libertad" de las piedras (número de libertades)
  • Fuerza de conexión
  • Integridad de las formas de ojos
  • ...

Pero la combinación de estas características nunca alcanzó el nivel de un amateur fuerte.

El problema central: La evaluación de posiciones en Go es un problema altamente no lineal y global.

El valor de una piedra depende del estado de todo el tablero, no de la simple suma de características locales.


La Necesidad de Planificación a Largo Plazo: Una Partida de 150 Movimientos

Las Tres Fases del Go

Una partida estándar de Go típicamente pasa por tres fases:

FaseMovimientos (aprox.)Características
Apertura1-50Ocupar territorio, construir marcos, establecer dirección global
Medio juego50-200Combate, ataque y defensa, equilibrio entre local y global
Yose200-300Cierre, cálculo, precisión

Una partida promedio tiene aproximadamente 250-300 movimientos, y los primeros 150 movimientos determinan el resultado general.

Apertura: Planificando 30 Movimientos Adelante

Cada movimiento en la fase de apertura prepara para decenas o incluso cientos de movimientos futuros.

Por ejemplo, una apertura "San-ren-sei" (tres estrellas en línea):

. . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . .
. . . ● . . . . . ● . . . . . ● . . .
. . . . . . . . . . . . . . . . . . .
...

Estas tres piedras negras forman una apertura "orientada a la influencia", con la intención de:

  1. No apresurarse a cercar territorio
  2. Esperar a que blancas invada y luego atacar
  3. Obtener territorio o influencia a través del ataque
  4. Finalmente lograr ventaja en el yose

Este "plan" requiere prever 50-100 movimientos en el futuro. Ningún algoritmo de búsqueda puede ver tan lejos.

Medio Juego: Equilibrio entre Local y Global

El combate del medio juego es la parte más compleja del Go. Los jugadores necesitan considerar en cada movimiento:

  1. Cálculo local: ¿Quién ganará esta batalla?
  2. Juicio global: ¿Vale la pena luchar aquí?
  3. Selección de secuencia: ¿Dónde jugar primero es más eficiente?
  4. Decisión de sacrificio: ¿Cuándo sacrificar piedras y cambiar de dirección?

Una decisión típica de medio juego:

"Si corto aquí, el oponente contraatacará, necesitaré hacer vida con un grupo, esto le dará sente para ocupar un punto grande... al final perderé unos 5 puntos. Pero si primero refuerzo y luego corto, aunque pierdo sente, pero..."

Este tipo de pensamiento multinivel y multidimensional requiere procesar simultáneamente lo local y lo global, el corto y largo plazo.

Yose: Cálculo Preciso y Remontadas

La fase de yose parece simple - solo cerrar. Pero en realidad:

  • El "valor en puntos" de cada movimiento necesita cálculo preciso
  • La diferencia entre sente y gote puede decidir la partida
  • Los "ko" pueden cambiar completamente la posición

Los jugadores profesionales pueden calcular con precisión de 0.5 puntos en el yose, y una partida puede decidirse por 1 punto.

Por Qué No Ver Lejos es Fatal

Hagamos un cálculo simplificado:

  • Una partida promedio tiene 250 movimientos
  • Para predecir perfectamente el resultado, teóricamente necesitas ver los 250 movimientos
  • Incluso si el factor de ramificación baja a 100 (fase de yose), el espacio de búsqueda es 100^250 ≈ 10^500

Esto está mucho más allá de la capacidad de cualquier computadora.

Esta es la razón por la que la IA de Go debe aprender a "evaluar" posiciones, no solo "calcular".


La Importancia de la Intuición: "Este Movimiento Se Siente Correcto"

Cómo Piensan los Jugadores Humanos

Cuando los mejores jugadores de Go describen su proceso de pensamiento, frecuentemente usan palabras como:

"Este movimiento se siente correcto."

"Esta forma es muy cómoda."

"Ese grupo tiene mal aji."

"Aquí hay una sensación de peligro inexplicable."

Esta no es una descripción poética, sino un proceso cognitivo real. Los jugadores humanos usan reconocimiento de patrones y juicio intuitivo para manejar la complejidad del Go.

Reconocimiento de Patrones: Ver el Punto Clave en Un Segundo

Los experimentos muestran que los jugadores profesionales pueden, con solo mirar el tablero (menos de 1 segundo):

  1. Identificar las áreas clave
  2. Descubrir posibles "buenos movimientos"
  3. Percibir la situación general de la posición

Esta habilidad proviene de la acumulación de experiencia de decenas de miles de partidas, formando el "sentido del Go".

Antes de AlphaGo, la mayor dificultad de los programas de Go era no poder replicar esta intuición.

Descripción Matemática de la Intuición

Desde la perspectiva del aprendizaje automático, la intuición humana en Go puede entenderse como:

P(buen movimientoposicioˊn del tablero)P(\text{buen movimiento} | \text{posición del tablero})

Un cerebro bien entrenado puede, basándose en la posición del tablero, producir inmediatamente una distribución de probabilidad de cada posición siendo un "buen movimiento".

Esto es exactamente lo que la Policy Network está aprendiendo - y requiere redes neuronales profundas.


Por Qué Fue Llamado el "Santo Grial de la IA"

Hitos de los Juegos de Tablero

En la historia de la inteligencia artificial, los juegos de tablero siempre han sido hitos importantes:

AñoEventoSignificado
1951Primer programa de damasLos primeros juegos de IA
1997Deep Blue derrota a KasparovVictoria de la búsqueda por fuerza bruta
2007Las damas son completamente resueltasEl límite de los juegos de información perfecta
2016AlphaGo derrota a Lee SedolVictoria del aprendizaje profundo

Por Qué el Go es Especial

El Go fue llamado el "Santo Grial de la IA" porque combina todas las características difíciles:

CaracterísticaGoAjedrez
Espacio de estados10^17010^120
Factor de ramificación~250~35
Movimientos promedio~250~40
Dificultad de evaluaciónExtremadamente altaMedia
Dependencia de intuiciónMuy altaAlta

Si la IA podía resolver el Go, significaría que:

  1. Puede manejar espacios de búsqueda extremadamente grandes
  2. Puede aprender evaluación abstracta
  3. Puede realizar planificación a largo plazo
  4. Puede formar "intuición"

Estas capacidades van mucho más allá del "jugar juegos", son características centrales de la inteligencia general.

Predicciones de la Academia

Antes de 2016, la predicción académica para "cuándo la IA podría derrotar al campeón humano de Go" era generalmente:

"Al menos 10-20 años más."

— La mayoría de los investigadores de IA (2015)

Esta predicción se basaba en la velocidad del progreso tecnológico de entonces. Los programas de Go mejoraban aproximadamente 1-2 rangos por año, y los 9-dan profesionales tenían una diferencia de fuerza de 18 rangos. A ese ritmo, efectivamente se necesitarían 10-20 años.

Nadie anticipó que el aprendizaje profundo traería un avance disruptivo.


Correspondencia de Animaciones

Los conceptos centrales de este artículo y sus números de animación:

NúmeroConceptoCorrespondencia Física/Matemática
🎬 B2Explosión del espacio de estadosMatemáticas combinatorias, crecimiento exponencial
🎬 B8Explosión combinatoriaCrecimiento factorial, árbol de búsqueda
🎬 A3Comparación de factores de ramificaciónTeoría de grafos, estructura de árbol
🎬 B5Dilema de la función de evaluaciónMapeo no lineal

Puntos Clave Resumidos

El Go fue llamado el "Santo Grial de la IA" porque combina tres grandes desafíos:

1. La Maldición del Espacio

  • 10^170 posiciones posibles, muy superior a los átomos del universo
  • Factor de ramificación ~250, crecimiento explosivo del árbol de búsqueda
  • Búsqueda por fuerza bruta físicamente imposible

2. La Dificultad de la Evaluación

  • Cada piedra tiene el mismo valor, sin ventaja material
  • "Espesor", "influencia", "aji" y otros conceptos abstractos son difíciles de cuantificar
  • La evaluación de posiciones es un problema altamente no lineal y global

3. El Desafío del Tiempo

  • ~250 movimientos por partida, requiere planificación a largo plazo
  • Las decisiones de apertura afectan la posición 50-100 movimientos después
  • El combate local y el equilibrio global deben considerarse simultáneamente

Es la combinación de estos desafíos lo que hizo que los métodos tradicionales de IA (búsqueda por fuerza bruta + evaluación manual) fracasaran completamente en Go.

El avance de AlphaGo fue porque usó redes neuronales profundas para resolver el problema de evaluación, Búsqueda de Árbol Monte Carlo para resolver el problema de planificación, y aprendizaje por refuerzo para superar a los humanos.


Lecturas Recomendadas


Referencias

  1. Tromp, J. (2016). "Number of legal Go positions." — Cálculo preciso del espacio de estados del Go
  2. Allis, L.V. (1994). "Searching for Solutions in Games and Artificial Intelligence." PhD thesis, University of Limburg. — Análisis teórico de la complejidad de juegos
  3. Müller, M. (2002). "Computer Go." Artificial Intelligence, 134(1-2), 145-179. — Revisión temprana de la investigación en Go por computadora
  4. Silver, D., et al. (2016). "Mastering the game of Go with deep neural networks and tree search." Nature, 529, 484-489. — Artículo original de AlphaGo