Lewati ke konten utama

Mengapa Go Sulit?

Sebelum AlphaGo muncul, Go dianggap sebagai "benteng terakhir" kecerdasan buatan. Selama puluhan tahun, para peneliti mencoba berbagai metode, tetapi tidak pernah bisa membuat komputer mencapai level pemain profesional.

Ini bukan karena para peneliti tidak cukup berusaha, tetapi karena Go pada dasarnya adalah masalah komputasi yang sangat sulit.

Artikel ini akan mengeksplorasi secara mendalam: Apa yang membuat Go begitu sulit? Mengapa ia disebut "Cawan Suci AI"?


Ledakan Ruang Keadaan: Makna 10^170

Apa Itu Ruang Keadaan?

Dalam permainan papan apa pun, ruang keadaan (State Space) mengacu pada jumlah total semua posisi papan yang mungkin. Angka ini menentukan kelayakan pencarian brute force.

Untuk Go, angka ini adalah:

Ruang keadaan Go ≈ 10^170

Apa artinya ini? Mari kita buat beberapa perbandingan.

Perbandingan dengan Jumlah Atom di Alam Semesta

Menurut perkiraan fisikawan, jumlah total atom di alam semesta yang dapat diamati adalah sekitar:

Jumlah atom alam semesta ≈ 10^80

Ini berarti:

Jumlah posisi Go yang mungkin adalah 10^90 kali jumlah atom di alam semesta.

Jika Anda menjadikan setiap atom di alam semesta sebagai superkomputer, dan setiap komputer dapat memproses 1 miliar posisi per detik, dari Big Bang hingga sekarang (sekitar 13,8 miliar tahun) tidak mungkin untuk menghitung semua posisi.

Pemahaman Intuitif Angka-angka

AngkaMakna
10^9Satu miliar, skala populasi total manusia
10^12Satu triliun, jumlah semut di seluruh dunia
10^23Jumlah molekul dalam satu mol
10^80Jumlah atom di alam semesta
10^120Ruang keadaan catur
10^170Ruang keadaan Go

Mengapa Ruang Keadaan Go Begitu Besar?

Ada beberapa alasan mengapa ruang keadaan Go sangat besar:

1. Ukuran Papan

Go menggunakan papan 19×19, dengan total 361 titik persimpangan. Sebagai perbandingan:

  • Catur: 8×8 = 64 kotak
  • Catur Tiongkok: 9×10 = 90 titik persimpangan
  • Gomoku: 15×15 = 225 titik persimpangan

2. Tiga Keadaan per Titik

Setiap titik persimpangan dapat berupa:

  • Kosong (tidak ada batu)
  • Batu hitam
  • Batu putih

Perkiraan kasar, jumlah kombinasi yang mungkin adalah 3^361 ≈ 10^172. Dengan mempertimbangkan aturan Go (seperti ko, batasan kebebasan), posisi legal yang sebenarnya sekitar 10^170.

3. Batu Tidak Bergerak

Tidak seperti catur, batu Go setelah diletakkan tidak akan bergerak (kecuali ditangkap). Ini berarti setiap langkah menambah batu baru, bukan memindahkan batu yang ada, menghasilkan lebih banyak jalur yang mungkin.

Ilustrasi Kode: Estimasi Ruang Keadaan

import math

# Ukuran papan
BOARD_SIZE = 19
TOTAL_POINTS = BOARD_SIZE ** 2 # 361

# Tiga keadaan per titik (kosong, hitam, putih)
# Batas atas kasar
upper_bound = 3 ** TOTAL_POINTS
print(f"Batas atas kasar: 3^{TOTAL_POINTS} ≈ 10^{math.log10(upper_bound):.0f}")
# Output: Batas atas kasar: 3^361 ≈ 10^172

# Estimasi aktual setelah mempertimbangkan batasan aturan
# Perhitungan tepat Tromp-Taylor memberikan sekitar 2.08 × 10^170
actual_estimate = 2.08e170
print(f"Estimasi aktual: {actual_estimate:.2e}")

# Perbandingan dengan jumlah atom alam semesta
universe_atoms = 1e80
ratio = actual_estimate / universe_atoms
print(f"Posisi Go / Atom alam semesta = 10^{math.log10(ratio):.0f}")
# Output: Posisi Go / Atom alam semesta = 10^90

Kutukan Faktor Percabangan: Rata-rata 250 Pilihan

Apa Itu Faktor Percabangan?

Faktor percabangan (Branching Factor) mengacu pada berapa banyak langkah legal rata-rata yang tersedia pada setiap langkah dalam permainan. Angka ini menentukan lebar pohon pencarian.

PermainanFaktor Percabangan Rata-rata
Tic-tac-toe~4
Catur~35
Catur Tiongkok~38
Reversi~10
Go~250

Pertumbuhan Eksplosif Pohon Pencarian

Misalkan kita ingin menggunakan algoritma pencarian pohon untuk melihat N langkah ke depan. Jumlah posisi yang perlu dipertimbangkan kira-kira:

Jumlah nodebN\text{Jumlah node} \approx b^N

Di mana b adalah faktor percabangan.

Mari bandingkan catur dan Go:

Melihat N langkahCatur (b=35)Go (b=250)Perbedaan
1 langkah35250
2 langkah1,22562,50051×
4 langkah1.5 juta3.9 miliar2,600×
6 langkah1.8 miliar2.4×10^14130 juta×
10 langkah2.8×10^159.5×10^23340 juta×

Melihat 10 langkah ke depan, Go membutuhkan pertimbangan 340 juta kali lebih banyak posisi daripada catur.

Mengapa Metode Deep Blue Gagal di Go

Deep Blue yang mengalahkan Kasparov pada tahun 1997 menggunakan teknologi inti:

  1. Alpha-Beta pruning: Mengurangi node pencarian
  2. Akselerasi hardware: Mengevaluasi 200 juta posisi per detik
  3. Fungsi evaluasi manual: Evaluasi posisi yang dirancang ahli

Tetapi bahkan dengan metode yang sama:

  • Catur: Melihat 12-14 langkah memerlukan evaluasi sekitar 10^18 node
  • Go: Melihat 12 langkah memerlukan evaluasi sekitar 10^29 node

Perbedaannya adalah 10 miliar miliar kali. Tidak ada hardware yang bisa menjembatani perbedaan ini.

Pilihan Pembukaan Lebih Besar Lagi

Di fase pembukaan Go, faktor percabangan lebih tinggi:

  • Langkah ke-1: 361 pilihan
  • Langkah ke-2: 360 pilihan
  • Langkah ke-3: 359 pilihan
  • ...

Bahkan hanya melihat 10 langkah pertama:

361×360×359×...×3525.5×1025361 \times 360 \times 359 \times ... \times 352 \approx 5.5 \times 10^{25}

Inilah mengapa "joseki pembukaan" sangat penting — pemain manusia perlu menghafal banyak variasi pembukaan karena tidak bisa menghitungnya secara real-time.


Kesulitan Evaluasi: Tidak Ada Nilai Bidak Sederhana

Keunggulan Material dalam Catur

Dalam catur, mengevaluasi posisi relatif intuitif:

BidakNilai (tradisional)
Pion1
Kuda3
Gajah3
Benteng5
Ratu9

Meskipun evaluasi sebenarnya lebih kompleks (posisi, struktur, dll.), "menghitung bidak" adalah titik awal yang baik. Menangkap ratu lawan hampir pasti hal yang baik.

Go: Setiap Batu Sama Nilainya

Dalam Go, nilai intrinsik setiap batu persis sama — hanya sebuah batu.

Nilai sebuah batu sepenuhnya tergantung pada:

  • Posisinya di papan
  • Hubungannya dengan batu lain
  • Pengaruhnya terhadap situasi keseluruhan

Ini membuat evaluasi menjadi sangat sulit.

Abstraksi Ketebalan dan Pengaruh

Go memiliki banyak konsep abstrak:

Ketebalan (Thickness)

"Tebal" mengacu pada sekelompok batu yang solid, stabil, dan berpengaruh. Tetapi "tebal" sulit dikuantifikasi:

  • Berapa nilai bentuk yang tebal dalam poin?
  • Kapan harus memanfaatkan ketebalan untuk menyerang?
  • Kapan ketebalan menjadi "bentuk bodoh" (bentuk yang tidak efisien)?

Pemain top mungkin berkata: "Kelompok batu ini sangat tebal, mungkin bernilai sekitar 15 poin." Tetapi ini berdasarkan intuisi dari puluhan tahun pengalaman, bukan perhitungan tepat.

Pengaruh (Influence)

Pengaruh dalam Go mengacu pada potensi kontrol batu terhadap ruang di sekitarnya. Kontrol ini "virtual" — mungkin berubah menjadi wilayah, mungkin berperan dalam serangan-pertahanan, atau mungkin tidak menjadi apa-apa.

Bagaimana mengevaluasi nilai "potensial"? Ini sangat sulit untuk komputer.

Aji

"Aji" adalah salah satu konsep paling abstrak dalam Go. Ini mengacu pada potensi kemungkinan di posisi tertentu di papan.

Sekelompok "batu mati" mungkin memiliki "nilai pemanfaatan" — meskipun tidak bisa diselamatkan, dapat menghasilkan gangguan dalam pertempuran masa depan. "Potensi kemungkinan" ini hampir tidak bisa diekspresikan secara numerik.

Mengapa Fungsi Evaluasi Manual Gagal

Catur komputer sebelum Deep Blue menggunakan fungsi evaluasi yang dirancang ahli manusia:

Nilai evaluasi = Skor material + Skor posisi + Keamanan raja + Struktur pion + ...

Item-item ini bisa dikuantifikasi, bobot disesuaikan, dan hasilnya cukup baik.

Tetapi bagaimana dengan Go?

Para peneliti mencoba berbagai fitur:

  • Jumlah titik persimpangan yang dikontrol
  • "Kebebasan" batu (jumlah kebebasan)
  • Kekuatan koneksi
  • Kelengkapan bentuk mata
  • ...

Tetapi kombinasi fitur-fitur ini tidak pernah mencapai level amatir tingkat tinggi.

Masalah inti: Evaluasi posisi Go adalah masalah yang sangat non-linear dan global.

Nilai sebuah batu tergantung pada keadaan seluruh papan, bukan penjumlahan sederhana fitur lokal.


Kebutuhan Perencanaan Jangka Panjang: Satu Permainan 150 Langkah

Tiga Fase Utama Go

Permainan Go standar biasanya melalui tiga fase:

FaseLangkah (kira-kira)Karakteristik
Pembukaan1-50Mengklaim wilayah, membangun kerangka, menetapkan arah global
Pertengahan50-200Pertempuran, serangan-pertahanan, keseimbangan lokal dan global
Akhir200-300Penyelesaian, perhitungan, presisi

Rata-rata satu permainan sekitar 250-300 langkah, di mana 150 langkah pertama menentukan hasil keseluruhan.

Pembukaan: Merencanakan 30 Langkah ke Depan

Setiap langkah di fase pembukaan mempersiapkan untuk puluhan bahkan ratusan langkah ke depan.

Misalnya, pembukaan "three-star point":

. . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . .
. . . ● . . . . . ● . . . . . ● . . .
. . . . . . . . . . . . . . . . . . .
...

Tiga batu hitam ini membentuk pembukaan "tipe pengaruh", dengan maksud:

  1. Tidak terburu-buru mengamankan wilayah
  2. Menunggu Putih masuk lalu menyerang
  3. Mendapatkan wilayah atau pengaruh melalui serangan
  4. Akhirnya mencapai keunggulan di akhir permainan

"Rencana" ini memerlukan pandangan ke depan 50-100 langkah. Tidak ada algoritma pencarian yang bisa melihat sejauh itu.

Pertengahan: Keseimbangan Lokal dan Global

Pertempuran pertengahan permainan adalah bagian paling kompleks dari Go. Pemain perlu mempertimbangkan di setiap langkah:

  1. Perhitungan lokal: Siapa yang akan memenangkan pertempuran ini?
  2. Penilaian global: Apakah layak bertarung di sini?
  3. Pilihan urutan: Di mana bermain terlebih dahulu yang paling efisien?
  4. Keputusan menyerah: Kapan harus meninggalkan batu dan berpindah?

Keputusan pertengahan permainan yang khas:

"Jika saya memotong di sini, lawan akan menyerang balik, saya perlu membuat hidup satu kelompok batu, ini akan memberi lawan sente untuk mengambil titik besar... pada akhirnya saya mungkin rugi 5 poin. Tapi jika saya memperkuat dulu baru memotong, meskipun kehilangan sente, tapi..."

Pemikiran multi-level dan multi-dimensi ini memerlukan penanganan lokal dan global, jangka pendek dan jangka panjang secara bersamaan.

Akhir Permainan: Perhitungan Tepat dan Pembalikan

Fase akhir permainan tampak sederhana — hanya penyelesaian. Tetapi sebenarnya:

  • "Nilai poin" setiap langkah perlu perhitungan tepat
  • Perbedaan sente dan gote bisa menentukan menang-kalah
  • "Ko" bisa sepenuhnya mengubah situasi

Pemain profesional di fase akhir permainan bisa mencapai presisi 0.5 poin, sementara menang-kalah satu permainan mungkin hanya berbeda 1 poin.

Mengapa Tidak Bisa Melihat Jauh adalah Fatal

Mari lakukan perhitungan sederhana:

  • Satu permainan rata-rata 250 langkah
  • Untuk memprediksi hasil dengan sempurna, secara teori perlu melihat semua 250 langkah
  • Bahkan jika faktor percabangan turun menjadi 100 (fase akhir), ruang pencarian adalah 100^250 ≈ 10^500

Ini jauh melampaui kemampuan komputer mana pun.

Inilah mengapa AI Go harus belajar "mengevaluasi" posisi, bukan hanya mengandalkan "perhitungan".


Pentingnya Intuisi: "Langkah Ini Terasa Benar"

Cara Berpikir Pemain Manusia

Ketika menjelaskan proses berpikir mereka, pemain Go top sering menggunakan kata-kata seperti:

"Langkah ini terasa benar."

"Bentuk ini sangat nyaman."

"Kelompok batu itu aji-nya tidak bagus."

"Ada perasaan bahaya yang sulit dijelaskan di sini."

Ini bukan deskripsi puitis, tetapi proses kognitif nyata. Pemain manusia menggunakan pengenalan pola dan penilaian intuitif untuk menangani kompleksitas Go.

Pengenalan Pola: Melihat Inti dalam Satu Detik

Eksperimen menunjukkan bahwa pemain profesional dengan sekali melihat papan (kurang dari 1 detik) dapat:

  1. Mengidentifikasi area kunci
  2. Menemukan kemungkinan "langkah bagus"
  3. Merasakan situasi umum posisi

Kemampuan ini berasal dari akumulasi pengalaman puluhan ribu permainan, membentuk "indera Go".

Sebelum AlphaGo, kesulitan terbesar komputer Go adalah tidak bisa mereplikasi intuisi ini.

Deskripsi Matematis Intuisi

Dari perspektif machine learning, intuisi Go manusia dapat dipahami sebagai:

P(langkah bagusposisi papan)P(\text{langkah bagus} | \text{posisi papan})

Otak yang terlatih dengan baik dapat langsung menghasilkan distribusi probabilitas "langkah bagus" untuk setiap posisi berdasarkan posisi papan.

Inilah yang perlu dipelajari Policy Network — dan ini memerlukan deep neural network.


Mengapa Disebut "Cawan Suci AI"

Tonggak Sejarah Permainan Papan

Dalam sejarah kecerdasan buatan, permainan papan selalu menjadi tonggak penting:

TahunPeristiwaMakna
1951Program checkers pertamaGame AI paling awal
1997Deep Blue mengalahkan KasparovKemenangan pencarian brute force
2007Checkers dipecahkan sepenuhnyaBatas permainan informasi sempurna
2016AlphaGo mengalahkan Lee SedolKemenangan deep learning

Mengapa Go Istimewa

Go disebut "Cawan Suci AI" karena menggabungkan semua karakteristik yang sulit:

KarakteristikGoCatur
Ruang keadaan10^17010^120
Faktor percabangan~250~35
Rata-rata langkah~250~40
Kesulitan evaluasiSangat tinggiSedang
Ketergantungan intuisiSangat tinggiTinggi

Jika AI bisa memecahkan Go, itu berarti:

  1. Dapat menangani ruang pencarian yang sangat besar
  2. Dapat mempelajari evaluasi abstrak
  3. Dapat melakukan perencanaan jangka panjang
  4. Dapat membentuk "intuisi"

Kemampuan-kemampuan ini jauh melampaui ruang lingkup "bermain catur", merupakan karakteristik inti kecerdasan umum.

Prediksi Komunitas Akademis

Sebelum 2016, prediksi komunitas akademis tentang "kapan AI bisa mengalahkan juara Go manusia" umumnya adalah:

"Setidaknya masih membutuhkan 10-20 tahun."

— Sebagian besar peneliti AI (2015)

Prediksi ini berdasarkan kecepatan kemajuan teknologi saat itu. Program Go meningkat sekitar 1-2 dan setiap tahun, sementara perbedaan dengan profesional 9-dan adalah 18 tingkat. Dengan kecepatan ini, memang perlu 10-20 tahun.

Tidak ada yang mengantisipasi deep learning akan membawa terobosan lompatan.


Korespondensi Animasi

Konsep inti yang terlibat dalam artikel ini dan nomor animasi:

NomorKonsepKorespondensi Fisika/Matematika
🎬 B2Ledakan ruang keadaanKombinatorika, pertumbuhan eksponensial
🎬 B8Ledakan kombinatorialPertumbuhan faktorial, pohon pencarian
🎬 A3Perbandingan faktor percabanganTeori graf, struktur pohon
🎬 B5Dilema fungsi evaluasiPemetaan non-linear

Ringkasan Poin Penting

Go disebut "Cawan Suci AI" karena menggabungkan tiga masalah besar:

1. Kutukan Ruang

  • 10^170 posisi yang mungkin, jauh melebihi jumlah atom alam semesta
  • Faktor percabangan ~250, pertumbuhan eksplosif pohon pencarian
  • Pencarian brute force secara fisik tidak mungkin

2. Kesulitan Evaluasi

  • Setiap batu bernilai sama, tidak ada keunggulan material
  • Konsep abstrak seperti "ketebalan" "pengaruh" "aji" sulit dikuantifikasi
  • Evaluasi posisi adalah masalah yang sangat non-linear dan global

3. Tantangan Waktu

  • Satu permainan ~250 langkah, memerlukan perencanaan jangka panjang
  • Keputusan pembukaan mempengaruhi posisi 50-100 langkah ke depan
  • Pertempuran lokal dan keseimbangan global perlu dipertimbangkan bersamaan

Kombinasi masalah-masalah inilah yang membuat metode AI tradisional (pencarian brute force + evaluasi manual) sepenuhnya gagal di Go.

Dan terobosan AlphaGo justru karena menggunakan deep neural network untuk memecahkan masalah evaluasi, Monte Carlo Tree Search untuk memecahkan masalah perencanaan, reinforcement learning untuk memecahkan masalah melampaui manusia.


Bacaan Lanjutan


Referensi

  1. Tromp, J. (2016). "Number of legal Go positions." — Perhitungan tepat ruang keadaan Go
  2. Allis, L.V. (1994). "Searching for Solutions in Games and Artificial Intelligence." PhD thesis, University of Limburg. — Analisis teoretis kompleksitas permainan
  3. Muller, M. (2002). "Computer Go." Artificial Intelligence, 134(1-2), 145-179. — Survei penelitian awal komputer Go
  4. Silver, D., et al. (2016). "Mastering the game of Go with deep neural networks and tree search." Nature, 529, 484-489. — Makalah asli AlphaGo