Mengapa Go Sulit?
Sebelum AlphaGo muncul, Go dianggap sebagai "benteng terakhir" kecerdasan buatan. Selama puluhan tahun, para peneliti mencoba berbagai metode, tetapi tidak pernah bisa membuat komputer mencapai level pemain profesional.
Ini bukan karena para peneliti tidak cukup berusaha, tetapi karena Go pada dasarnya adalah masalah komputasi yang sangat sulit.
Artikel ini akan mengeksplorasi secara mendalam: Apa yang membuat Go begitu sulit? Mengapa ia disebut "Cawan Suci AI"?
Ledakan Ruang Keadaan: Makna 10^170
Apa Itu Ruang Keadaan?
Dalam permainan papan apa pun, ruang keadaan (State Space) mengacu pada jumlah total semua posisi papan yang mungkin. Angka ini menentukan kelayakan pencarian brute force.
Untuk Go, angka ini adalah:
Ruang keadaan Go ≈ 10^170
Apa artinya ini? Mari kita buat beberapa perbandingan.
Perbandingan dengan Jumlah Atom di Alam Semesta
Menurut perkiraan fisikawan, jumlah total atom di alam semesta yang dapat diamati adalah sekitar:
Jumlah atom alam semesta ≈ 10^80
Ini berarti:
Jumlah posisi Go yang mungkin adalah 10^90 kali jumlah atom di alam semesta.
Jika Anda menjadikan setiap atom di alam semesta sebagai superkomputer, dan setiap komputer dapat memproses 1 miliar posisi per detik, dari Big Bang hingga sekarang (sekitar 13,8 miliar tahun) tidak mungkin untuk menghitung semua posisi.
Pemahaman Intuitif Angka-angka
| Angka | Makna |
|---|---|
| 10^9 | Satu miliar, skala populasi total manusia |
| 10^12 | Satu triliun, jumlah semut di seluruh dunia |
| 10^23 | Jumlah molekul dalam satu mol |
| 10^80 | Jumlah atom di alam semesta |
| 10^120 | Ruang keadaan catur |
| 10^170 | Ruang keadaan Go |
Mengapa Ruang Keadaan Go Begitu Besar?
Ada beberapa alasan mengapa ruang keadaan Go sangat besar:
1. Ukuran Papan
Go menggunakan papan 19×19, dengan total 361 titik persimpangan. Sebagai perbandingan:
- Catur: 8×8 = 64 kotak
- Catur Tiongkok: 9×10 = 90 titik persimpangan
- Gomoku: 15×15 = 225 titik persimpangan
2. Tiga Keadaan per Titik
Setiap titik persimpangan dapat berupa:
- Kosong (tidak ada batu)
- Batu hitam
- Batu putih
Perkiraan kasar, jumlah kombinasi yang mungkin adalah 3^361 ≈ 10^172. Dengan mempertimbangkan aturan Go (seperti ko, batasan kebebasan), posisi legal yang sebenarnya sekitar 10^170.
3. Batu Tidak Bergerak
Tidak seperti catur, batu Go setelah diletakkan tidak akan bergerak (kecuali ditangkap). Ini berarti setiap langkah menambah batu baru, bukan memindahkan batu yang ada, menghasilkan lebih banyak jalur yang mungkin.
Ilustrasi Kode: Estimasi Ruang Keadaan
import math
# Ukuran papan
BOARD_SIZE = 19
TOTAL_POINTS = BOARD_SIZE ** 2 # 361
# Tiga keadaan per titik (kosong, hitam, putih)
# Batas atas kasar
upper_bound = 3 ** TOTAL_POINTS
print(f"Batas atas kasar: 3^{TOTAL_POINTS} ≈ 10^{math.log10(upper_bound):.0f}")
# Output: Batas atas kasar: 3^361 ≈ 10^172
# Estimasi aktual setelah mempertimbangkan batasan aturan
# Perhitungan tepat Tromp-Taylor memberikan sekitar 2.08 × 10^170
actual_estimate = 2.08e170
print(f"Estimasi aktual: {actual_estimate:.2e}")
# Perbandingan dengan jumlah atom alam semesta
universe_atoms = 1e80
ratio = actual_estimate / universe_atoms
print(f"Posisi Go / Atom alam semesta = 10^{math.log10(ratio):.0f}")
# Output: Posisi Go / Atom alam semesta = 10^90
Kutukan Faktor Percabangan: Rata-rata 250 Pilihan
Apa Itu Faktor Percabangan?
Faktor percabangan (Branching Factor) mengacu pada berapa banyak langkah legal rata-rata yang tersedia pada setiap langkah dalam permainan. Angka ini menentukan lebar pohon pencarian.
| Permainan | Faktor Percabangan Rata-rata |
|---|---|
| Tic-tac-toe | ~4 |
| Catur | ~35 |
| Catur Tiongkok | ~38 |
| Reversi | ~10 |
| Go | ~250 |
Pertumbuhan Eksplosif Pohon Pencarian
Misalkan kita ingin menggunakan algoritma pencarian pohon untuk melihat N langkah ke depan. Jumlah posisi yang perlu dipertimbangkan kira-kira:
Di mana b adalah faktor percabangan.
Mari bandingkan catur dan Go:
| Melihat N langkah | Catur (b=35) | Go (b=250) | Perbedaan |
|---|---|---|---|
| 1 langkah | 35 | 250 | 7× |
| 2 langkah | 1,225 | 62,500 | 51× |
| 4 langkah | 1.5 juta | 3.9 miliar | 2,600× |
| 6 langkah | 1.8 miliar | 2.4×10^14 | 130 juta× |
| 10 langkah | 2.8×10^15 | 9.5×10^23 | 340 juta× |
Melihat 10 langkah ke depan, Go membutuhkan pertimbangan 340 juta kali lebih banyak posisi daripada catur.
Mengapa Metode Deep Blue Gagal di Go
Deep Blue yang mengalahkan Kasparov pada tahun 1997 menggunakan teknologi inti:
- Alpha-Beta pruning: Mengurangi node pencarian
- Akselerasi hardware: Mengevaluasi 200 juta posisi per detik
- Fungsi evaluasi manual: Evaluasi posisi yang dirancang ahli
Tetapi bahkan dengan metode yang sama:
- Catur: Melihat 12-14 langkah memerlukan evaluasi sekitar 10^18 node
- Go: Melihat 12 langkah memerlukan evaluasi sekitar 10^29 node
Perbedaannya adalah 10 miliar miliar kali. Tidak ada hardware yang bisa menjembatani perbedaan ini.
Pilihan Pembukaan Lebih Besar Lagi
Di fase pembukaan Go, faktor percabangan lebih tinggi:
- Langkah ke-1: 361 pilihan
- Langkah ke-2: 360 pilihan
- Langkah ke-3: 359 pilihan
- ...
Bahkan hanya melihat 10 langkah pertama:
Inilah mengapa "joseki pembukaan" sangat penting — pemain manusia perlu menghafal banyak variasi pembukaan karena tidak bisa menghitungnya secara real-time.
Kesulitan Evaluasi: Tidak Ada Nilai Bidak Sederhana
Keunggulan Material dalam Catur
Dalam catur, mengevaluasi posisi relatif intuitif:
| Bidak | Nilai (tradisional) |
|---|---|
| Pion | 1 |
| Kuda | 3 |
| Gajah | 3 |
| Benteng | 5 |
| Ratu | 9 |
Meskipun evaluasi sebenarnya lebih kompleks (posisi, struktur, dll.), "menghitung bidak" adalah titik awal yang baik. Menangkap ratu lawan hampir pasti hal yang baik.
Go: Setiap Batu Sama Nilainya
Dalam Go, nilai intrinsik setiap batu persis sama — hanya sebuah batu.
Nilai sebuah batu sepenuhnya tergantung pada:
- Posisinya di papan
- Hubungannya dengan batu lain
- Pengaruhnya terhadap situasi keseluruhan
Ini membuat evaluasi menjadi sangat sulit.
Abstraksi Ketebalan dan Pengaruh
Go memiliki banyak konsep abstrak:
Ketebalan (Thickness)
"Tebal" mengacu pada sekelompok batu yang solid, stabil, dan berpengaruh. Tetapi "tebal" sulit dikuantifikasi:
- Berapa nilai bentuk yang tebal dalam poin?
- Kapan harus memanfaatkan ketebalan untuk menyerang?
- Kapan ketebalan menjadi "bentuk bodoh" (bentuk yang tidak efisien)?
Pemain top mungkin berkata: "Kelompok batu ini sangat tebal, mungkin bernilai sekitar 15 poin." Tetapi ini berdasarkan intuisi dari puluhan tahun pengalaman, bukan perhitungan tepat.
Pengaruh (Influence)
Pengaruh dalam Go mengacu pada potensi kontrol batu terhadap ruang di sekitarnya. Kontrol ini "virtual" — mungkin berubah menjadi wilayah, mungkin berperan dalam serangan-pertahanan, atau mungkin tidak menjadi apa-apa.
Bagaimana mengevaluasi nilai "potensial"? Ini sangat sulit untuk komputer.
Aji
"Aji" adalah salah satu konsep paling abstrak dalam Go. Ini mengacu pada potensi kemungkinan di posisi tertentu di papan.
Sekelompok "batu mati" mungkin memiliki "nilai pemanfaatan" — meskipun tidak bisa diselamatkan, dapat menghasilkan gangguan dalam pertempuran masa depan. "Potensi kemungkinan" ini hampir tidak bisa diekspresikan secara numerik.
Mengapa Fungsi Evaluasi Manual Gagal
Catur komputer sebelum Deep Blue menggunakan fungsi evaluasi yang dirancang ahli manusia:
Nilai evaluasi = Skor material + Skor posisi + Keamanan raja + Struktur pion + ...
Item-item ini bisa dikuantifikasi, bobot disesuaikan, dan hasilnya cukup baik.
Tetapi bagaimana dengan Go?
Para peneliti mencoba berbagai fitur:
- Jumlah titik persimpangan yang dikontrol
- "Kebebasan" batu (jumlah kebebasan)
- Kekuatan koneksi
- Kelengkapan bentuk mata
- ...
Tetapi kombinasi fitur-fitur ini tidak pernah mencapai level amatir tingkat tinggi.
Masalah inti: Evaluasi posisi Go adalah masalah yang sangat non-linear dan global.
Nilai sebuah batu tergantung pada keadaan seluruh papan, bukan penjumlahan sederhana fitur lokal.
Kebutuhan Perencanaan Jangka Panjang: Satu Permainan 150 Langkah
Tiga Fase Utama Go
Permainan Go standar biasanya melalui tiga fase:
| Fase | Langkah (kira-kira) | Karakteristik |
|---|---|---|
| Pembukaan | 1-50 | Mengklaim wilayah, membangun kerangka, menetapkan arah global |
| Pertengahan | 50-200 | Pertempuran, serangan-pertahanan, keseimbangan lokal dan global |
| Akhir | 200-300 | Penyelesaian, perhitungan, presisi |
Rata-rata satu permainan sekitar 250-300 langkah, di mana 150 langkah pertama menentukan hasil keseluruhan.
Pembukaan: Merencanakan 30 Langkah ke Depan
Setiap langkah di fase pembukaan mempersiapkan untuk puluhan bahkan ratusan langkah ke depan.
Misalnya, pembukaan "three-star point":
. . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . .
. . . ● . . . . . ● . . . . . ● . . .
. . . . . . . . . . . . . . . . . . .
...
Tiga batu hitam ini membentuk pembukaan "tipe pengaruh", dengan maksud:
- Tidak terburu-buru mengamankan wilayah
- Menunggu Putih masuk lalu menyerang
- Mendapatkan wilayah atau pengaruh melalui serangan
- Akhirnya mencapai keunggulan di akhir permainan
"Rencana" ini memerlukan pandangan ke depan 50-100 langkah. Tidak ada algoritma pencarian yang bisa melihat sejauh itu.
Pertengahan: Keseimbangan Lokal dan Global
Pertempuran pertengahan permainan adalah bagian paling kompleks dari Go. Pemain perlu mempertimbangkan di setiap langkah:
- Perhitungan lokal: Siapa yang akan memenangkan pertempuran ini?
- Penilaian global: Apakah layak bertarung di sini?
- Pilihan urutan: Di mana bermain terlebih dahulu yang paling efisien?
- Keputusan menyerah: Kapan harus meninggalkan batu dan berpindah?
Keputusan pertengahan permainan yang khas:
"Jika saya memotong di sini, lawan akan menyerang balik, saya perlu membuat hidup satu kelompok batu, ini akan memberi lawan sente untuk mengambil titik besar... pada akhirnya saya mungkin rugi 5 poin. Tapi jika saya memperkuat dulu baru memotong, meskipun kehilangan sente, tapi..."
Pemikiran multi-level dan multi-dimensi ini memerlukan penanganan lokal dan global, jangka pendek dan jangka panjang secara bersamaan.
Akhir Permainan: Perhitungan Tepat dan Pembalikan
Fase akhir permainan tampak sederhana — hanya penyelesaian. Tetapi sebenarnya:
- "Nilai poin" setiap langkah perlu perhitungan tepat
- Perbedaan sente dan gote bisa menentukan menang-kalah
- "Ko" bisa sepenuhnya mengubah situasi
Pemain profesional di fase akhir permainan bisa mencapai presisi 0.5 poin, sementara menang-kalah satu permainan mungkin hanya berbeda 1 poin.
Mengapa Tidak Bisa Melihat Jauh adalah Fatal
Mari lakukan perhitungan sederhana:
- Satu permainan rata-rata 250 langkah
- Untuk memprediksi hasil dengan sempurna, secara teori perlu melihat semua 250 langkah
- Bahkan jika faktor percabangan turun menjadi 100 (fase akhir), ruang pencarian adalah 100^250 ≈ 10^500
Ini jauh melampaui kemampuan komputer mana pun.
Inilah mengapa AI Go harus belajar "mengevaluasi" posisi, bukan hanya mengandalkan "perhitungan".
Pentingnya Intuisi: "Langkah Ini Terasa Benar"
Cara Berpikir Pemain Manusia
Ketika menjelaskan proses berpikir mereka, pemain Go top sering menggunakan kata-kata seperti:
"Langkah ini terasa benar."
"Bentuk ini sangat nyaman."
"Kelompok batu itu aji-nya tidak bagus."
"Ada perasaan bahaya yang sulit dijelaskan di sini."
Ini bukan deskripsi puitis, tetapi proses kognitif nyata. Pemain manusia menggunakan pengenalan pola dan penilaian intuitif untuk menangani kompleksitas Go.
Pengenalan Pola: Melihat Inti dalam Satu Detik
Eksperimen menunjukkan bahwa pemain profesional dengan sekali melihat papan (kurang dari 1 detik) dapat:
- Mengidentifikasi area kunci
- Menemukan kemungkinan "langkah bagus"
- Merasakan situasi umum posisi
Kemampuan ini berasal dari akumulasi pengalaman puluhan ribu permainan, membentuk "indera Go".
Sebelum AlphaGo, kesulitan terbesar komputer Go adalah tidak bisa mereplikasi intuisi ini.
Deskripsi Matematis Intuisi
Dari perspektif machine learning, intuisi Go manusia dapat dipahami sebagai:
Otak yang terlatih dengan baik dapat langsung menghasilkan distribusi probabilitas "langkah bagus" untuk setiap posisi berdasarkan posisi papan.
Inilah yang perlu dipelajari Policy Network — dan ini memerlukan deep neural network.
Mengapa Disebut "Cawan Suci AI"
Tonggak Sejarah Permainan Papan
Dalam sejarah kecerdasan buatan, permainan papan selalu menjadi tonggak penting:
| Tahun | Peristiwa | Makna |
|---|---|---|
| 1951 | Program checkers pertama | Game AI paling awal |
| 1997 | Deep Blue mengalahkan Kasparov | Kemenangan pencarian brute force |
| 2007 | Checkers dipecahkan sepenuhnya | Batas permainan informasi sempurna |
| 2016 | AlphaGo mengalahkan Lee Sedol | Kemenangan deep learning |
Mengapa Go Istimewa
Go disebut "Cawan Suci AI" karena menggabungkan semua karakteristik yang sulit:
| Karakteristik | Go | Catur |
|---|---|---|
| Ruang keadaan | 10^170 | 10^120 |
| Faktor percabangan | ~250 | ~35 |
| Rata-rata langkah | ~250 | ~40 |
| Kesulitan evaluasi | Sangat tinggi | Sedang |
| Ketergantungan intuisi | Sangat tinggi | Tinggi |
Jika AI bisa memecahkan Go, itu berarti:
- Dapat menangani ruang pencarian yang sangat besar
- Dapat mempelajari evaluasi abstrak
- Dapat melakukan perencanaan jangka panjang
- Dapat membentuk "intuisi"
Kemampuan-kemampuan ini jauh melampaui ruang lingkup "bermain catur", merupakan karakteristik inti kecerdasan umum.
Prediksi Komunitas Akademis
Sebelum 2016, prediksi komunitas akademis tentang "kapan AI bisa mengalahkan juara Go manusia" umumnya adalah:
"Setidaknya masih membutuhkan 10-20 tahun."
— Sebagian besar peneliti AI (2015)
Prediksi ini berdasarkan kecepatan kemajuan teknologi saat itu. Program Go meningkat sekitar 1-2 dan setiap tahun, sementara perbedaan dengan profesional 9-dan adalah 18 tingkat. Dengan kecepatan ini, memang perlu 10-20 tahun.
Tidak ada yang mengantisipasi deep learning akan membawa terobosan lompatan.
Korespondensi Animasi
Konsep inti yang terlibat dalam artikel ini dan nomor animasi:
| Nomor | Konsep | Korespondensi Fisika/Matematika |
|---|---|---|
| 🎬 B2 | Ledakan ruang keadaan | Kombinatorika, pertumbuhan eksponensial |
| 🎬 B8 | Ledakan kombinatorial | Pertumbuhan faktorial, pohon pencarian |
| 🎬 A3 | Perbandingan faktor percabangan | Teori graf, struktur pohon |
| 🎬 B5 | Dilema fungsi evaluasi | Pemetaan non-linear |
Ringkasan Poin Penting
Go disebut "Cawan Suci AI" karena menggabungkan tiga masalah besar:
1. Kutukan Ruang
- 10^170 posisi yang mungkin, jauh melebihi jumlah atom alam semesta
- Faktor percabangan ~250, pertumbuhan eksplosif pohon pencarian
- Pencarian brute force secara fisik tidak mungkin
2. Kesulitan Evaluasi
- Setiap batu bernilai sama, tidak ada keunggulan material
- Konsep abstrak seperti "ketebalan" "pengaruh" "aji" sulit dikuantifikasi
- Evaluasi posisi adalah masalah yang sangat non-linear dan global
3. Tantangan Waktu
- Satu permainan ~250 langkah, memerlukan perencanaan jangka panjang
- Keputusan pembukaan mempengaruhi posisi 50-100 langkah ke depan
- Pertempuran lokal dan keseimbangan global perlu dipertimbangkan bersamaan
Kombinasi masalah-masalah inilah yang membuat metode AI tradisional (pencarian brute force + evaluasi manual) sepenuhnya gagal di Go.
Dan terobosan AlphaGo justru karena menggunakan deep neural network untuk memecahkan masalah evaluasi, Monte Carlo Tree Search untuk memecahkan masalah perencanaan, reinforcement learning untuk memecahkan masalah melampaui manusia.
Bacaan Lanjutan
- Artikel berikutnya: Batas Metode Tradisional — Dari Minimax ke MCTS, mengapa semuanya tidak cukup
- Detail teknis: Penjelasan Policy Network — Bagaimana AlphaGo belajar "intuisi"
- Kembali ke ringkasan: Analisis Lengkap AlphaGo — Navigasi seri artikel
Referensi
- Tromp, J. (2016). "Number of legal Go positions." — Perhitungan tepat ruang keadaan Go
- Allis, L.V. (1994). "Searching for Solutions in Games and Artificial Intelligence." PhD thesis, University of Limburg. — Analisis teoretis kompleksitas permainan
- Muller, M. (2002). "Computer Go." Artificial Intelligence, 134(1-2), 145-179. — Survei penelitian awal komputer Go
- Silver, D., et al. (2016). "Mastering the game of Go with deep neural networks and tree search." Nature, 529, 484-489. — Makalah asli AlphaGo