Mengapa Go Sulit?

Sebelum AlphaGo muncul, Go dianggap sebagai "benteng terakhir" kecerdasan buatan. Selama puluhan tahun, para peneliti mencoba berbagai metode, tetapi tidak pernah bisa membuat komputer mencapai level pemain profesional.

Ini bukan karena para peneliti tidak cukup berusaha, tetapi karena Go pada dasarnya adalah masalah komputasi yang sangat sulit.

Artikel ini akan mengeksplorasi secara mendalam: Apa yang membuat Go begitu sulit? Mengapa ia disebut "Cawan Suci AI"?

Ledakan Ruang Keadaan: Makna 10^170

Apa Itu Ruang Keadaan?

Dalam permainan papan apa pun, ruang keadaan (State Space) mengacu pada jumlah total semua posisi papan yang mungkin. Angka ini menentukan kelayakan pencarian brute force.

Untuk Go, angka ini adalah:

Ruang keadaan Go ≈ 10^170

Apa artinya ini? Mari kita buat beberapa perbandingan.

Perbandingan dengan Jumlah Atom di Alam Semesta

Menurut perkiraan fisikawan, jumlah total atom di alam semesta yang dapat diamati adalah sekitar:

Jumlah atom alam semesta ≈ 10^80

Ini berarti:

Jumlah posisi Go yang mungkin adalah 10^90 kali jumlah atom di alam semesta.

Jika Anda menjadikan setiap atom di alam semesta sebagai superkomputer, dan setiap komputer dapat memproses 1 miliar posisi per detik, dari Big Bang hingga sekarang (sekitar 13,8 miliar tahun) tidak mungkin untuk menghitung semua posisi.

Pemahaman Intuitif Angka-angka

Angka	Makna
10^9	Satu miliar, skala populasi total manusia
10^12	Satu triliun, jumlah semut di seluruh dunia
10^23	Jumlah molekul dalam satu mol
10^80	Jumlah atom di alam semesta
10^120	Ruang keadaan catur
10^170	Ruang keadaan Go

Mengapa Ruang Keadaan Go Begitu Besar?

Ada beberapa alasan mengapa ruang keadaan Go sangat besar:

1. Ukuran Papan

Go menggunakan papan 19×19, dengan total 361 titik persimpangan. Sebagai perbandingan:

Catur: 8×8 = 64 kotak
Catur Tiongkok: 9×10 = 90 titik persimpangan
Gomoku: 15×15 = 225 titik persimpangan

2. Tiga Keadaan per Titik

Setiap titik persimpangan dapat berupa:

Kosong (tidak ada batu)
Batu hitam
Batu putih

Perkiraan kasar, jumlah kombinasi yang mungkin adalah 3^361 ≈ 10^172. Dengan mempertimbangkan aturan Go (seperti ko, batasan kebebasan), posisi legal yang sebenarnya sekitar 10^170.

3. Batu Tidak Bergerak

Tidak seperti catur, batu Go setelah diletakkan tidak akan bergerak (kecuali ditangkap). Ini berarti setiap langkah menambah batu baru, bukan memindahkan batu yang ada, menghasilkan lebih banyak jalur yang mungkin.

Ilustrasi Kode: Estimasi Ruang Keadaan

import math

# Ukuran papan
BOARD_SIZE = 19
TOTAL_POINTS = BOARD_SIZE ** 2  # 361

# Tiga keadaan per titik (kosong, hitam, putih)
# Batas atas kasar
upper_bound = 3 ** TOTAL_POINTS
print(f"Batas atas kasar: 3^{TOTAL_POINTS} ≈ 10^{math.log10(upper_bound):.0f}")
# Output: Batas atas kasar: 3^361 ≈ 10^172

# Estimasi aktual setelah mempertimbangkan batasan aturan
# Perhitungan tepat Tromp-Taylor memberikan sekitar 2.08 × 10^170
actual_estimate = 2.08e170
print(f"Estimasi aktual: {actual_estimate:.2e}")

# Perbandingan dengan jumlah atom alam semesta
universe_atoms = 1e80
ratio = actual_estimate / universe_atoms
print(f"Posisi Go / Atom alam semesta = 10^{math.log10(ratio):.0f}")
# Output: Posisi Go / Atom alam semesta = 10^90

Kutukan Faktor Percabangan: Rata-rata 250 Pilihan

Apa Itu Faktor Percabangan?

Faktor percabangan (Branching Factor) mengacu pada berapa banyak langkah legal rata-rata yang tersedia pada setiap langkah dalam permainan. Angka ini menentukan lebar pohon pencarian.

Permainan	Faktor Percabangan Rata-rata
Tic-tac-toe	~4
Catur	~35
Catur Tiongkok	~38
Reversi	~10
Go	~250

Pertumbuhan Eksplosif Pohon Pencarian

Misalkan kita ingin menggunakan algoritma pencarian pohon untuk melihat N langkah ke depan. Jumlah posisi yang perlu dipertimbangkan kira-kira:

\text{Jumlah node} \approx b^N

Di mana b adalah faktor percabangan.

Mari bandingkan catur dan Go:

Melihat N langkah	Catur (b=35)	Go (b=250)	Perbedaan
1 langkah	35	250	7×
2 langkah	1,225	62,500	51×
4 langkah	1.5 juta	3.9 miliar	2,600×
6 langkah	1.8 miliar	2.4×10^14	130 juta×
10 langkah	2.8×10^15	9.5×10^23	340 juta×

Melihat 10 langkah ke depan, Go membutuhkan pertimbangan 340 juta kali lebih banyak posisi daripada catur.

Mengapa Metode Deep Blue Gagal di Go

Deep Blue yang mengalahkan Kasparov pada tahun 1997 menggunakan teknologi inti:

Alpha-Beta pruning: Mengurangi node pencarian
Akselerasi hardware: Mengevaluasi 200 juta posisi per detik
Fungsi evaluasi manual: Evaluasi posisi yang dirancang ahli

Tetapi bahkan dengan metode yang sama:

Catur: Melihat 12-14 langkah memerlukan evaluasi sekitar 10^18 node
Go: Melihat 12 langkah memerlukan evaluasi sekitar 10^29 node

Perbedaannya adalah 10 miliar miliar kali. Tidak ada hardware yang bisa menjembatani perbedaan ini.

Pilihan Pembukaan Lebih Besar Lagi

Di fase pembukaan Go, faktor percabangan lebih tinggi:

Langkah ke-1: 361 pilihan
Langkah ke-2: 360 pilihan
Langkah ke-3: 359 pilihan
...

Bahkan hanya melihat 10 langkah pertama:

361 \times 360 \times 359 \times ... \times 352 \approx 5.5 \times 10^{25}

Inilah mengapa "joseki pembukaan" sangat penting — pemain manusia perlu menghafal banyak variasi pembukaan karena tidak bisa menghitungnya secara real-time.

Kesulitan Evaluasi: Tidak Ada Nilai Bidak Sederhana

Keunggulan Material dalam Catur

Dalam catur, mengevaluasi posisi relatif intuitif:

Bidak	Nilai (tradisional)
Pion	1
Kuda	3
Gajah	3
Benteng	5
Ratu	9

Meskipun evaluasi sebenarnya lebih kompleks (posisi, struktur, dll.), "menghitung bidak" adalah titik awal yang baik. Menangkap ratu lawan hampir pasti hal yang baik.

Go: Setiap Batu Sama Nilainya

Dalam Go, nilai intrinsik setiap batu persis sama — hanya sebuah batu.

Nilai sebuah batu sepenuhnya tergantung pada:

Posisinya di papan
Hubungannya dengan batu lain
Pengaruhnya terhadap situasi keseluruhan

Ini membuat evaluasi menjadi sangat sulit.

Abstraksi Ketebalan dan Pengaruh

Go memiliki banyak konsep abstrak:

Ketebalan (Thickness)

"Tebal" mengacu pada sekelompok batu yang solid, stabil, dan berpengaruh. Tetapi "tebal" sulit dikuantifikasi:

Berapa nilai bentuk yang tebal dalam poin?
Kapan harus memanfaatkan ketebalan untuk menyerang?
Kapan ketebalan menjadi "bentuk bodoh" (bentuk yang tidak efisien)?

Pemain top mungkin berkata: "Kelompok batu ini sangat tebal, mungkin bernilai sekitar 15 poin." Tetapi ini berdasarkan intuisi dari puluhan tahun pengalaman, bukan perhitungan tepat.

Pengaruh (Influence)

Pengaruh dalam Go mengacu pada potensi kontrol batu terhadap ruang di sekitarnya. Kontrol ini "virtual" — mungkin berubah menjadi wilayah, mungkin berperan dalam serangan-pertahanan, atau mungkin tidak menjadi apa-apa.

Bagaimana mengevaluasi nilai "potensial"? Ini sangat sulit untuk komputer.

Aji

"Aji" adalah salah satu konsep paling abstrak dalam Go. Ini mengacu pada potensi kemungkinan di posisi tertentu di papan.

Sekelompok "batu mati" mungkin memiliki "nilai pemanfaatan" — meskipun tidak bisa diselamatkan, dapat menghasilkan gangguan dalam pertempuran masa depan. "Potensi kemungkinan" ini hampir tidak bisa diekspresikan secara numerik.

Mengapa Fungsi Evaluasi Manual Gagal

Catur komputer sebelum Deep Blue menggunakan fungsi evaluasi yang dirancang ahli manusia:

Nilai evaluasi = Skor material + Skor posisi + Keamanan raja + Struktur pion + ...

Item-item ini bisa dikuantifikasi, bobot disesuaikan, dan hasilnya cukup baik.

Tetapi bagaimana dengan Go?

Para peneliti mencoba berbagai fitur:

Jumlah titik persimpangan yang dikontrol
"Kebebasan" batu (jumlah kebebasan)
Kekuatan koneksi
Kelengkapan bentuk mata
...

Tetapi kombinasi fitur-fitur ini tidak pernah mencapai level amatir tingkat tinggi.

Masalah inti: Evaluasi posisi Go adalah masalah yang sangat non-linear dan global.

Nilai sebuah batu tergantung pada keadaan seluruh papan, bukan penjumlahan sederhana fitur lokal.

Kebutuhan Perencanaan Jangka Panjang: Satu Permainan 150 Langkah

Tiga Fase Utama Go

Permainan Go standar biasanya melalui tiga fase:

Fase	Langkah (kira-kira)	Karakteristik
Pembukaan	1-50	Mengklaim wilayah, membangun kerangka, menetapkan arah global
Pertengahan	50-200	Pertempuran, serangan-pertahanan, keseimbangan lokal dan global
Akhir	200-300	Penyelesaian, perhitungan, presisi

Rata-rata satu permainan sekitar 250-300 langkah, di mana 150 langkah pertama menentukan hasil keseluruhan.

Pembukaan: Merencanakan 30 Langkah ke Depan

Setiap langkah di fase pembukaan mempersiapkan untuk puluhan bahkan ratusan langkah ke depan.

Misalnya, pembukaan "three-star point":

. . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . .
. . . ● . . . . . ● . . . . . ● . . .
. . . . . . . . . . . . . . . . . . .
...

Tiga batu hitam ini membentuk pembukaan "tipe pengaruh", dengan maksud:

Tidak terburu-buru mengamankan wilayah
Menunggu Putih masuk lalu menyerang
Mendapatkan wilayah atau pengaruh melalui serangan
Akhirnya mencapai keunggulan di akhir permainan

"Rencana" ini memerlukan pandangan ke depan 50-100 langkah. Tidak ada algoritma pencarian yang bisa melihat sejauh itu.

Pertengahan: Keseimbangan Lokal dan Global

Pertempuran pertengahan permainan adalah bagian paling kompleks dari Go. Pemain perlu mempertimbangkan di setiap langkah:

Perhitungan lokal: Siapa yang akan memenangkan pertempuran ini?
Penilaian global: Apakah layak bertarung di sini?
Pilihan urutan: Di mana bermain terlebih dahulu yang paling efisien?
Keputusan menyerah: Kapan harus meninggalkan batu dan berpindah?

Keputusan pertengahan permainan yang khas:

"Jika saya memotong di sini, lawan akan menyerang balik, saya perlu membuat hidup satu kelompok batu, ini akan memberi lawan sente untuk mengambil titik besar... pada akhirnya saya mungkin rugi 5 poin. Tapi jika saya memperkuat dulu baru memotong, meskipun kehilangan sente, tapi..."

Pemikiran multi-level dan multi-dimensi ini memerlukan penanganan lokal dan global, jangka pendek dan jangka panjang secara bersamaan.

Akhir Permainan: Perhitungan Tepat dan Pembalikan

Fase akhir permainan tampak sederhana — hanya penyelesaian. Tetapi sebenarnya:

"Nilai poin" setiap langkah perlu perhitungan tepat
Perbedaan sente dan gote bisa menentukan menang-kalah
"Ko" bisa sepenuhnya mengubah situasi

Pemain profesional di fase akhir permainan bisa mencapai presisi 0.5 poin, sementara menang-kalah satu permainan mungkin hanya berbeda 1 poin.

Mengapa Tidak Bisa Melihat Jauh adalah Fatal

Mari lakukan perhitungan sederhana:

Satu permainan rata-rata 250 langkah
Untuk memprediksi hasil dengan sempurna, secara teori perlu melihat semua 250 langkah
Bahkan jika faktor percabangan turun menjadi 100 (fase akhir), ruang pencarian adalah 100^250 ≈ 10^500

Ini jauh melampaui kemampuan komputer mana pun.

Inilah mengapa AI Go harus belajar "mengevaluasi" posisi, bukan hanya mengandalkan "perhitungan".

Pentingnya Intuisi: "Langkah Ini Terasa Benar"

Cara Berpikir Pemain Manusia

Ketika menjelaskan proses berpikir mereka, pemain Go top sering menggunakan kata-kata seperti:

"Langkah ini terasa benar."

"Bentuk ini sangat nyaman."

"Kelompok batu itu aji-nya tidak bagus."

"Ada perasaan bahaya yang sulit dijelaskan di sini."

Ini bukan deskripsi puitis, tetapi proses kognitif nyata. Pemain manusia menggunakan pengenalan pola dan penilaian intuitif untuk menangani kompleksitas Go.

Pengenalan Pola: Melihat Inti dalam Satu Detik

Eksperimen menunjukkan bahwa pemain profesional dengan sekali melihat papan (kurang dari 1 detik) dapat:

Mengidentifikasi area kunci
Menemukan kemungkinan "langkah bagus"
Merasakan situasi umum posisi

Kemampuan ini berasal dari akumulasi pengalaman puluhan ribu permainan, membentuk "indera Go".

Sebelum AlphaGo, kesulitan terbesar komputer Go adalah tidak bisa mereplikasi intuisi ini.

Deskripsi Matematis Intuisi

Dari perspektif machine learning, intuisi Go manusia dapat dipahami sebagai:

P(\text{langkah bagus} | \text{posisi papan})

Otak yang terlatih dengan baik dapat langsung menghasilkan distribusi probabilitas "langkah bagus" untuk setiap posisi berdasarkan posisi papan.

Inilah yang perlu dipelajari Policy Network — dan ini memerlukan deep neural network.

Mengapa Disebut "Cawan Suci AI"

Tonggak Sejarah Permainan Papan

Dalam sejarah kecerdasan buatan, permainan papan selalu menjadi tonggak penting:

Tahun	Peristiwa	Makna
1951	Program checkers pertama	Game AI paling awal
1997	Deep Blue mengalahkan Kasparov	Kemenangan pencarian brute force
2007	Checkers dipecahkan sepenuhnya	Batas permainan informasi sempurna
2016	AlphaGo mengalahkan Lee Sedol	Kemenangan deep learning

Mengapa Go Istimewa

Go disebut "Cawan Suci AI" karena menggabungkan semua karakteristik yang sulit:

Karakteristik	Go	Catur
Ruang keadaan	10^170	10^120
Faktor percabangan	~250	~35
Rata-rata langkah	~250	~40
Kesulitan evaluasi	Sangat tinggi	Sedang
Ketergantungan intuisi	Sangat tinggi	Tinggi

Jika AI bisa memecahkan Go, itu berarti:

Dapat menangani ruang pencarian yang sangat besar
Dapat mempelajari evaluasi abstrak
Dapat melakukan perencanaan jangka panjang
Dapat membentuk "intuisi"

Kemampuan-kemampuan ini jauh melampaui ruang lingkup "bermain catur", merupakan karakteristik inti kecerdasan umum.

Prediksi Komunitas Akademis

Sebelum 2016, prediksi komunitas akademis tentang "kapan AI bisa mengalahkan juara Go manusia" umumnya adalah:

"Setidaknya masih membutuhkan 10-20 tahun."

— Sebagian besar peneliti AI (2015)

Prediksi ini berdasarkan kecepatan kemajuan teknologi saat itu. Program Go meningkat sekitar 1-2 dan setiap tahun, sementara perbedaan dengan profesional 9-dan adalah 18 tingkat. Dengan kecepatan ini, memang perlu 10-20 tahun.

Tidak ada yang mengantisipasi deep learning akan membawa terobosan lompatan.

Korespondensi Animasi

Konsep inti yang terlibat dalam artikel ini dan nomor animasi:

Nomor	Konsep	Korespondensi Fisika/Matematika
🎬 B2	Ledakan ruang keadaan	Kombinatorika, pertumbuhan eksponensial
🎬 B8	Ledakan kombinatorial	Pertumbuhan faktorial, pohon pencarian
🎬 A3	Perbandingan faktor percabangan	Teori graf, struktur pohon
🎬 B5	Dilema fungsi evaluasi	Pemetaan non-linear

Ringkasan Poin Penting

Go disebut "Cawan Suci AI" karena menggabungkan tiga masalah besar:

1. Kutukan Ruang

10^170 posisi yang mungkin, jauh melebihi jumlah atom alam semesta
Faktor percabangan ~250, pertumbuhan eksplosif pohon pencarian
Pencarian brute force secara fisik tidak mungkin

2. Kesulitan Evaluasi

Setiap batu bernilai sama, tidak ada keunggulan material
Konsep abstrak seperti "ketebalan" "pengaruh" "aji" sulit dikuantifikasi
Evaluasi posisi adalah masalah yang sangat non-linear dan global

3. Tantangan Waktu

Satu permainan ~250 langkah, memerlukan perencanaan jangka panjang
Keputusan pembukaan mempengaruhi posisi 50-100 langkah ke depan
Pertempuran lokal dan keseimbangan global perlu dipertimbangkan bersamaan

Kombinasi masalah-masalah inilah yang membuat metode AI tradisional (pencarian brute force + evaluasi manual) sepenuhnya gagal di Go.

Dan terobosan AlphaGo justru karena menggunakan deep neural network untuk memecahkan masalah evaluasi, Monte Carlo Tree Search untuk memecahkan masalah perencanaan, reinforcement learning untuk memecahkan masalah melampaui manusia.

Bacaan Lanjutan

Artikel berikutnya: Batas Metode Tradisional — Dari Minimax ke MCTS, mengapa semuanya tidak cukup
Detail teknis: Penjelasan Policy Network — Bagaimana AlphaGo belajar "intuisi"
Kembali ke ringkasan: Analisis Lengkap AlphaGo — Navigasi seri artikel

Referensi

Tromp, J. (2016). "Number of legal Go positions." — Perhitungan tepat ruang keadaan Go
Allis, L.V. (1994). "Searching for Solutions in Games and Artificial Intelligence." PhD thesis, University of Limburg. — Analisis teoretis kompleksitas permainan
Muller, M. (2002). "Computer Go." Artificial Intelligence, 134(1-2), 145-179. — Survei penelitian awal komputer Go
Silver, D., et al. (2016). "Mastering the game of Go with deep neural networks and tree search." Nature, 529, 484-489. — Makalah asli AlphaGo

Ledakan Ruang Keadaan: Makna 10^170​

Apa Itu Ruang Keadaan?​

Perbandingan dengan Jumlah Atom di Alam Semesta​

Pemahaman Intuitif Angka-angka​

Mengapa Ruang Keadaan Go Begitu Besar?​

1. Ukuran Papan​

2. Tiga Keadaan per Titik​

3. Batu Tidak Bergerak​

Ilustrasi Kode: Estimasi Ruang Keadaan​

Kutukan Faktor Percabangan: Rata-rata 250 Pilihan​

Apa Itu Faktor Percabangan?​

Pertumbuhan Eksplosif Pohon Pencarian​

Mengapa Metode Deep Blue Gagal di Go​

Pilihan Pembukaan Lebih Besar Lagi​

Kesulitan Evaluasi: Tidak Ada Nilai Bidak Sederhana​

Keunggulan Material dalam Catur​

Go: Setiap Batu Sama Nilainya​

Abstraksi Ketebalan dan Pengaruh​

Ketebalan (Thickness)​

Pengaruh (Influence)​

Aji​

Mengapa Fungsi Evaluasi Manual Gagal​

Kebutuhan Perencanaan Jangka Panjang: Satu Permainan 150 Langkah​

Tiga Fase Utama Go​

Pembukaan: Merencanakan 30 Langkah ke Depan​

Pertengahan: Keseimbangan Lokal dan Global​

Akhir Permainan: Perhitungan Tepat dan Pembalikan​

Mengapa Tidak Bisa Melihat Jauh adalah Fatal​

Pentingnya Intuisi: "Langkah Ini Terasa Benar"​

Cara Berpikir Pemain Manusia​

Pengenalan Pola: Melihat Inti dalam Satu Detik​

Deskripsi Matematis Intuisi​

Mengapa Disebut "Cawan Suci AI"​

Tonggak Sejarah Permainan Papan​

Mengapa Go Istimewa​

Prediksi Komunitas Akademis​

Korespondensi Animasi​

Ringkasan Poin Penting​

1. Kutukan Ruang​

2. Kesulitan Evaluasi​

3. Tantangan Waktu​

Bacaan Lanjutan​

Referensi​