Lewati ke konten utama

Era AlphaGo (2015-2017)

Tahun 2015 hingga 2017, seri program AlphaGo dari Google DeepMind menciptakan salah satu terobosan paling ikonik dalam sejarah kecerdasan buatan. Dalam waktu singkat dua tahun, Go berubah dari "permainan yang tidak bisa ditaklukkan kecerdasan buatan" menjadi "bidang di mana AI sepenuhnya melampaui manusia".

Oktober 2015: AlphaGo Mengalahkan Fan Hui

Pertandingan Rahasia Bersejarah

Oktober 2015, di sebuah kantor di London, DeepMind mengatur pertandingan rahasia. Lawannya adalah juara Go Eropa, pemain profesional 2-dan Fan Hui.

Hasil pertandingan: AlphaGo menang telak 5:0.

Ini adalah pertama kalinya dalam sejarah ada program komputer yang mengalahkan pemain Go profesional dalam kondisi adil (tanpa batu handicap). Berita ini resmi diumumkan pada Januari 2016, segera menghebohkan dunia.

Teknologi AlphaGo Generasi Pertama

Versi AlphaGo ini menggunakan kombinasi dua teknologi kunci:

  1. Deep Neural Network: Melalui pembelajaran ratusan ribu permainan profesional manusia, melatih "value network" yang dapat mengevaluasi posisi dan "policy network" yang dapat memprediksi langkah berikutnya

  2. Monte Carlo Tree Search (MCTS): Menggunakan output neural network untuk memandu pencarian, sangat mengurangi jumlah variasi yang perlu dihitung

Kombinasi "intuisi" dan "perhitungan" inilah cara pemain manusia berpikir - hanya saja AI melakukan keduanya dengan lebih baik.

Maret 2016: AlphaGo vs Lee Sedol

Pertarungan Abad Ini

9-15 Maret 2016, AlphaGo bertanding lima permainan dengan pemain top dunia Lee Sedol di Seoul. Pertandingan ini menarik lebih dari 200 juta penonton global, menjadi salah satu acara paling diperhatikan dalam sejarah kecerdasan buatan.

Hasil Pertandingan

PermainanTanggalHasilCatatan
Permainan 19 MaretAlphaGo menangMenang tengah permainan
Permainan 210 MaretAlphaGo menangMenang tengah permainan, muncul "Langkah 37" yang terkenal
Permainan 312 MaretAlphaGo menangMenang tengah permainan
Permainan 413 MaretLee Sedol menang"Langkah Tuhan" Lee Sedol di langkah 78
Permainan 515 MaretAlphaGo menangMenang tengah permainan

Skor akhir: AlphaGo 4:1 Lee Sedol

Langkah 37 Permainan 2: "Langkah Tuhan"

Di permainan kedua, AlphaGo memainkan "bahu tekan" di sisi kanan yang membuat semua pemain yang menonton kebingungan.

Langkah ini terlihat sama sekali tidak masuk akal, tidak sesuai dengan joseki apapun yang diketahui manusia. Komentator memperkirakan kemungkinan manusia memainkan langkah ini kurang dari satu dalam sepuluh ribu. Namun, seiring permainan berlanjut, makna mendalam langkah ini secara bertahap terungkap - ia secara bersamaan memberikan pengaruh ke berbagai arah, efisiensinya sangat tinggi.

Langkah ini dijuluki "Langkah Tuhan", melambangkan bahwa AI telah mengembangkan konsep Go yang tidak dapat dipahami manusia.

Langkah 78 Permainan 4: Serangan Balik Manusia

Setelah kalah tiga permainan berturut-turut, Lee Sedol di permainan keempat memainkan langkah yang sama mengejutkan - langkah 78 "memasukkan".

Langkah ini adalah tesuji yang cerdik, dalam pertempuran rumit menciptakan variasi yang tidak dapat diprediksi AlphaGo. AlphaGo setelah langkah ini menunjukkan kebingungan yang jelas, akhirnya menyerah.

Ini adalah satu-satunya kali manusia mengalahkan AlphaGo dalam pertandingan resmi, langkah Lee Sedol ini selamanya dikenang sebagai simbol kecerdasan manusia.

Dampak Pertandingan

Dampak pertandingan ini jauh melampaui dunia Go:

  • Tonggak kecerdasan buatan: Membuktikan deep learning dapat menangani masalah yang sangat kompleks
  • Perhatian seluruh rakyat Korea: Menurut statistik, lebih dari setengah populasi Korea menonton pertandingan
  • Era baru Go: Pemain profesional mulai menyadari harus belajar dari AI
  • Ledakan investasi teknologi: Mendorong investasi global dalam penelitian AI

Januari 2017: Master 60 Kemenangan Berturut-turut

Pemain Online Misterius

Akhir 2016 hingga awal 2017, sebuah akun bernama "Master" muncul di situs Go online seperti Yike dan Yehu. Ia mengalahkan semua penantang dengan kecepatan sangat cepat, termasuk pemain top dunia seperti Ke Jie, Park Junghwan, Iyama Yuta.

Rekor akhir: 60 pertandingan 60 kemenangan (termasuk satu permainan seri karena lawan terputus)

Setelah permainan ke-60 selesai, DeepMind resmi mengumumkan: Master adalah versi baru AlphaGo.

Konsep Baru yang Ditunjukkan Master

Gaya bermain Master jelas berbeda dari versi yang mengalahkan Lee Sedol setahun sebelumnya:

  • Kecepatan perhitungan lebih cepat: Setiap langkah hanya butuh puluhan detik
  • Cara bermain lebih agresif: Sering menggunakan cara bermain yang teori tradisional anggap "tidak bagus"
  • Bermain san-san menjadi arus utama: Master sering bermain san-san langsung di pembukaan

Cara bermain ini secara total menumbangkan teori Go yang diakumulasi manusia selama ratusan tahun, pemain profesional mulai banyak meniru cara bermain AI.

Mei 2017: AlphaGo vs Ke Jie

Tantangan Terakhir Manusia

Mei 2017, di Wuzhen, Tiongkok, AlphaGo bertanding tiga permainan dengan Ke Jie yang saat itu menduduki peringkat satu dunia. Ini dipandang sebagai "tantangan terakhir manusia".

Hasil Pertandingan

PermainanTanggalHasilCatatan
Permainan 123 MeiAlphaGo menangMenang 1/4 zi (selisih terkecil)
Permainan 225 MeiAlphaGo menangMenang tengah permainan
Permainan 327 MeiAlphaGo menangMenang tengah permainan

Skor akhir: AlphaGo 3:0 Ke Jie

Air Mata Ke Jie

Di tengah permainan kedua, Ke Jie pernah meninggalkan tempat duduk, saat kembali matanya memerah. Setelah pertandingan dia berkata:

"Dia terlalu sempurna, saya tidak melihat harapan kemenangan apapun."

"Bermain dengan AlphaGo, saya merasakan kecintaannya pada Go."

Setelah pertandingan ini selesai, DeepMind mengumumkan AlphaGo pensiun, tidak lagi berpartisipasi dalam pertandingan terbuka.

Oktober 2017: Makalah AlphaZero

Melampaui dari Nol

Oktober 2017, DeepMind mempublikasikan makalah AlphaZero, menunjukkan pencapaian yang lebih menakjubkan.

Terobosan AlphaZero adalah: sama sekali tidak memerlukan catatan permainan manusia.

Program hanya diberitahu aturan Go, kemudian belajar melalui bermain sendiri. Dari "nol", AlphaZero hanya dengan 40 hari pelatihan diri, melampaui semua versi AlphaGo sebelumnya.

Kecerdasan Universal

Yang lebih mengejutkan, program AlphaZero yang sama (hanya mengubah aturan permainan) dalam tiga permainan Go, catur internasional, dan shogi Jepang, semuanya mencapai level yang melampaui semua manusia dan program terkuat sebelumnya.

Ini membuktikan universalitas deep reinforcement learning - algoritma yang sama dapat menguasai permainan kecerdasan yang sama sekali berbeda.

Analisis Teknis

Deep Neural Network

Neural network yang digunakan AlphaGo memiliki dua bagian utama:

Policy Network

  • Input: Posisi papan saat ini
  • Output: Probabilitas bermain di setiap posisi
  • Fungsi: Mensimulasikan "intuisi" manusia, dengan cepat mempersempit ruang pencarian

Value Network

  • Input: Posisi papan saat ini
  • Output: Perkiraan tingkat kemenangan posisi saat ini
  • Fungsi: Mengevaluasi baik-buruk posisi, menggantikan pencarian brute-force tradisional

Monte Carlo Tree Search (MCTS)

MCTS adalah algoritma pencarian, bekerja melalui langkah-langkah berikut:

  1. Selection: Dari root node, pilih child node berdasarkan strategi tertentu
  2. Expansion: Tambah child node baru di leaf node
  3. Simulation: Dari node baru, lakukan simulasi acak sampai permainan selesai
  4. Backpropagation: Kirim hasil simulasi ke atas, perbarui data statistik semua node di jalur

Inovasi AlphaGo adalah menggunakan neural network menggantikan simulasi acak, sangat meningkatkan efisiensi pencarian.

Reinforcement Learning

Dari AlphaGo Lee ke AlphaZero, reinforcement learning memainkan peran yang semakin penting:

  • AlphaGo Fan (mengalahkan Fan Hui): Terutama bergantung pada pelatihan catatan permainan manusia
  • AlphaGo Lee (mengalahkan Lee Sedol): Catatan permainan manusia + bermain sendiri
  • AlphaGo Master (60 kemenangan berturut-turut): Pelatihan bermain sendiri yang ditingkatkan
  • AlphaZero: Sepenuhnya bermain sendiri, tidak memerlukan catatan permainan manusia

Proses evolusi ini menunjukkan, AI akhirnya dapat sepenuhnya bergantung pada pembelajaran diri untuk mencapai level super manusia.


Era AlphaGo berakhir pada tahun 2017, tetapi teknologi dan konsep yang dibukanya terus mempengaruhi bidang Go dan kecerdasan buatan. Era KataGo selanjutnya membuat teknologi ini masuk ke komputer dan ponsel setiap penggemar Go.

Selanjutnya: Era KataGo