본문으로 건너뛰기

주요 대국 리뷰

AlphaGo의 역사는 세계를 놀라게 한 대국들로 쓰여졌습니다. 2015년 10월 런던에서의 비밀 대국부터 2017년 5월 우전에서의 고별 무대까지, 모든 대국이 인류의 바둑과 인공지능에 대한 인식을 새롭게 썼습니다.

본 글에서는 이러한 주요 대국들의 배경, 과정 및 의미를 완벽하게 리뷰합니다.


판후이 대국(2015.10): 비밀리에 진행된 5:0

배경: 왜 판후이였는가?

AlphaGo가 세계 정상급 기사에게 도전하기 전에, DeepMind는 "테스트 무대"가 필요했습니다. AlphaGo의 실제 실력을 검증할 프로 기사가 필요했지만, 이 기사는 몇 가지 조건을 충족해야 했습니다:

  1. 진정한 프로 수준: 아마추어 기사로는 AI 실력을 정확히 테스트할 수 없음
  2. 비밀 유지 의지: 논문 발표 전까지 소식을 누설하지 않아야 함
  3. 지리적 편의성: 여러 차례 공식 대국을 진행하기 편리해야 함
  4. 열린 마음: AI 상대를 진지하게 대할 의지가 있어야 함

**판후이(樊麾)**는 이러한 조건을 완벽하게 충족했습니다. 중국 시안 출신의 프로 기사로, 1996년 입단하여 2000년 이단으로 승단했고, 이후 프랑스로 이주하여 유럽 바둑 챔피언이 되었습니다. 그는 당시 유럽에서 가장 강한 프로 기사였으며, 동시에 인공지능에 대해 열린 태도를 가지고 있었습니다.

대국 준비

2015년 10월, 판후이는 런던 DeepMind 본사로 초청받았습니다. 비밀유지 계약서에 서명한 후, 그는 AlphaGo와 5국의 공식 대국을 진행했습니다.

대국 조건:

  • 제한 시간: 각 1시간, 초당 30초 초읽기
  • 규칙: 중국 규칙, 덤 7.5점
  • 환경: DeepMind 사무실, Aja Huang이 대리 착수

5:0의 충격

결과는 모두를 충격에 빠뜨렸습니다: AlphaGo 5:0 완승.

국수날짜결과비고
제1국10월 5일AlphaGo 불계승판후이 흑
제2국10월 6일AlphaGo 불계승판후이 백
제3국10월 7일AlphaGo 불계승판후이 흑
제4국10월 8일AlphaGo 1.5목승판후이 백
제5국10월 9일AlphaGo 불계승판후이 흑

🎬 E1: 이 5국은 Policy Network가 어떻게 탐색 방향을 안내하는지 보여줍니다

판후이는 나중에 회상했습니다:

"첫 번째 국에서 졌을 때, 내가 방심했나 싶었습니다. 두 번째 국에서 지자, 진지해지기 시작했습니다. 세 번째, 네 번째, 다섯 번째 국 모두 졌을 때, 이것이 내 문제가 아니라는 것을 알았습니다—바둑이 변한 것이었습니다."

왜 비밀로 했는가?

DeepMind가 비밀을 유지한 데는 몇 가지 이유가 있었습니다:

  1. 학술 발표: 논문은 동료 심사를 거쳐야 발표할 수 있음
  2. 검증 시간: 결과의 재현성을 확인하는 데 시간이 필요
  3. 비즈니스 전략: 최적의 시기에 소식을 발표
  4. 판후이 보호: 소식 공개 전에 그가 압박을 받지 않도록 함

이 비밀은 2016년 1월 《Nature》 논문이 발표될 때까지 꼬박 3개월간 유지되었습니다.

판후이의 변화

이 5국을 패한 후, 판후이는 좌절하지 않았습니다. 오히려 그는 AlphaGo 팀의 일원이 되어 시스템 테스트와 개선을 담당했습니다.

"나는 AI에게 패배한 것이 아닙니다. AI 발전의 일부가 된 것입니다. 이것은 영광이지 수치가 아닙니다."

이러한 열린 마음은 나중에 바둑계가 AI를 대하는 모범이 되었습니다.


이세돌 대국(2016.03): 세계를 바꾼 5국

세기의 대결 준비

2016년 1월 27일, 《Nature》 논문이 발표된 후, DeepMind는 세계 정상급 기사에게 도전하겠다고 발표했습니다. 목표 인물: 이세돌(Lee Sedol).

왜 이세돌이었는가?

  • 18개 세계 타이틀: 지난 10년간 가장 성공적인 기사 중 한 명
  • "신산(神算)"의 명성: 정밀한 계산력으로 유명
  • 전투형 스타일: 복잡하고 격렬한 대국을 선호
  • 35세 정점기: 경험과 체력의 최적 균형

🎬 E3: 이세돌의 스타일은 MCTS의 한계를 테스트하기에 적합했습니다

경기 설정

  • 장소: 한국 서울 포시즌스 호텔
  • 날짜: 2016년 3월 9-15일
  • 상금: 100만 달러(승자 독식, 또는 자선 기부)
  • 규칙: 중국 규칙, 덤 7.5점
  • 제한 시간: 각 2시간, 수당 1분 초읽기 3회

전 세계 200여 개 국가와 지역에서 생중계되었으며, 예상 시청자는 2억 명을 넘었습니다.

제1국: 충격적인 시작

2016년 3월 9일

이세돌이 흑을 잡고 선행했습니다. 포석 단계에서 양측은 평범했습니다. 그러나 중반에 접어들자, AlphaGo는 놀라운 대국관을 보여주었습니다.

102수에서 AlphaGo는 후퇴하는 듯한 수를 두어 오른쪽 실리를 내주었습니다. 프로 기사들은 모두 이해할 수 없다고 했습니다. 하지만 20수 후, 이 수의 묘미가 드러났습니다—AlphaGo는 희생한 돌로 중앙에 두터움을 구축했고, 결국 전체 판에서 우세를 차지했습니다.

결과: AlphaGo 불계승

대국 후, 이세돌은 말했습니다:

"충격받았습니다. 질 줄 몰랐고, 이렇게 완벽하게 질 줄은 더더욱 몰랐습니다."

🎬 E5: 이 대국은 Value Network의 전체 국면 평가 능력을 보여줍니다

제2국: "신의 한 수"의 탄생

2016년 3월 10일

이 대국에서 "신의 한 수"라 불리는 37수가 탄생했습니다. (다음 글 참조: "신의 한 수" 심층 분석)

AlphaGo는 우상귀에서 "오로 어깨짚기"를 두었습니다—인간이라면 거의 고려하지 않을 위치였습니다. 해설자는 즉시 "실수"라고 말했지만, 50수 후 이 수가 승부를 결정짓는 관건임이 증명되었습니다.

결과: AlphaGo 불계승

한국 해설자 김성룡 9단은 대국 후 말했습니다:

"50년간 바둑을 두었지만, 이런 바둑은 처음 봅니다. AlphaGo가 바둑이 무엇인지 다시 생각하게 만들었습니다."

🎬 E7: 37수는 AI가 어떻게 인류가 알지 못했던 전략을 발견하는지 보여줍니다

제3국: 절망적인 3:0

2016년 3월 12일

이세돌은 이 대국에서 비정규 포석을 시도하여 AlphaGo를 미지의 영역으로 끌어들이려 했습니다. 그는 "소림류" 포석의 변형을 채택하여 복잡한 전투로 승리하려 했습니다.

하지만 AlphaGo의 대응은 여전히 여유로웠습니다. 인간이 어떻게 나오든, 최선의 응수를 찾아내는 놀라운 적응력을 보여주었습니다.

결과: AlphaGo 불계승

점수가 3:0이 되면서 경기는 이미 결과가 정해졌습니다. 하지만 모두가 기대하고 있었습니다: 인류가 한 판이라도 이길 수 있을까?

제4국: 인류의 반격

2016년 3월 13일

이 대국은 영원히 역사에 남을 것입니다—AI의 신기함 때문이 아니라, 인류의 반격 때문입니다.

국면이 78수까지 진행되었을 때, 이세돌은 초읽기 중에 경세지작(驚世之作)을 두었습니다: 오로의 묘수.

이것은 "끼워넣기" 맥으로, 평범해 보이지만 AlphaGo를 혼란에 빠뜨렸습니다. 이어지는 몇 수에서 AlphaGo의 승률 평가가 급격히 흔들렸고, 몇 가지 명백한 악수를 두었습니다.

🎬 E9: 이 대국은 특정 국면에서 MCTS의 약점을 드러냈습니다

DeepMind 팀은 나중에 분석하여, AlphaGo가 그 국면에서 승률 평가에 오류가 있었다고 밝혔습니다. 이세돌의 그 수의 위력을 과소평가하여 후속 대응에 실수가 생겼습니다.

결과: 이세돌 불계승

이것은 AlphaGo 공식 경기에서의 유일한 패배입니다. 이세돌은 감격에 차서 말했습니다:

"이 승리는 값을 매길 수 없습니다. 인간 기사가 여전히 AI를 이길 수 있다는 것을 증명했습니다—적어도 특정 국면에서는요."

Google DeepMind CEO 데미스 하사비스가 트윗했습니다:

"이세돌은 진정한 레전드입니다. 그는 AlphaGo의 약점을 찾아내어 정확하게 활용했습니다."

제5국: 최종 결말

2016년 3월 15일

소중한 한 판 승리를 거둔 후, 이세돌은 더 편안한 마음으로 제5국에 임했습니다. 그는 더 공격적인 전략을 채택하여 다시 한번 AlphaGo의 약점을 찾으려 했습니다.

하지만 DeepMind 팀은 제4국 이후 긴급 조정을 진행했습니다. 이 버전의 AlphaGo는 더 견고해 보였고, 이전의 평가 오류가 더 이상 나타나지 않았습니다.

결과: AlphaGo 불계승

최종 점수: AlphaGo 4:1 이세돌

대국의 역사적 의의

이 경기의 영향은 바둑계를 훨씬 넘어섰습니다:

인공지능에 대해

  • 딥러닝의 위력 증명: AI가 복잡한 의사결정 과제에서 인간을 능가할 수 있음
  • 강화학습의 이정표: 자기대국 훈련이 효과적임이 증명됨
  • 후속 연구 촉발: AI 분야에 대한 투자 열풍을 불러일으킴

바둑계에 대해

  • 전통 이론의 도전: 많은 "정석"이 차선임이 증명됨
  • 훈련 방식의 변화: 프로 기사들이 AI 보조 훈련을 시작
  • 새로운 착법의 탄생: AI가 많은 혁신적인 수법을 도입

대중에 대해

  • AI 인식 각성: 일반인들이 인공지능에 관심을 갖기 시작
  • 과학기술 보도 증가: 주류 미디어가 AI 발전을 대대적으로 보도
  • 영화와 다큐멘터리: 《AlphaGo》 다큐멘터리 탄생

🎬 E11: 이 경기는 AI 능력의 "상전이" 순간을 표시합니다


Master 60연승(2017.01): 온라인 속기의 충격

신비로운 "Master" 계정

2016년 12월 29일, "Master"라는 계정이 중국 예성 바둑과 텐센트 야호 바둑 사이트에 나타났습니다.

이 계정의 성적은 믿기 어려웠습니다:

  • 모든 상대에게 연승: 단 한 번의 패배도 없음
  • 상대 모두 정상급 기사: 세계 챔피언과 9단 고수 포함
  • 매우 짧은 시간 사용: 거의 매 수를 초단위로 착수

곧, 바둑계 전체가 논의하고 있었습니다: "Master"는 도대체 누구인가?

60연승의 위업

12월 29일부터 2017년 1월 4일까지, "Master"는 60국의 속기를 두었고, 전부 승리했습니다.

패배한 기사 명단은 마치 세계 바둑 명예의 전당과 같았습니다:

순위기사전적
세계 1위커제(중국)0-3
세계 2위박정환(한국)0-2
세계 3위이야마 유타(일본)0-1
전설의 기사녜웨이핑(중국)0-1
전설의 기사구리(중국)0-2
.........

50명 이상의 프로 9단을 포함하여, 한중일 3국의 정상급 기사들을 망라했습니다.

🎬 E13: 속기는 Policy Network의 즉각적 의사결정 능력을 보여줍니다

정체 공개

2017년 1월 4일, 60승을 완료한 후, "Master"가 채팅방에서 정체를 밝혔습니다:

"저는 AlphaGo의 황 박사입니다."

황 박사는 바로 Aja Huang(황스제)으로, AlphaGo 팀의 핵심 멤버입니다.

DeepMind는 이후 공식 확인했습니다: "Master"는 AlphaGo의 새 버전이며, 이번 테스트의 목적은 시스템의 온라인 환경에서의 안정성을 검증하는 것이었습니다.

프로 기사들의 반응

60연승의 충격은 이세돌 대국보다 더 깊었습니다. 이번에는 상대가 더 많고 범위가 더 넓었기 때문입니다.

커제(Master에게 세 번 패배):

"인간과 AI의 격차는 우리 상상보다 더 큽니다. 우리는 항상 바둑을 이해한다고 생각했지만, Master는 우리가 입문조차 못 했다고 느끼게 합니다."

녜웨이핑(중국 기성):

"60년간 바둑을 두었지만, 처음으로 이렇게 무력함을 느꼈습니다. 이것은 기술의 격차가 아닙니다. 차원의 격차입니다."

구리(8개 세계 타이틀):

"Master에게 진 후, 인간 기사의 가치가 어디에 있는지 생각하기 시작했습니다. 우리에게 아직 프로 경기가 필요할까요?"

기술 분석

이 버전의 AlphaGo(나중에 AlphaGo Master라고 불림)는 이세돌 대국 버전에 비해 현저히 향상되었습니다:

지표Lee 버전Master 버전향상
Elo 등급~3,600~4,800+1,200
자기대국 승률-99%+-
Policy 정확도~57%~62%+5%
훈련 시간수개월추가 수개월-

🎬 E15: Elo의 향상은 자기대국의 기하급수적 진보를 보여줍니다


커제 대국(2017.05): 왕의 퇴장

마지막 도전자

Master 60연승 이후, 인간이 AlphaGo를 이길 수 있다고 믿는 사람은 거의 없었습니다. 하지만 한 사람은 여전히 대결을 갈망했습니다—커제.

당시 19세였던 커제는 세계 랭킹 1위 기사였습니다. 그는 여러 번 공개적으로 말했습니다:

"AlphaGo가 저를 이길 수 있다고 생각하지 않습니다. Master가 속기에서 저를 세 번 이겼더라도, 공식 경기는 다릅니다."

Google은 도전을 받아들였습니다.

우전 바둑 정상회담

2017년 5월, "미래 바둑 정상회담"이 중국 저장성 우전에서 개최되었습니다. 이것은 AlphaGo를 중심으로 한 성대한 행사로, 다음을 포함했습니다:

  1. 커제 3번기: 인류 최강 대 AI 최강
  2. 페어 매치: 인간 + AlphaGo vs 인간 + AlphaGo
  3. 팀전: 5명의 중국 정상급 기사가 연합하여 AlphaGo에 대항

3번기: 3:0의 결말

제1국(5월 23일)

커제가 흑을 잡고 선행하여, 포석에서 비교적 안정적인 "중국류" 포석을 채택했습니다. 이것은 심사숙고한 선택이었습니다—커제는 AlphaGo의 대국관에 압도당하지 않고, 세부에서 기회를 찾으려 했습니다.

하지만 AlphaGo의 대응은 완벽무결했습니다. 모든 핵심 순간에서 가장 정확한 착점을 찾아 점차 우세를 축적했습니다.

결과: AlphaGo 반집(0.5목) 승

이것은 바둑에서 가능한 가장 작은 승리 차이입니다. 커제는 대국 후 눈물을 흘렸습니다:

"전력을 다했지만, 여전히 조금 모자랐습니다."

🎬 E17: 반집 차이는 AI의 정밀 제어 능력을 보여줍니다

제2국(5월 25일)

커제는 전략을 바꿔 AlphaGo의 포석 방식을 모방했습니다. 그는 "삼삼 직접 진입"의 새로운 수법을 사용했습니다—이것은 바로 AlphaGo가 바둑계에 가져온 혁신이었습니다.

"당신의 착법이 더 좋다면, 당신의 착법을 배우겠습니다."

하지만 AlphaGo는 동요하지 않았습니다. 여전히 자신의 페이스대로 진행하며, 중반 전투에서 놀라운 계산 능력을 보여주었습니다.

결과: AlphaGo 불계승

제3국(5월 27일)

마지막 대국에서 커제는 모든 것을 걸었습니다. 그는 극도로 공격적인 전투 스타일을 채택하여 AlphaGo를 혼전으로 끌어들이려 했습니다.

포석 단계에서 커제는 확실히 몇 가지 복잡한 국면을 만들었습니다. 하지만 AlphaGo의 대응은 여전히 정확했고, 커제에게 어떤 역전의 기회도 주지 않았습니다.

결과: AlphaGo 불계승

최종 점수: AlphaGo 3:0 커제

🎬 E19: 3번기는 AlphaGo의 절대적 지배력을 보여줍니다

페어 매치와 팀전

커제 3번기 외에도, 정상회담에서는 두 가지 혁신적인 경기 방식이 진행되었습니다:

페어 매치(5월 26일)

롄샤오 + AlphaGo vs 구리 + AlphaGo

이 경기의 흥미로운 점은: 인간 기사와 AlphaGo의 의견이 다를 때 어떻게 되는가?

결과는 보여주었습니다: AlphaGo의 제안을 완전히 따르는 쪽이 더 나은 성적을 냈습니다. 인간 기사가 AlphaGo의 착법을 "수정"하려 할 때, 오히려 국면이 악화되는 경우가 많았습니다.

결과: 롄샤오 + AlphaGo 승

팀전(5월 26일)

중국팀(저우루이양, 스위에, 탕웨이싱, 천야오예, 미위팅) vs AlphaGo

5명의 중국 정상급 기사가 협력하여 하나의 AI에 대항했습니다. 그들은 충분히 논의하고 함께 매 수를 결정할 수 있었습니다.

하지만 결과는 긴장감이 없었습니다: AlphaGo 불계승.

이 경기는 증명했습니다: 인류 정상급 기사들이 연합해도 AlphaGo를 이길 수 없다는 것을.

AlphaGo의 은퇴 선언

2017년 5월 27일, 커제 3번기가 끝난 후, DeepMind는 중요한 성명을 발표했습니다:

"이것이 AlphaGo의 마지막 공개 대국입니다. 우리는 AlphaGo가 그 사명을 완수했다고 믿습니다—AI가 인류 지혜의 정점인 바둑 분야에서 인간을 초월하는 수준에 도달할 수 있음을 증명했습니다.

앞으로 우리는 AlphaGo에서 배운 기술을 더 중요한 문제에 적용할 것입니다: 의료, 에너지, 재료 과학. 이것이야말로 인공지능의 진정한 가치입니다."

동시에 발표했습니다:

  1. AlphaGo 교육 도구: 기사들이 학습할 수 있도록 AlphaGo의 대국 분석 공개 예정
  2. 50국 자기대국 기보: AlphaGo vs AlphaGo 기보 공개
  3. 기술 논문: 《Nature》에 AlphaGo Zero 연구 성과 발표 예정

🎬 E21: AlphaGo의 은퇴는 하나의 시대의 종말을 표시합니다


대국의 역사적 위치

기술적 이정표

AlphaGo의 대국은 인공지능 역사에서 이정표적 의의를 가집니다:

연도사건의의
1997딥 블루가 카스파로프를 이김무차별 탐색의 승리
2011Watson이 Jeopardy!에서 우승자연어 처리의 돌파구
2016AlphaGo가 이세돌을 이김딥러닝 + 강화학습의 승리
2017AlphaGo Zero 100:0순수한 자기학습의 승리

🎬 E23: 각 이정표는 AI 방법론의 진화를 대표합니다

바둑계에 대한 영향

기보 연구의 변화

전통적으로 프로 기사들은 주로 인간 기보를 연구했습니다. 하지만 AlphaGo 이후, AI 기보가 필수 과목이 되었습니다.

  • 삼삼 포석: AlphaGo가 직접 귀 진입이 효과적인 전략임을 증명
  • 어깨짚기의 묘용: 37수가 "어깨짚기" 수법에 대한 인식을 바꿈
  • 두터움의 가치: AI가 두터움 전환의 새로운 방식을 보여줌

훈련 방식의 변혁

프로 기사들의 훈련 방식이 근본적으로 변했습니다:

전통 방식AI 시대 방식
인간 기보 연구AI 기보 연구
스승의 지도에 의존AI 분석 도구 사용
정석 암기AI의 평가 논리 이해
실전 연습AI 복기 분석

신세대 기사의 부상

2016년 이후 성장한 기사들은 "AI 원주민"이라고 불립니다. 그들의 기풍은 분명히 AI의 영향을 받았습니다:

  • 전통적 미학보다 효율성 중시
  • 비전통적 착법 시도에 더 적극적
  • 직관보다 정밀한 계산에 더 의존

철학적 성찰

AlphaGo의 승리는 깊은 철학적 논의를 불러일으켰습니다:

지능의 본질은 무엇인가?

AlphaGo가 바둑을 "이해"하는가? 아니면 단지 정밀한 계산을 하는 것인가? 이 질문은 아직 정론이 없습니다.

인간의 가치는 어디에 있는가?

AI가 바둑에서 인간을 초월했을 때, 바둑 경기가 아직 의미가 있는가? 많은 기사들이 자신의 직업적 의미를 다시 생각했습니다.

흥미롭게도, AlphaGo 이후 바둑에 대한 전 세계적 관심도가 오히려 높아졌습니다. 사람들은 깨달았습니다: 바둑은 단순한 경기가 아니라 예술이자 철학이기도 하다는 것을.

AI의 발전 방향

AlphaGo의 성공은 사람들이 AI에 대해 기대와 우려를 동시에 갖게 했습니다. DeepMind가 AlphaGo를 은퇴시키고 "진정으로 중요한 문제"를 해결하는 방향으로 전환한 것 자체가 윤리적 선택입니다.

🎬 E25: AlphaGo는 AI 윤리에 관한 광범위한 논의를 불러일으켰습니다


번외: 기타 중요한 대국들

다른 AI와의 대결

공개 경기 외에도, AlphaGo는 다른 바둑 AI와 수많은 대국을 진행했습니다:

상대버전결과
Crazy Stone2015년 최강 바둑 프로그램전승
Zen일본 최강 바둑 AI전승
구버전 AlphaGo각 버전 자기대국-

내부 테스트

DeepMind 팀은 수많은 내부 테스트를 진행했습니다:

  • AlphaGo Lee vs AlphaGo Master: Master 버전 승률 99% 이상
  • AlphaGo Master vs AlphaGo Zero: Zero 버전 승률 89% 이상
  • 다른 훈련 시간의 버전 대국: 학습 곡선 관찰

이러한 테스트 데이터는 나중에 논문에서 모두 공개되어 AI 학습 연구의 중요한 자료가 되었습니다.


애니메이션 대응

본 글에서 다루는 핵심 개념과 애니메이션 번호:

번호개념물리/수학 대응
🎬 E1Policy Network 탐색 안내확률 분포
🎬 E3MCTS의 한계 테스트트리 탐색 깊이
🎬 E5Value Network 전체 평가가치 함수
🎬 E7미지의 전략 발견탐색 vs 이용
🎬 E9MCTS의 약점경계 조건
🎬 E11능력의 "상전이"임계 현상
🎬 E13즉각적 의사결정 능력추론 속도
🎬 E15자기대국의 기하급수적 진보반복 최적화
🎬 E17정밀 제어 능력수치 안정성
🎬 E19절대적 지배력최적으로의 수렴
🎬 E21시대의 종말임무 완료
🎬 E23방법론 진화패러다임 전환
🎬 E25AI 윤리 논의사회적 영향

추가 읽기


참고 자료

  1. Silver, D., et al. (2016). "Mastering the game of Go with deep neural networks and tree search." Nature, 529, 484-489.
  2. Silver, D., et al. (2017). "Mastering the game of Go without human knowledge." Nature, 550, 354-359.
  3. 《AlphaGo》 다큐멘터리 (2017), 감독 Greg Kohs.
  4. DeepMind 공식 Blog: AlphaGo 시리즈 글
  5. 이세돌 대국 공식 기보 및 해설(한국기원)
  6. 우전 바둑 정상회담 공식 기록