跳至主要内容

AI 圍棋發展史

長期以嚟,圍棋被認為係人工智能最難攻克嘅遊戲。棋盤上 19×19 = 361 個交叉點,每一點都可能落子,變化數目超過宇宙入面嘅原子總數(約 10^170 種可能嘅棋局)。傳統嘅窮舉搜索方法喺圍棋面前完全失效。

不過,2015 年至 2017 年間,DeepMind 嘅 AlphaGo 系列程式徹底改變咗呢一切。呢場革命唔單止影響咗圍棋,更加推動咗成個人工智能領域嘅發展。

點解圍棋咁難?

龐大嘅搜索空間

以國際象棋為例,平均每一步有約 35 種合法著法,一局棋約 80 步。而圍棋平均每步有約 250 種合法著法,一局棋約 150 步。呢個意味住圍棋嘅搜索空間比國際象棋大咗幾百個數量級。

難以評估嘅局面

國際象棋嘅每隻棋子都有明確嘅價值(皇后 9 分、車 5 分等),可以用簡單嘅公式評估局面。但係喺圍棋入面,一粒棋子嘅價值取決於佢同周圍棋子嘅關係,冇簡單嘅評估方法。

一塊棋係死係活?一片勢力值幾多目?呢啲問題就算對人類專家嚟講,都經常需要深入嘅計算同判斷。

早期圍棋程式嘅困境

喺 AlphaGo 之前,最強嘅圍棋程式淨係得業餘 5-6 段嘅水平,同職業棋手相差甚遠。呢啲程式主要使用「蒙特卡羅樹搜索」(MCTS)方法,通過大量隨機模擬嚟評估局面。

但呢種方法有明顯嘅局限性:隨機模擬冇辦法捕捉圍棋入面嘅策略性思維,程式經常會犯人類睇嚟非常愚蠢嘅錯誤。

AI 圍棋嘅兩個時代

AlphaGo 時代(2015-2017)

呢個時代始於 AlphaGo 擊敗樊麾,終於 AlphaZero 論文嘅發表。DeepMind 喺短短兩年之內,實現咗由擊敗職業棋手到超越人類極限嘅飛躍。

關鍵里程碑:

  • 2015.10:擊敗樊麾(首次擊敗職業棋手)
  • 2016.03:擊敗李世乭(4:1)
  • 2017.01:Master 線上 60 連勝
  • 2017.05:擊敗柯潔(3:0)
  • 2017.10:AlphaZero 發表

KataGo 時代(2019-現在)

AlphaGo 退役之後,開源社群接過咗火炬。KataGo、Leela Zero 等開源 AI 等每個人都可以使用頂級圍棋引擎,徹底改變咗圍棋嘅學習同訓練方式。

呢個時代嘅特點:

  • AI 工具嘅民主化
  • 職業棋手廣泛使用 AI 訓練
  • 人類棋風嘅 AI 化
  • 圍棋整體水平嘅提升

AI 帶嚟嘅認知衝擊

「正確下法」嘅重新定義

AI 出現之前,人類經過幾千年積累,建立咗一套被認為係「正確」嘅圍棋理論。不過,AI 嘅好多下法同人類嘅傳統認知相悖:

  • 點三三:傳統觀念認為開局直接點三三係「俗手」,AI 卻經常咁落
  • 肩衝:以前被認為係「惡手」嘅肩衝,喺某啲局面下被 AI 證明係最佳選擇
  • 貼身攻擊:AI 鍾意近身纏鬥,同人類傳統嘅「攻擊由遠處開始」理念唔同

人類嘅局限同潛能

AI 嘅出現等人類認識到自己嘅局限性,但同時都展現咗人類嘅潛能。

喺 AI 嘅幫助下,年輕棋手嘅成長速度大大加快。以前需要十年先可以達到嘅水平,而家可能淨係需要三到五年。成個圍棋嘅水平都喺度提升。

圍棋嘅未來

有啲人擔心 AI 會等圍棋失去意義——既然永遠贏唔到 AI,點解仲要落棋?

但事實證明,呢種擔心係多餘嘅。AI 冇終結圍棋,而係開啟咗圍棋嘅新紀元。人類同人類之間嘅對弈,依然充滿住創造力、情感同不可預測性——呢啲正正係等圍棋有趣嘅本質。


接住落嚟,等我哋詳細了解呢兩個時代嘅具體發展。