AI 圍棋發展史
長期以嚟,圍棋被認為係人工智能最難攻克嘅遊戲。棋盤上 19×19 = 361 個交叉點,每一點都可能落子,變化數目超過宇宙入面嘅原子總數(約 10^170 種可能嘅棋局)。傳統嘅窮舉搜索方法喺圍棋面前完全失效。
不過,2015 年至 2017 年間,DeepMind 嘅 AlphaGo 系列程式徹底改變咗呢一切。呢場革命唔單止影響咗圍棋,更加推動咗成個人工智能領域嘅發展。
點解圍棋咁難?
龐大嘅搜索空間
以國際象棋為例,平均每一步有約 35 種合法著法,一局棋約 80 步。而圍棋平均每步有約 250 種合法著法,一局棋約 150 步。呢個意味住圍棋嘅搜索空間比國際象棋大咗幾百個數量級。
難以評估嘅局面
國際象棋嘅每隻棋子都有明確嘅價值(皇后 9 分、車 5 分等),可以用簡單嘅公式評估局面。但係喺圍棋入面,一粒棋子嘅價值取決於佢同周圍棋子嘅關係,冇簡單嘅評估方法。
一塊棋係死係活?一片勢力值幾多目?呢啲問題就算對人類專家嚟講,都經常需要深入嘅計算同判斷。
早期圍棋程式嘅困境
喺 AlphaGo 之前,最強嘅圍棋程式淨係得業餘 5-6 段嘅水平,同職業棋手相差甚遠。呢啲程式主要使用「蒙特卡羅樹搜索」(MCTS)方法,通過大量隨機模擬嚟評估局面。
但呢種方法有明顯嘅局限性:隨機模擬冇辦法捕捉圍棋入面嘅策略性思維,程式經常會犯人類睇嚟非常愚蠢嘅錯誤。
AI 圍棋嘅兩個時代
AlphaGo 時代(2015-2017)
呢個時代始於 AlphaGo 擊敗樊麾,終於 AlphaZero 論文嘅發表。DeepMind 喺短短兩年之內,實現咗由擊敗職業棋手到超越人類極限嘅飛躍。
關鍵里程碑:
- 2015.10:擊敗樊麾(首次擊敗職業棋手)
- 2016.03:擊敗李世乭(4:1)
- 2017.01:Master 線上 60 連勝
- 2017.05:擊敗柯潔(3:0)
- 2017.10:AlphaZero 發表
KataGo 時代(2019-現在)
AlphaGo 退役之後,開源社群接過咗火炬。KataGo、Leela Zero 等開源 AI 等每個人都可以使用頂級圍棋引擎,徹底改變咗圍棋嘅學習同訓練方式。
呢個時代嘅特點:
- AI 工具嘅民主化
- 職業棋手廣泛使用 AI 訓練
- 人類棋風嘅 AI 化
- 圍棋整體水平嘅提升
AI 帶嚟嘅認知衝擊
「正確下法」嘅重新定義
AI 出現之前,人類經過幾千年積累,建立咗一套被認為係「正確」嘅圍棋理論。不過,AI 嘅好多下法同人類嘅傳統認知相悖:
- 點三三:傳統觀念認為開局直接點三三係「俗手」,AI 卻經常咁落
- 肩衝:以前被認為係「惡手」嘅肩衝,喺某啲局面下被 AI 證明係最佳選擇
- 貼身攻擊:AI 鍾意近身纏鬥,同人類傳統嘅「攻擊由遠處開始」理念唔同
人類嘅局限同潛能
AI 嘅出現等人類認識到自己嘅局限性,但同時都展現咗人類嘅潛能。
喺 AI 嘅幫助下,年輕棋手嘅成長速度大大加快。以前需要十年先可以達到嘅水平,而家可能淨係需要三到五年。成個圍棋嘅水平都喺度提升。
圍棋嘅未來
有啲人擔心 AI 會等圍棋失去意義——既然永遠贏唔到 AI,點解仲要落棋?
但事實證明,呢種擔心係多餘嘅。AI 冇終結圍棋,而係開啟咗圍棋嘅新紀元。人類同人類之間嘅對弈,依然充滿住創造力、情感同不可預測性——呢啲正正係等圍棋有趣嘅本質。
接住落嚟,等我哋詳細了解呢兩個時代嘅具體發展。
- AlphaGo 時代 - 由擊敗職業棋手到超越人類極限
- KataGo 時代 - 開源 AI 同圍棋嘅新生態