انتقل إلى المحتوى الرئيسي

استعراض المباريات الرئيسية

تاريخ AlphaGo مكتوب من خلال سلسلة من المباريات التي هزت العالم. من المباراة السرية في لندن في أكتوبر 2015 إلى الوداع في وو تشن في مايو 2017، أعادت كل مباراة كتابة فهم البشرية للغو والذكاء الاصطناعي.

سيستعرض هذا المقال بالكامل خلفية هذه المباريات الرئيسية وسيرها وأهميتها.


مباراة فان هوي (أكتوبر 2015): 5:0 في السر

الخلفية: لماذا اختاروا فان هوي؟

قبل أن يتحدى AlphaGo أفضل لاعبي العالم، احتاج DeepMind إلى "ساحة اختبار". كانوا بحاجة إلى لاعب محترف للتحقق من القوة الحقيقية لـ AlphaGo، لكن هذا اللاعب كان عليه أن يستوفي عدة شروط:

  1. مستوى احترافي حقيقي: اللاعبون الهواة لا يمكنهم اختبار قوة الذكاء الاصطناعي بدقة
  2. مستعد للحفاظ على السرية: لا يمكن تسريب الأخبار قبل نشر الورقة البحثية
  3. موقع جغرافي مناسب: سهولة إجراء عدة مباريات رسمية
  4. عقلية منفتحة: مستعد لأخذ خصم الذكاء الاصطناعي على محمل الجد

فان هوي كان مثالياً لهذه الشروط. هذا اللاعب المحترف المولود في شيان بالصين، حصل على رتبة دان عام 1996، وترقى إلى 2 دان عام 2000، ثم انتقل إلى فرنسا وأصبح بطل أوروبا للغو. كان أقوى لاعب محترف في أوروبا في ذلك الوقت، وكان منفتحاً على الذكاء الاصطناعي.

ترتيبات المباراة

في أكتوبر 2015، دُعي فان هوي إلى مقر DeepMind في لندن. بعد توقيع اتفاقية السرية، لعب 5 مباريات رسمية ضد AlphaGo.

شروط المباراة:

  • الوقت: ساعة واحدة لكل طرف، 30 ثانية بيوومي لكل حركة
  • القواعد: القواعد الصينية، 7.5 نقطة كومي
  • البيئة: مكتب DeepMind، آجا هوانغ يضع الأحجار نيابةً عن AlphaGo

صدمة 5:0

كانت النتيجة صادمة للجميع: فوز AlphaGo 5:0.

الجولةالتاريخالنتيجةملاحظات
المباراة 15 أكتوبرفوز AlphaGo بالاستسلامفان هوي بالأسود
المباراة 26 أكتوبرفوز AlphaGo بالاستسلامفان هوي بالأبيض
المباراة 37 أكتوبرفوز AlphaGo بالاستسلامفان هوي بالأسود
المباراة 48 أكتوبرفوز AlphaGo بـ 1.5 نقطةفان هوي بالأبيض
المباراة 59 أكتوبرفوز AlphaGo بالاستسلامفان هوي بالأسود

🎬 E1: هذه المباريات الخمس أظهرت كيف توجه شبكة السياسة اتجاه البحث

تذكر فان هوي لاحقاً:

"خسرت المباراة الأولى، واعتقدت أنني كنت غافلاً. خسرت الثانية، وبدأت أصبح جاداً. الثالثة، الرابعة، الخامسة - خسرتها كلها، وعرفت أن هذا ليس مشكلتي - الغو قد تغيرت."

لماذا السرية؟

اختار DeepMind الحفاظ على السرية لعدة أسباب:

  1. النشر الأكاديمي: الورقة البحثية تحتاج إلى مراجعة النظراء قبل النشر
  2. وقت التحقق: الحاجة إلى وقت لتأكيد قابلية تكرار النتائج
  3. الاستراتيجية التجارية: اختيار أفضل توقيت لإعلان الخبر
  4. حماية فان هوي: تجنب تعرضه للضغط قبل الإعلان

تم الحفاظ على هذا السر لمدة ثلاثة أشهر كاملة، حتى نشر ورقة Nature في يناير 2016.

تحول فان هوي

بعد خسارة هذه المباريات الخمس، لم يشعر فان هوي بالإحباط. بدلاً من ذلك، أصبح جزءاً من فريق AlphaGo، مسؤولاً عن اختبار وتحسين النظام.

"لم أُهزم من قبل الذكاء الاصطناعي، بل أصبحت جزءاً من تطوير الذكاء الاصطناعي. هذا شرف، وليس عاراً."

هذه العقلية المنفتحة أصبحت فيما بعد نموذجاً لعالم الغو في مواجهة الذكاء الاصطناعي.


مباراة لي سيدول (مارس 2016): خمس مباريات غيرت العالم

التحضير لمواجهة القرن

في 27 يناير 2016، بعد نشر ورقة Nature، أعلن DeepMind عن تحدي أفضل لاعبي العالم. الهدف: لي سيدول (Lee Sedol).

لماذا لي سيدول؟

  • 18 بطولة عالمية: أحد أنجح اللاعبين في العقد الماضي
  • لقب "الحاسب الإلهي": مشهور بحساباته الدقيقة
  • أسلوب قتالي: يحب المباريات المعقدة والحادة
  • 35 عاماً في ذروته: التوازن الأمثل بين الخبرة واللياقة

🎬 E3: أسلوب لي سيدول كان مثالياً لاختبار حدود MCTS

إعدادات المباراة

  • الموقع: فندق فور سيزونز، سيول، كوريا الجنوبية
  • التاريخ: 9-15 مارس 2016
  • الجائزة: مليون دولار أمريكي (للفائز، أو تقسم أو تُتبرع للأعمال الخيرية)
  • القواعد: القواعد الصينية، 7.5 نقطة كومي
  • الوقت: ساعتان لكل طرف، دقيقة واحدة بيوومي 3 مرات لكل حركة

تم البث المباشر في أكثر من 200 دولة ومنطقة حول العالم، مع توقع أكثر من 200 مليون مشاهد.

المباراة الأولى: بداية صادمة

9 مارس 2016

لعب لي سيدول بالأسود أولاً. في مرحلة الافتتاح، كان كلا الطرفين تقليديين. لكن في منتصف اللعبة، أظهر AlphaGo رؤية استراتيجية مذهلة.

في الحركة 102، لعب AlphaGo حركة بدت كتراجع، متخلياً عن الأراضي على اليمين. أبدى اللاعبون المحترفون حيرتهم. لكن بعد 20 حركة، ظهرت عبقرية هذه الحركة - استخدم AlphaGo الأحجار المضحاة لبناء قوة في المركز، وحقق في النهاية ميزة على كامل اللوحة.

النتيجة: فوز AlphaGo بالاستسلام

قال لي سيدول بعد المباراة:

"أنا مصدوم. لم أتوقع أن أخسر، وبالتأكيد لم أتوقع أن أخسر بهذه الطريقة الساحقة."

🎬 E5: هذه المباراة أظهرت قدرة شبكة القيمة على تقييم الوضع الكلي

المباراة الثانية: ولادة "حركة الإله"

10 مارس 2016

شهدت هذه المباراة ما أُطلق عليه "حركة الإله" - الحركة 37. (انظر المقال التالي: تحليل عميق لـ "حركة الإله")

لعب AlphaGo في الزاوية العليا اليمنى "ضربة الكتف من الصف الخامس" - موقع لن يفكر فيه البشر تقريباً. قال المعلق فوراً إنها "خطأ"، لكن بعد 50 حركة، ثبت أن هذه الحركة كانت مفتاح النصر.

النتيجة: فوز AlphaGo بالاستسلام

قال المعلق الكوري كيم سونغ-ريونغ 9 دان بعد المباراة:

"لعبت الغو لمدة 50 عاماً، ولم أرَ قط لعبة كهذه. AlphaGo جعلني أعيد التفكير في ماهية الغو."

🎬 E7: الحركة 37 أظهرت كيف يمكن للذكاء الاصطناعي اكتشاف استراتيجيات مجهولة للبشر

المباراة الثالثة: 3:0 من اليأس

12 مارس 2016

في هذه المباراة، جرب لي سيدول افتتاحية غير تقليدية، آملاً في جر AlphaGo إلى منطقة مجهولة. اعتمد تعديلاً على تشكيلة "كوباياشي"، محاولاً الفوز من خلال القتال المعقد.

لكن رد AlphaGo ظل هادئاً. أظهر قدرة تكيف مذهلة - مهما كانت حركات الإنسان، كان يجد أفضل رد.

النتيجة: فوز AlphaGo بالاستسلام

أصبحت النتيجة 3:0، ولم يعد هناك تشويق في المباراة. لكن الجميع كان ينتظر: هل يستطيع الإنسان الفوز بمباراة واحدة؟

المباراة الرابعة: انتقام الإنسان

13 مارس 2016

ستُخلد هذه المباراة في التاريخ - ليس بسبب عبقرية الذكاء الاصطناعي، بل بسبب انتقام الإنسان.

عند الحركة 78، في وقت البيوومي، لعب لي سيدول حركة مذهلة: حركة الصف الخامس البارعة.

كانت حركة "حفر" تبدو عادية، لكنها أربكت AlphaGo. في الحركات التالية، تذبذب تقييم AlphaGo لنسبة الفوز بشدة، ولعب عدة حركات سيئة واضحة.

🎬 E9: هذه المباراة كشفت نقاط ضعف MCTS في مواقف معينة

حلل فريق DeepMind لاحقاً أن تقييم AlphaGo لنسبة الفوز في ذلك الموقف كان خاطئاً. استخف بقوة حركة لي سيدول، مما أدى إلى أخطاء في الردود اللاحقة.

النتيجة: فوز لي سيدول بالاستسلام

كانت هذه الهزيمة الوحيدة لـ AlphaGo في مباراة رسمية. قال لي سيدول بحماس:

"هذا النصر لا يُقدر بثمن. يثبت أن اللاعبين البشر لا يزالون قادرين على هزيمة الذكاء الاصطناعي - على الأقل في بعض المواقف."

غرد ديميس هاسابيس، الرئيس التنفيذي لـ Google DeepMind:

"لي سيدول أسطورة حقيقية. وجد نقطة ضعف AlphaGo واستغلها بدقة."

المباراة الخامسة: النهاية

15 مارس 2016

بعد تحقيق نصر ثمين، دخل لي سيدول المباراة الخامسة بروح أكثر استرخاءً. اعتمد استراتيجية أكثر عدوانية، محاولاً إيجاد نقطة ضعف AlphaGo مرة أخرى.

لكن فريق DeepMind أجرى تعديلات طارئة بعد المباراة الرابعة. بدت هذه النسخة من AlphaGo أكثر استقراراً، ولم تظهر أخطاء التقييم السابقة.

النتيجة: فوز AlphaGo بالاستسلام

النتيجة النهائية: AlphaGo 4:1 لي سيدول

الأهمية التاريخية للمباراة

تجاوز تأثير هذه المباراة عالم الغو:

للذكاء الاصطناعي

  • إثبات قوة التعلم العميق: يمكن للذكاء الاصطناعي تجاوز البشر في مهام القرارات المعقدة
  • معلم في التعلم المعزز: ثبت أن التدريب باللعب الذاتي فعال
  • تحفيز البحث اللاحق: أثار موجة استثمار في مجال الذكاء الاصطناعي

لعالم الغو

  • تحدي النظريات التقليدية: ثبت أن العديد من "التسلسلات المعتادة" ليست مثالية
  • تغيير طرق التدريب: بدأ اللاعبون المحترفون استخدام الذكاء الاصطناعي في التدريب
  • ولادة أساليب جديدة: قدم الذكاء الاصطناعي العديد من الابتكارات

للجمهور

  • صحوة الوعي بالذكاء الاصطناعي: بدأ الناس العاديون الاهتمام بالذكاء الاصطناعي
  • زيادة التغطية الإعلامية للتكنولوجيا: تغطية واسعة من وسائل الإعلام الرئيسية
  • أفلام ووثائقيات: أدت إلى وثائقي "AlphaGo"

🎬 E11: هذه المباراة علامة على لحظة "تحول طوري" في قدرات الذكاء الاصطناعي


سلسلة انتصارات Master الـ 60 (يناير 2017): صدمة اللعب السريع عبر الإنترنت

حساب "Master" الغامض

في 29 ديسمبر 2016، ظهر حساب باسم "Master" على مواقع Yicheng Go و Tencent Wild Fox Go الصينية.

كان أداء هذا الحساب لا يُصدق:

  • فوز على جميع المنافسين: بدون هزيمة واحدة
  • جميع المنافسين من الصفوة: بما في ذلك أبطال العالم ولاعبي 9 دان
  • وقت قصير جداً: كل حركة تقريباً في ثوانٍ

سريعاً، أصبح عالم الغو بأكمله يتساءل: من هو "Master"؟

إنجاز 60 انتصاراً متتالياً

من 29 ديسمبر إلى 4 يناير 2017، لعب "Master" 60 مباراة سريعة، وفاز بها جميعاً.

قائمة اللاعبين المهزومين تشبه قاعة مشاهير الغو العالمية:

الترتيباللاعبالسجل
المركز الأول عالمياًكه جيه (الصين)0-3
المركز الثاني عالمياًبارك جونغ-هوان (كوريا الجنوبية)0-2
المركز الثالث عالمياًإيياما يوتا (اليابان)0-1
أسطورةني وي بينغ (الصين)0-1
أسطورةغو لي (الصين)0-2
.........

المجموع شمل أكثر من 50 لاعب 9 دان محترف، من أفضل لاعبي الصين واليابان وكوريا الجنوبية.

🎬 E13: اللعب السريع أظهر قدرة شبكة السياسة على اتخاذ القرارات الفورية

الكشف عن الهوية

في 4 يناير 2017، بعد إتمام الفوز الستين، كشف "Master" عن هويته في غرفة الدردشة:

"أنا الدكتور هوانغ من AlphaGo."

الدكتور هوانغ هو آجا هوانغ (Aja Huang)، عضو أساسي في فريق AlphaGo.

أكد DeepMind رسمياً لاحقاً: "Master" هو إصدار جديد من AlphaGo، وكان الهدف من هذا الاختبار التحقق من استقرار النظام في البيئة عبر الإنترنت.

ردود فعل اللاعبين المحترفين

صدمة 60 انتصاراً متتالياً كانت أعمق من مباراة لي سيدول. لأن المنافسين هذه المرة كانوا أكثر عدداً وأوسع نطاقاً.

كه جيه (خسر 3 مرات أمام Master):

"الفجوة بين البشر والذكاء الاصطناعي أكبر مما تخيلنا. اعتقدنا دائماً أننا نفهم الغو، لكن Master جعلني أشعر بأننا لم نبدأ حتى."

ني وي بينغ (لقب القديس في الصين):

"لعبت الغو لمدة 60 عاماً، وهذه المرة الأولى التي أشعر فيها بهذا العجز. هذه ليست فجوة في المهارة، بل فجوة في البُعد."

غو لي (ثمانية بطولات عالمية):

"بعد خسارتي أمام Master، بدأت أفكر في قيمة اللاعبين البشر. هل نحتاج حتى لمسابقات احترافية؟"

التحليل التقني

هذا الإصدار من AlphaGo (الذي سُمي لاحقاً AlphaGo Master) تحسن بشكل ملحوظ مقارنة بإصدار مباراة لي سيدول:

المؤشرإصدار Leeإصدار Masterالتحسن
تصنيف Elo~3,600~4,800+1,200
نسبة الفوز في اللعب الذاتي-99%+-
دقة السياسة~57%~62%+5%
وقت التدريبعدة أشهرأشهر إضافية-

🎬 E15: تحسن Elo يظهر التقدم الأسي للعب الذاتي


مباراة كه جيه (مايو 2017): وداع الملك

المتحدي الأخير

بعد 60 انتصاراً متتالياً لـ Master، قلة من الناس اعتقدوا أن البشر لديهم فرصة لهزيمة AlphaGo. لكن شخصاً واحداً لا يزال يتوق للمواجهة - كه جيه.

كه جيه، البالغ 19 عاماً آنذاك، كان المصنف الأول عالمياً. صرح مراراً:

"لا أعتقد أن AlphaGo يستطيع هزيمتي. حتى لو فاز Master علي في ثلاث مباريات سريعة، المباراة الرسمية مختلفة."

قبلت Google التحدي.

قمة وو تشن للغو

في مايو 2017، أُقيمت "قمة مستقبل الغو" في وو تشن، تشجيانغ، الصين. كانت فعالية ضخمة حول AlphaGo، شملت:

  1. سلسلة من ثلاث مباريات مع كه جيه: أقوى بشري ضد أقوى ذكاء اصطناعي
  2. مباراة الفريق الثنائي: بشري + AlphaGo ضد بشري + AlphaGo
  3. مباراة الفريق: خمسة من أفضل لاعبي الصين معاً ضد AlphaGo

السلسلة الثلاثية: نتيجة 3:0

المباراة الأولى (23 مايو)

لعب كه جيه بالأسود أولاً، واعتمد في الافتتاح تشكيلة "التيار الصيني" المستقرة. كان هذا اختياراً مدروساً - أمل كه جيه في تجنب الهزيمة بسبب الرؤية الاستراتيجية لـ AlphaGo، والفوز من خلال التفاصيل.

لكن رد AlphaGo كان مثالياً. وجد أدق حركة في كل لحظة حاسمة، وتراكمت الميزة تدريجياً.

النتيجة: فوز AlphaGo بـ 1/4 حجر (0.5 نقطة)

هذا هو أصغر فارق ممكن في الغو. بكى كه جيه بعد المباراة:

"بذلت كل ما لدي، لكنني نقصت قليلاً."

🎬 E17: فارق 1/4 حجر يظهر قدرة التحكم الدقيق للذكاء الاصطناعي

المباراة الثانية (25 مايو)

غير كه جيه استراتيجيته، واعتمد افتتاحية تقلد AlphaGo. استخدم "الدخول المباشر للزاوية 3-3" - هذا بالضبط ما قدمه AlphaGo لعالم الغو من ابتكار.

"بما أن طريقتك أفضل، سأتعلم طريقتك."

لكن AlphaGo لم يتأثر. استمر بوتيرته الخاصة، وأظهر قدرة حسابية مذهلة في معارك منتصف اللعبة.

النتيجة: فوز AlphaGo بالاستسلام

المباراة الثالثة (27 مايو)

في المباراة الأخيرة، وضع كه جيه كل شيء على المحك. اعتمد أسلوباً قتالياً عدوانياً للغاية، محاولاً جر AlphaGo إلى فوضى.

في مرحلة الافتتاح، نجح كه جيه في خلق بعض المواقف المعقدة. لكن رد AlphaGo ظل دقيقاً، ولم يمنح كه جيه أي فرصة للانقلاب.

النتيجة: فوز AlphaGo بالاستسلام

النتيجة النهائية: AlphaGo 3:0 كه جيه

🎬 E19: السلسلة الثلاثية أظهرت السيطرة المطلقة لـ AlphaGo

مباراة الفريق الثنائي ومباراة الفريق

إلى جانب سلسلة كه جيه الثلاثية، أُقيم نوعان مبتكران من المباريات:

مباراة الفريق الثنائي (26 مايو)

ليان شياو + AlphaGo ضد غو لي + AlphaGo

النقطة المثيرة في هذه المباراة: ماذا يحدث عندما يختلف اللاعب البشري مع AlphaGo؟

أظهرت النتائج: الفريق الذي يتبع توصيات AlphaGo بالكامل يؤدي بشكل أفضل. عندما حاول اللاعبون البشر "تصحيح" حركات AlphaGo، أدى ذلك غالباً إلى تدهور الموقف.

النتيجة: فوز ليان شياو + AlphaGo

مباراة الفريق (26 مايو)

الفريق الصيني (تشو رويانغ، شي يوي، تانغ وي شينغ، تشن ياو يي، مي يو تينغ) ضد AlphaGo

خمسة من أفضل لاعبي الصين تعاونوا ضد ذكاء اصطناعي واحد. يمكنهم المناقشة بحرية واتخاذ كل قرار معاً.

لكن النتيجة كانت محسومة: فوز AlphaGo بالاستسلام.

أثبتت هذه المباراة: حتى لو تعاون أفضل اللاعبين البشر، لا يمكنهم هزيمة AlphaGo.

إعلان تقاعد AlphaGo

في 27 مايو 2017، بعد انتهاء سلسلة كه جيه الثلاثية، أصدر DeepMind بياناً مهماً:

"هذه آخر مباراة علنية لـ AlphaGo. نعتقد أن AlphaGo أكمل مهمته - إثبات أن الذكاء الاصطناعي يمكنه الوصول إلى مستوى يتجاوز البشر في الغو، ذروة الذكاء البشري.

الآن، سنطبق التقنيات التي تعلمناها من AlphaGo على مشاكل أكثر أهمية: الطب، الطاقة، علم المواد. هذه هي القيمة الحقيقية للذكاء الاصطناعي."

في الوقت نفسه، أُعلن عن:

  1. أداة تعليم AlphaGo: ستُصدر تحليلات مباريات AlphaGo لتعلم اللاعبين
  2. 50 سجل لعب ذاتي: ستُنشر سجلات AlphaGo ضد AlphaGo
  3. ورقة بحثية تقنية: ستُنشر نتائج أبحاث AlphaGo Zero في Nature

🎬 E21: تقاعد AlphaGo يمثل نهاية حقبة


المكانة التاريخية للمباريات

معالم تقنية

مباريات AlphaGo لها أهمية تاريخية في تاريخ الذكاء الاصطناعي:

السنةالحدثالأهمية
1997Deep Blue يهزم كاسباروفانتصار البحث بالقوة الغاشمة
2011Watson يفوز في Jeopardy!اختراق في معالجة اللغة الطبيعية
2016AlphaGo يهزم لي سيدولانتصار التعلم العميق + التعلم المعزز
2017AlphaGo Zero 100:0انتصار التعلم الذاتي البحت

🎬 E23: كل معلم يمثل تطور منهجية الذكاء الاصطناعي

التأثير على عالم الغو

تغيير دراسة السجلات

تقليدياً، درس اللاعبون المحترفون سجلات البشر بشكل رئيسي. لكن بعد AlphaGo، أصبحت سجلات الذكاء الاصطناعي مادة إلزامية.

  • افتتاح الدخول للزاوية 3-3: أثبت AlphaGo أن الدخول المباشر للزاوية استراتيجية فعالة
  • استخدام ضربة الكتف: الحركة 37 غيرت فهم تقنية "ضربة الكتف"
  • قيمة القوة: أظهر الذكاء الاصطناعي طرقاً جديدة لتحويل القوة

تحول في طرق التدريب

تغيرت طرق تدريب اللاعبين المحترفين جذرياً:

الطريقة التقليديةطريقة عصر الذكاء الاصطناعي
دراسة سجلات البشردراسة سجلات الذكاء الاصطناعي
الاعتماد على توجيه المعلماستخدام أدوات تحليل الذكاء الاصطناعي
حفظ التسلسلاتفهم منطق تقييم الذكاء الاصطناعي
الممارسة الفعليةتحليل المباريات بالذكاء الاصطناعي

صعود جيل جديد من اللاعبين

اللاعبون الذين نشأوا بعد 2016 يُسمون "مواطني الذكاء الاصطناعي الأصليين". أسلوبهم متأثر بوضوح بالذكاء الاصطناعي:

  • يركزون أكثر على الكفاءة بدلاً من الجماليات التقليدية
  • أكثر استعداداً لتجربة أساليب غير تقليدية
  • يعتمدون أكثر على الحسابات الدقيقة بدلاً من الحدس

تأملات فلسفية

أثار انتصار AlphaGo نقاشات فلسفية عميقة:

ما هي طبيعة الذكاء؟

هل "يفهم" AlphaGo الغو؟ أم أنه يقوم فقط بحسابات دقيقة؟ هذا السؤال لا يزال بلا إجابة حاسمة.

أين تكمن قيمة الإنسان؟

عندما يتجاوز الذكاء الاصطناعي البشر في الغو، هل لمسابقات الغو أي معنى؟ أعاد العديد من اللاعبين التفكير في معنى مهنتهم.

من المثير للاهتمام أنه بعد AlphaGo، زاد الاهتمام العالمي بالغو. أدرك الناس أن الغو ليست مجرد منافسة، بل هي أيضاً فن وفلسفة.

اتجاه تطور الذكاء الاصطناعي

جعل نجاح AlphaGo الناس يشعرون بالتوقع والقلق تجاه الذكاء الاصطناعي. اختيار DeepMind إعادة AlphaGo والتحول نحو "حل المشاكل المهمة حقاً" هو في حد ذاته خيار أخلاقي.

🎬 E25: AlphaGo أثار نقاشاً واسعاً حول أخلاقيات الذكاء الاصطناعي


مباريات أخرى مهمة

المواجهات مع ذكاءات اصطناعية أخرى

خارج المباريات العامة، لعب AlphaGo العديد من المباريات ضد ذكاءات اصطناعية أخرى للغو:

المنافسالإصدارالنتيجة
Crazy Stoneأقوى برنامج غو عام 2015فوز كامل
Zenأقوى ذكاء اصطناعي ياباني للغوفوز كامل
إصدارات AlphaGo القديمةلعب ذاتي بين الإصدارات-

الاختبارات الداخلية

أجرى فريق DeepMind العديد من الاختبارات الداخلية:

  • AlphaGo Lee ضد AlphaGo Master: نسبة فوز إصدار Master تجاوزت 99%
  • AlphaGo Master ضد AlphaGo Zero: نسبة فوز إصدار Zero تجاوزت 89%
  • مباريات بين إصدارات بأوقات تدريب مختلفة: مراقبة منحنى التعلم

هذه البيانات نُشرت لاحقاً في الأوراق البحثية، وأصبحت مادة مهمة لدراسة تعلم الذكاء الاصطناعي.


مراجع الرسوم المتحركة

المفاهيم الأساسية المذكورة في هذا المقال وأرقام الرسوم المتحركة:

الرقمالمفهومالمقابل الفيزيائي/الرياضي
🎬 E1شبكة السياسة توجه البحثتوزيع الاحتمالات
🎬 E3اختبار حدود MCTSعمق البحث الشجري
🎬 E5تقييم شبكة القيمة الشاملدالة القيمة
🎬 E7اكتشاف استراتيجيات مجهولةالاستكشاف مقابل الاستغلال
🎬 E9نقاط ضعف MCTSالشروط الحدية
🎬 E11"التحول الطوري" في القدراتالظواهر الحرجة
🎬 E13قدرة اتخاذ القرار الفوريسرعة الاستدلال
🎬 E15التقدم الأسي للعب الذاتيالتحسين التكراري
🎬 E17قدرة التحكم الدقيقالاستقرار العددي
🎬 E19السيطرة المطلقةالتقارب إلى الأمثل
🎬 E21نهاية حقبةإكمال المهمة
🎬 E23تطور المنهجيةتحول النموذج
🎬 E25نقاش أخلاقيات الذكاء الاصطناعيالتأثير الاجتماعي

قراءة إضافية


المراجع

  1. Silver, D., et al. (2016). "Mastering the game of Go with deep neural networks and tree search." Nature, 529, 484-489.
  2. Silver, D., et al. (2017). "Mastering the game of Go without human knowledge." Nature, 550, 354-359.
  3. وثائقي AlphaGo (2017)، إخراج غريغ كوس.
  4. مدونة DeepMind الرسمية: سلسلة مقالات AlphaGo
  5. سجلات مباريات لي سيدول الرسمية والتعليقات (اتحاد الغو الكوري)
  6. السجلات الرسمية لقمة وو تشن للغو