انتقل إلى المحتوى الرئيسي

لماذا الغو صعب؟

قبل ظهور AlphaGo، كان الغو يُعتبر "الحصن الأخير" للذكاء الاصطناعي. على مدى عقود، جرّب الباحثون طرقًا مختلفة، لكنهم لم يتمكنوا أبدًا من جعل الكمبيوتر يصل إلى مستوى اللاعبين المحترفين.

ليس لأن الباحثين لم يبذلوا جهدًا كافيًا، بل لأن الغو بطبيعته مشكلة حسابية صعبة للغاية.

سيستكشف هذا المقال بعمق: ما الذي يجعل الغو صعبًا؟ لماذا يُسمى "الكأس المقدسة للذكاء الاصطناعي"؟


انفجار فضاء الحالة: معنى 10^170

ما هو فضاء الحالة؟

في أي لعبة لوحية، يشير فضاء الحالة (State Space) إلى العدد الإجمالي لجميع أوضاع اللوحة الممكنة. هذا الرقم يحدد جدوى البحث الشامل.

بالنسبة للغو، هذا الرقم هو:

فضاء حالة الغو ≈ 10^170

ما معنى هذا المفهوم؟ لنُجري بعض المقارنات.

المقارنة مع عدد ذرات الكون

وفقًا لتقديرات الفيزيائيين، العدد الإجمالي للذرات في الكون المرصود هو تقريبًا:

عدد ذرات الكون ≈ 10^80

هذا يعني:

عدد الأوضاع الممكنة في الغو هو 10^90 ضعف عدد ذرات الكون.

لو اعتبرت كل ذرة في الكون كمبيوترًا خارقًا، وكل كمبيوتر يعالج مليار وضع في الثانية، من الانفجار الكبير حتى الآن (حوالي 13.8 مليار سنة) لن يكون ممكنًا استعراض جميع الأوضاع.

فهم حدسي للأرقام

الرقمالمعنى
10^9مليار، مقياس إجمالي سكان البشرية
10^12تريليون، عدد النمل في العالم
10^23عدد الجزيئات في المول الواحد
10^80عدد الذرات في الكون
10^120فضاء حالة الشطرنج
10^170فضاء حالة الغو

لماذا فضاء حالة الغو كبير جدًا؟

هناك عدة أسباب لضخامة فضاء حالة الغو:

1. حجم اللوحة

الغو يستخدم لوحة 19×19، بإجمالي 361 نقطة تقاطع. للمقارنة:

  • الشطرنج: 8×8 = 64 مربعًا
  • الشطرنج الصيني: 9×10 = 90 نقطة تقاطع
  • خمسة في صف: 15×15 = 225 نقطة تقاطع

2. ثلاث حالات لكل نقطة

كل نقطة تقاطع يمكن أن تكون:

  • فارغة (لا حجر)
  • حجر أسود
  • حجر أبيض

التقدير التقريبي، عدد التركيبات الممكنة هو 3^361 ≈ 10^172. مع مراعاة قواعد الغو (مثل الكو، قيود الحريات)، الأوضاع القانونية الفعلية حوالي 10^170.

3. الأحجار لا تتحرك

على عكس الشطرنج، أحجار الغو بمجرد وضعها لا تتحرك (إلا إذا أُسرت). هذا يعني كل حركة هي إضافة حجر جديد، وليس تحريك حجر موجود، مما يؤدي إلى مسارات ممكنة أكثر.

كود توضيحي: تقدير فضاء الحالة

import math

# حجم اللوحة
BOARD_SIZE = 19
TOTAL_POINTS = BOARD_SIZE ** 2 # 361

# كل نقطة ثلاث حالات (فارغة، أسود، أبيض)
# الحد الأعلى التقريبي
upper_bound = 3 ** TOTAL_POINTS
print(f"الحد الأعلى التقريبي: 3^{TOTAL_POINTS} ≈ 10^{math.log10(upper_bound):.0f}")
# الناتج: الحد الأعلى التقريبي: 3^361 ≈ 10^172

# التقدير الفعلي مع مراعاة القواعد
# حساب Tromp-Taylor الدقيق يعطي حوالي 2.08 × 10^170
actual_estimate = 2.08e170
print(f"التقدير الفعلي: {actual_estimate:.2e}")

# المقارنة مع عدد ذرات الكون
universe_atoms = 1e80
ratio = actual_estimate / universe_atoms
print(f"عدد أوضاع الغو / عدد ذرات الكون = 10^{math.log10(ratio):.0f}")
# الناتج: عدد أوضاع الغو / عدد ذرات الكون = 10^90

لعنة عامل التفرع: 250 خيارًا في المتوسط

ما هو عامل التفرع؟

عامل التفرع (Branching Factor) يشير إلى متوسط عدد الحركات القانونية في أي حركة من اللعبة. هذا الرقم يحدد عرض شجرة البحث.

اللعبةمتوسط عامل التفرع
إكس-أو~4
الشطرنج~35
الشطرنج الصيني~38
أوثيلو~10
الغو~250

النمو الانفجاري لشجرة البحث

لنفترض أننا نريد استخدام خوارزمية بحث الشجرة للنظر N حركات للأمام. عدد الأوضاع التي يجب مراعاتها تقريبًا:

عدد العقدbN\text{عدد العقد} \approx b^N

حيث b هو عامل التفرع.

لنقارن بين الشطرنج والغو:

النظر N حركاتالشطرنج (b=35)الغو (b=250)الفرق
1 حركة35250
2 حركات1,22562,50051×
4 حركات1.5 مليون3.9 مليار2,600×
6 حركات1.8 مليار2.4×10^14130 مليون×
10 حركات2.8×10^159.5×10^23340 مليون×

النظر 10 حركات للأمام، الغو يتطلب مراعاة أوضاع 340 مليون مرة أكثر من الشطرنج.

لماذا فشلت طريقة ديب بلو في الغو

ديب بلو الذي هزم كاسباروف عام 1997 استخدم تقنيات أساسية:

  1. تقليم ألفا-بيتا: تقليل عقد البحث
  2. تسريع الأجهزة: تقييم 200 مليون وضع في الثانية
  3. دالة تقييم يدوية: تقييم مصمم من الخبراء

لكن حتى بنفس الطريقة:

  • الشطرنج: النظر 12-14 حركة يتطلب تقييم حوالي 10^18 عقدة
  • الغو: النظر 12 حركة يتطلب تقييم حوالي 10^29 عقدة

الفرق هو 10 مليار مليار مرة. لا يوجد أجهزة يمكنها سد هذه الفجوة.

الافتتاح له خيارات أكثر

في مرحلة افتتاح الغو، عامل التفرع أعلى:

  • الحركة الأولى: 361 خيارًا
  • الحركة الثانية: 360 خيارًا
  • الحركة الثالثة: 359 خيارًا
  • ...

حتى النظر في أول 10 حركات فقط:

361×360×359×...×3525.5×1025361 \times 360 \times 359 \times ... \times 352 \approx 5.5 \times 10^{25}

هذا هو السبب في أهمية "جوسيكي الافتتاح" — يحتاج اللاعبون البشر لحفظ كميات كبيرة من تغييرات الافتتاح، لأنهم لا يستطيعون الحساب الفوري.


صعوبة التقييم: لا قيمة بسيطة للقطع

ميزة المواد في الشطرنج

في الشطرنج، تقييم الوضع بديهي نسبيًا:

القطعةالقيمة (التقليدية)
البيدق1
الحصان3
الفيل3
القلعة5
الوزير9

رغم أن التقييم الفعلي أكثر تعقيدًا (الموقع، البنية، إلخ)، "عد القطع" نقطة انطلاق جيدة. أسر وزير الخصم شيء جيد تقريبًا بالتأكيد.

الغو: كل حجر متساوٍ

في الغو، القيمة الجوهرية لكل حجر متساوية تمامًا — كلها مجرد أحجار.

قيمة الحجر تعتمد كليًا على:

  • موقعه على اللوحة
  • علاقته مع الأحجار الأخرى
  • تأثيره على الوضع العام

هذا يجعل التقييم صعبًا للغاية.

تجريد السماكة والنفوذ

في الغو العديد من المفاهيم المجردة:

السماكة (Thickness)

"السماكة" تشير إلى مجموعة أحجار صلبة، مستقرة، ذات تأثير. لكن "السماكة" يصعب قياسها:

  • الشكل السميك يساوي كم نقطة؟
  • متى يجب استخدام السماكة للهجوم؟
  • متى تصبح السماكة "شكلاً سخيفًا" (شكل غير كفء)؟

قد يقول لاعب من الطراز الأول: "هذه المجموعة سميكة، تساوي حوالي 15 نقطة." لكن هذا مبني على عقود من الخبرة والحدس، وليس حسابًا دقيقًا.

النفوذ (Influence)

النفوذ في الغو يشير إلى قوة التحكم المحتملة للأحجار على المساحة المحيطة. هذا التحكم "افتراضي" — قد يتحول إلى أرض، قد يلعب دورًا في الهجوم والدفاع، أو قد لا يكون شيئًا في النهاية.

كيف تقيّم القيمة "المحتملة"؟ هذا صعب للغاية على الكمبيوتر.

الآجي (Aji)

"الآجي" أحد أكثر المفاهيم تجريدًا في الغو. يشير إلى الإمكانية الكامنة لموقع معين على اللوحة.

مجموعة "ميتة" قد يكون لها "قيمة استخدام" — رغم أنها لا يمكن إحياؤها، يمكنها التسبب في إزعاج في معارك مستقبلية. هذه "الإمكانية الكامنة" يكاد يكون من المستحيل تمثيلها رقميًا.

لماذا فشلت دوال التقييم اليدوية

في الشطرنج الحاسوبي قبل ديب بلو، استُخدمت دوال تقييم صممها خبراء بشر:

قيمة التقييم = نقاط المواد + نقاط الموقع + أمان الملك + بنية البيادق + ...

هذه العناصر يمكن قياسها، ضبط أوزانها، وتعمل جيدًا.

لكن الغو؟

جرّب الباحثون ميزات مختلفة:

  • عدد التقاطعات المسيطر عليها
  • "الحرية" للأحجار (عدد الحريات)
  • قوة الاتصال
  • اكتمال شكل العين
  • ...

لكن تركيبات هذه الميزات لم تصل أبدًا إلى مستوى الهواة المتقدمين.

المشكلة الجوهرية: تقييم وضع الغو مشكلة غير خطية للغاية، شاملة.

قيمة حجر واحد تعتمد على حالة اللوحة بأكملها، وليس مجموع بسيط للميزات المحلية.


الحاجة للتخطيط طويل المدى: 150 حركة في مباراة

المراحل الثلاث للغو

مباراة غو قياسية عادة تمر بثلاث مراحل:

المرحلةالحركات (تقريبًا)الخصائص
الافتتاح1-50احتلال الأراضي، بناء الإطار، تحديد الاتجاه العام
الوسط50-200المعارك، الهجوم والدفاع، التوازن بين المحلي والشامل
النهاية200-300الإغلاق، الحساب، الدقة

متوسط المباراة حوالي 250-300 حركة، أول 150 حركة تحدد النتيجة الكبرى.

الافتتاح: التخطيط لما بعد 30 حركة

كل حركة في مرحلة الافتتاح تُعد للعشرات أو حتى المئات من الحركات القادمة.

مثلاً، افتتاح "النجوم الثلاث":

. . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . .
. . . ● . . . . . ● . . . . . ● . . .
. . . . . . . . . . . . . . . . . . .
...

هذه الأحجار الثلاثة السوداء تشكل افتتاحًا "نفوذيًا"، نيته:

  1. لا تستعجل في إحاطة الأرض
  2. انتظر دخول الأبيض ثم هاجم
  3. اكتسب أرضًا أو نفوذًا من خلال الهجوم
  4. في النهاية حقق الأفضلية في نهاية المباراة

هذه "الخطة" تتطلب النظر 50-100 حركة للأمام. لا توجد خوارزمية بحث يمكنها النظر هذا البعيد.

الوسط: التوازن بين المحلي والشامل

معارك الوسط هي الجزء الأكثر تعقيدًا في الغو. يحتاج اللاعب في كل حركة للنظر في:

  1. الحساب المحلي: من سيفوز بهذه المعركة؟
  2. الحكم الشامل: هل يستحق القتال هنا؟
  3. اختيار الترتيب: أين الأكثر كفاءة للعب أولاً؟
  4. قرار التخلي: متى يجب التخلي عن الأحجار والتحول؟

قرار وسط نموذجي:

"إذا قطعت هنا، الخصم سيهاجم مضادًا، سأحتاج لإحياء مجموعة، هذا سيعطي الخصم المبادرة لاحتلال نقطة كبيرة... في النهاية سأخسر حوالي 5 نقاط. لكن إذا عززت أولاً ثم قطعت، رغم خسارة المبادرة، لكن..."

هذا النوع من التفكير متعدد المستويات والأبعاد يتطلب معالجة المحلي والشامل، القصير والطويل المدى في وقت واحد.

النهاية: الحساب الدقيق والانقلاب

مرحلة النهاية تبدو بسيطة — مجرد إغلاق. لكن في الواقع:

  • "قيمة النقاط" لكل حركة تحتاج حسابًا دقيقًا
  • الفرق بين المبادرة والرد قد يحدد النتيجة
  • "معارك الكو" يمكن أن تغير الوضع تمامًا

دقة حساب اللاعبين المحترفين في النهاية يمكن أن تصل إلى 0.5 نقطة، والفرق في مباراة قد يكون نقطة واحدة فقط.

لماذا عدم النظر بعيدًا قاتل

لنجري حسابًا مبسطًا:

  • متوسط المباراة 250 حركة
  • للتنبؤ المثالي بالنتيجة، نظريًا نحتاج رؤية جميع 250 حركة
  • حتى لو انخفض عامل التفرع إلى 100 (مرحلة النهاية)، فضاء البحث هو 100^250 ≈ 10^500

هذا يفوق بكثير قدرة أي كمبيوتر.

لهذا يجب على ذكاء الغو الاصطناعي تعلم "تقييم" الأوضاع، وليس الاعتماد فقط على "الحساب".


أهمية الحدس: "هذه الحركة تبدو صحيحة"

طريقة تفكير اللاعبين البشر

عندما يصف لاعبو الغو من الطراز الأول عملية تفكيرهم، غالبًا يستخدمون كلمات مثل:

"هذه الحركة تبدو صحيحة."

"هذا الشكل مريح جدًا."

"تلك المجموعة لديها آجي سيء."

"هناك شعور بالخطر لا أستطيع وصفه."

هذا ليس وصفًا شاعريًا، بل عملية إدراكية حقيقية. يستخدم اللاعبون البشر التعرف على الأنماط والحكم الحدسي للتعامل مع تعقيد الغو.

التعرف على الأنماط: رؤية النقاط المهمة في ثانية

أظهرت التجارب أن اللاعبين المحترفين بنظرة واحدة على اللوحة (أقل من ثانية)، يمكنهم:

  1. تحديد المناطق الرئيسية
  2. اكتشاف "الحركات الجيدة" المحتملة
  3. الشعور بالوضع العام تقريبًا

هذه القدرة تأتي من تراكم خبرة عشرات الآلاف من المباريات، تشكل "حس اللعبة".

قبل AlphaGo، أكبر صعوبة في الغو الحاسوبي كانت عدم القدرة على نسخ هذا الحدس.

الوصف الرياضي للحدس

من منظور التعلم الآلي، يمكن فهم حدس الغو البشري كـ:

P(حركة جيدةوضع اللوحة)P(\text{حركة جيدة} | \text{وضع اللوحة})

الدماغ المدرب يمكنه، بناءً على وضع اللوحة، إخراج توزيع احتمالي فوري لـ "الحركة الجيدة" في كل موقع.

هذا بالضبط ما تحاول شبكة السياسة تعلمه — وهذا يتطلب شبكات عصبية عميقة.


لماذا يُسمى "الكأس المقدسة للذكاء الاصطناعي"

معالم ألعاب اللوحات

في تاريخ الذكاء الاصطناعي، ألعاب اللوحات كانت دائمًا معالم مهمة:

السنةالحدثالأهمية
1951أول برنامج داماأقدم ذكاء ألعاب
1997ديب بلو يهزم كاسباروفانتصار البحث الشامل
2007الداما تُحل بالكاملحدود ألعاب المعلومات الكاملة
2016AlphaGo يهزم لي سيدولانتصار التعلم العميق

لماذا الغو خاص

الغو يُسمى "الكأس المقدسة للذكاء الاصطناعي" لأنه يجمع كل الخصائص الصعبة:

الخاصيةالغوالشطرنج
فضاء الحالة10^17010^120
عامل التفرع~250~35
متوسط الحركات~250~40
صعوبة التقييمعالية جدًامتوسطة
الاعتماد على الحدسعالي جدًاعالي

إذا استطاع الذكاء الاصطناعي حل الغو، يعني:

  1. يمكنه التعامل مع فضاءات بحث ضخمة
  2. يمكنه تعلم تقييم مجرد
  3. يمكنه التخطيط طويل المدى
  4. يمكنه تشكيل "حدس"

هذه القدرات تتجاوز بكثير "لعب اللعبة"، هي خصائص أساسية لـالذكاء العام.

توقعات الأكاديمية

قبل 2016، توقعات الأكاديمية لـ "متى يمكن للذكاء الاصطناعي هزيمة بطل العالم في الغو" كانت عمومًا:

"على الأقل 10-20 سنة أخرى."

— معظم باحثي الذكاء الاصطناعي (2015)

هذا التوقع مبني على سرعة التقدم التقني آنذاك. برامج الغو كانت تتحسن حوالي 1-2 دان سنويًا، والفجوة مع اللاعبين المحترفين 9 دان هي 18 دان. بهذه السرعة، فعلاً كان مطلوبًا 10-20 سنة.

لم يتوقع أحد أن التعلم العميق سيحقق اختراقًا قفزيًا.


ربط الرسوم المتحركة

المفاهيم الأساسية في هذا المقال وأرقام الرسوم المتحركة المقابلة:

الرقمالمفهومالمقابل في الفيزياء/الرياضيات
🎬 B2انفجار فضاء الحالةالرياضيات التوافقية، النمو الأسي
🎬 B8الانفجار التوافقينمو العاملي، شجرة البحث
🎬 A3مقارنة عامل التفرعنظرية الرسوم البيانية، بنية الشجرة
🎬 B5معضلة دالة التقييمالتعيين غير الخطي

ملخص النقاط الرئيسية

الغو يُسمى "الكأس المقدسة للذكاء الاصطناعي" لأنه يجمع ثلاث مشاكل رئيسية:

1. لعنة الفضاء

  • 10^170 وضع ممكن، أكثر بكثير من عدد ذرات الكون
  • عامل التفرع ~250، شجرة البحث تنمو بشكل انفجاري
  • البحث الشامل مستحيل فيزيائيًا

2. صعوبة التقييم

  • كل حجر قيمته متساوية، لا ميزة مواد
  • مفاهيم "السماكة" "النفوذ" "الآجي" المجردة يصعب قياسها
  • تقييم الوضع مشكلة غير خطية للغاية، شاملة

3. تحدي الوقت

  • المباراة ~250 حركة، تحتاج تخطيطًا طويل المدى
  • قرارات الافتتاح تؤثر على أوضاع بعد 50-100 حركة
  • المعارك المحلية والتوازن الشامل يحتاجان مراعاة متزامنة

هذه التركيبة من المشاكل جعلت طرق الذكاء الاصطناعي التقليدية (البحث الشامل + التقييم اليدوي) تفشل تمامًا في الغو.

واختراق AlphaGo كان لأنه استخدم الشبكات العصبية العميقة لحل مشكلة التقييم، البحث في شجرة مونتي كارلو لحل مشكلة التخطيط، والتعلم المعزز لحل مشكلة تجاوز البشر.


قراءات إضافية


المراجع

  1. Tromp, J. (2016). "Number of legal Go positions." — حساب دقيق لفضاء حالة الغو
  2. Allis, L.V. (1994). "Searching for Solutions in Games and Artificial Intelligence." PhD thesis, University of Limburg. — تحليل نظري لتعقيد الألعاب
  3. Müller, M. (2002). "Computer Go." Artificial Intelligence, 134(1-2), 145-179. — مراجعة أبحاث الغو الحاسوبي المبكرة
  4. Silver, D., et al. (2016). "Mastering the game of Go with deep neural networks and tree search." Nature, 529, 484-489. — ورقة AlphaGo الأصلية