لماذا الغو صعب؟

قبل ظهور AlphaGo، كان الغو يُعتبر "الحصن الأخير" للذكاء الاصطناعي. على مدى عقود، جرّب الباحثون طرقًا مختلفة، لكنهم لم يتمكنوا أبدًا من جعل الكمبيوتر يصل إلى مستوى اللاعبين المحترفين.

ليس لأن الباحثين لم يبذلوا جهدًا كافيًا، بل لأن الغو بطبيعته مشكلة حسابية صعبة للغاية.

سيستكشف هذا المقال بعمق: ما الذي يجعل الغو صعبًا؟ لماذا يُسمى "الكأس المقدسة للذكاء الاصطناعي"؟

انفجار فضاء الحالة: معنى 10^170

ما هو فضاء الحالة؟

في أي لعبة لوحية، يشير فضاء الحالة (State Space) إلى العدد الإجمالي لجميع أوضاع اللوحة الممكنة. هذا الرقم يحدد جدوى البحث الشامل.

بالنسبة للغو، هذا الرقم هو:

فضاء حالة الغو ≈ 10^170

ما معنى هذا المفهوم؟ لنُجري بعض المقارنات.

المقارنة مع عدد ذرات الكون

وفقًا لتقديرات الفيزيائيين، العدد الإجمالي للذرات في الكون المرصود هو تقريبًا:

عدد ذرات الكون ≈ 10^80

هذا يعني:

عدد الأوضاع الممكنة في الغو هو 10^90 ضعف عدد ذرات الكون.

لو اعتبرت كل ذرة في الكون كمبيوترًا خارقًا، وكل كمبيوتر يعالج مليار وضع في الثانية، من الانفجار الكبير حتى الآن (حوالي 13.8 مليار سنة) لن يكون ممكنًا استعراض جميع الأوضاع.

فهم حدسي للأرقام

الرقم	المعنى
10^9	مليار، مقياس إجمالي سكان البشرية
10^12	تريليون، عدد النمل في العالم
10^23	عدد الجزيئات في المول الواحد
10^80	عدد الذرات في الكون
10^120	فضاء حالة الشطرنج
10^170	فضاء حالة الغو

لماذا فضاء حالة الغو كبير جدًا؟

هناك عدة أسباب لضخامة فضاء حالة الغو:

1. حجم اللوحة

الغو يستخدم لوحة 19×19، بإجمالي 361 نقطة تقاطع. للمقارنة:

الشطرنج: 8×8 = 64 مربعًا
الشطرنج الصيني: 9×10 = 90 نقطة تقاطع
خمسة في صف: 15×15 = 225 نقطة تقاطع

2. ثلاث حالات لكل نقطة

كل نقطة تقاطع يمكن أن تكون:

فارغة (لا حجر)
حجر أسود
حجر أبيض

التقدير التقريبي، عدد التركيبات الممكنة هو 3^361 ≈ 10^172. مع مراعاة قواعد الغو (مثل الكو، قيود الحريات)، الأوضاع القانونية الفعلية حوالي 10^170.

3. الأحجار لا تتحرك

على عكس الشطرنج، أحجار الغو بمجرد وضعها لا تتحرك (إلا إذا أُسرت). هذا يعني كل حركة هي إضافة حجر جديد، وليس تحريك حجر موجود، مما يؤدي إلى مسارات ممكنة أكثر.

كود توضيحي: تقدير فضاء الحالة

import math

# حجم اللوحة
BOARD_SIZE = 19
TOTAL_POINTS = BOARD_SIZE ** 2  # 361

# كل نقطة ثلاث حالات (فارغة، أسود، أبيض)
# الحد الأعلى التقريبي
upper_bound = 3 ** TOTAL_POINTS
print(f"الحد الأعلى التقريبي: 3^{TOTAL_POINTS} ≈ 10^{math.log10(upper_bound):.0f}")
# الناتج: الحد الأعلى التقريبي: 3^361 ≈ 10^172

# التقدير الفعلي مع مراعاة القواعد
# حساب Tromp-Taylor الدقيق يعطي حوالي 2.08 × 10^170
actual_estimate = 2.08e170
print(f"التقدير الفعلي: {actual_estimate:.2e}")

# المقارنة مع عدد ذرات الكون
universe_atoms = 1e80
ratio = actual_estimate / universe_atoms
print(f"عدد أوضاع الغو / عدد ذرات الكون = 10^{math.log10(ratio):.0f}")
# الناتج: عدد أوضاع الغو / عدد ذرات الكون = 10^90

لعنة عامل التفرع: 250 خيارًا في المتوسط

ما هو عامل التفرع؟

عامل التفرع (Branching Factor) يشير إلى متوسط عدد الحركات القانونية في أي حركة من اللعبة. هذا الرقم يحدد عرض شجرة البحث.

اللعبة	متوسط عامل التفرع
إكس-أو	~4
الشطرنج	~35
الشطرنج الصيني	~38
أوثيلو	~10
الغو	~250

النمو الانفجاري لشجرة البحث

لنفترض أننا نريد استخدام خوارزمية بحث الشجرة للنظر N حركات للأمام. عدد الأوضاع التي يجب مراعاتها تقريبًا:

\text{عدد العقد} \approx b^N

حيث b هو عامل التفرع.

لنقارن بين الشطرنج والغو:

النظر N حركات	الشطرنج (b=35)	الغو (b=250)	الفرق
1 حركة	35	250	7×
2 حركات	1,225	62,500	51×
4 حركات	1.5 مليون	3.9 مليار	2,600×
6 حركات	1.8 مليار	2.4×10^14	130 مليون×
10 حركات	2.8×10^15	9.5×10^23	340 مليون×

النظر 10 حركات للأمام، الغو يتطلب مراعاة أوضاع 340 مليون مرة أكثر من الشطرنج.

لماذا فشلت طريقة ديب بلو في الغو

ديب بلو الذي هزم كاسباروف عام 1997 استخدم تقنيات أساسية:

تقليم ألفا-بيتا: تقليل عقد البحث
تسريع الأجهزة: تقييم 200 مليون وضع في الثانية
دالة تقييم يدوية: تقييم مصمم من الخبراء

لكن حتى بنفس الطريقة:

الشطرنج: النظر 12-14 حركة يتطلب تقييم حوالي 10^18 عقدة
الغو: النظر 12 حركة يتطلب تقييم حوالي 10^29 عقدة

الفرق هو 10 مليار مليار مرة. لا يوجد أجهزة يمكنها سد هذه الفجوة.

الافتتاح له خيارات أكثر

في مرحلة افتتاح الغو، عامل التفرع أعلى:

الحركة الأولى: 361 خيارًا
الحركة الثانية: 360 خيارًا
الحركة الثالثة: 359 خيارًا
...

حتى النظر في أول 10 حركات فقط:

361 \times 360 \times 359 \times ... \times 352 \approx 5.5 \times 10^{25}

هذا هو السبب في أهمية "جوسيكي الافتتاح" — يحتاج اللاعبون البشر لحفظ كميات كبيرة من تغييرات الافتتاح، لأنهم لا يستطيعون الحساب الفوري.

صعوبة التقييم: لا قيمة بسيطة للقطع

ميزة المواد في الشطرنج

في الشطرنج، تقييم الوضع بديهي نسبيًا:

القطعة	القيمة (التقليدية)
البيدق	1
الحصان	3
الفيل	3
القلعة	5
الوزير	9

رغم أن التقييم الفعلي أكثر تعقيدًا (الموقع، البنية، إلخ)، "عد القطع" نقطة انطلاق جيدة. أسر وزير الخصم شيء جيد تقريبًا بالتأكيد.

الغو: كل حجر متساوٍ

في الغو، القيمة الجوهرية لكل حجر متساوية تمامًا — كلها مجرد أحجار.

قيمة الحجر تعتمد كليًا على:

موقعه على اللوحة
علاقته مع الأحجار الأخرى
تأثيره على الوضع العام

هذا يجعل التقييم صعبًا للغاية.

تجريد السماكة والنفوذ

في الغو العديد من المفاهيم المجردة:

السماكة (Thickness)

"السماكة" تشير إلى مجموعة أحجار صلبة، مستقرة، ذات تأثير. لكن "السماكة" يصعب قياسها:

الشكل السميك يساوي كم نقطة؟
متى يجب استخدام السماكة للهجوم؟
متى تصبح السماكة "شكلاً سخيفًا" (شكل غير كفء)؟

قد يقول لاعب من الطراز الأول: "هذه المجموعة سميكة، تساوي حوالي 15 نقطة." لكن هذا مبني على عقود من الخبرة والحدس، وليس حسابًا دقيقًا.

النفوذ (Influence)

النفوذ في الغو يشير إلى قوة التحكم المحتملة للأحجار على المساحة المحيطة. هذا التحكم "افتراضي" — قد يتحول إلى أرض، قد يلعب دورًا في الهجوم والدفاع، أو قد لا يكون شيئًا في النهاية.

كيف تقيّم القيمة "المحتملة"؟ هذا صعب للغاية على الكمبيوتر.

الآجي (Aji)

"الآجي" أحد أكثر المفاهيم تجريدًا في الغو. يشير إلى الإمكانية الكامنة لموقع معين على اللوحة.

مجموعة "ميتة" قد يكون لها "قيمة استخدام" — رغم أنها لا يمكن إحياؤها، يمكنها التسبب في إزعاج في معارك مستقبلية. هذه "الإمكانية الكامنة" يكاد يكون من المستحيل تمثيلها رقميًا.

لماذا فشلت دوال التقييم اليدوية

في الشطرنج الحاسوبي قبل ديب بلو، استُخدمت دوال تقييم صممها خبراء بشر:

قيمة التقييم = نقاط المواد + نقاط الموقع + أمان الملك + بنية البيادق + ...

هذه العناصر يمكن قياسها، ضبط أوزانها، وتعمل جيدًا.

لكن الغو؟

جرّب الباحثون ميزات مختلفة:

عدد التقاطعات المسيطر عليها
"الحرية" للأحجار (عدد الحريات)
قوة الاتصال
اكتمال شكل العين
...

لكن تركيبات هذه الميزات لم تصل أبدًا إلى مستوى الهواة المتقدمين.

المشكلة الجوهرية: تقييم وضع الغو مشكلة غير خطية للغاية، شاملة.

قيمة حجر واحد تعتمد على حالة اللوحة بأكملها، وليس مجموع بسيط للميزات المحلية.

الحاجة للتخطيط طويل المدى: 150 حركة في مباراة

المراحل الثلاث للغو

مباراة غو قياسية عادة تمر بثلاث مراحل:

المرحلة	الحركات (تقريبًا)	الخصائص
الافتتاح	1-50	احتلال الأراضي، بناء الإطار، تحديد الاتجاه العام
الوسط	50-200	المعارك، الهجوم والدفاع، التوازن بين المحلي والشامل
النهاية	200-300	الإغلاق، الحساب، الدقة

متوسط المباراة حوالي 250-300 حركة، أول 150 حركة تحدد النتيجة الكبرى.

الافتتاح: التخطيط لما بعد 30 حركة

كل حركة في مرحلة الافتتاح تُعد للعشرات أو حتى المئات من الحركات القادمة.

مثلاً، افتتاح "النجوم الثلاث":

. . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . .
. . . ● . . . . . ● . . . . . ● . . .
. . . . . . . . . . . . . . . . . . .
...

هذه الأحجار الثلاثة السوداء تشكل افتتاحًا "نفوذيًا"، نيته:

لا تستعجل في إحاطة الأرض
انتظر دخول الأبيض ثم هاجم
اكتسب أرضًا أو نفوذًا من خلال الهجوم
في النهاية حقق الأفضلية في نهاية المباراة

هذه "الخطة" تتطلب النظر 50-100 حركة للأمام. لا توجد خوارزمية بحث يمكنها النظر هذا البعيد.

الوسط: التوازن بين المحلي والشامل

معارك الوسط هي الجزء الأكثر تعقيدًا في الغو. يحتاج اللاعب في كل حركة للنظر في:

الحساب المحلي: من سيفوز بهذه المعركة؟
الحكم الشامل: هل يستحق القتال هنا؟
اختيار الترتيب: أين الأكثر كفاءة للعب أولاً؟
قرار التخلي: متى يجب التخلي عن الأحجار والتحول؟

قرار وسط نموذجي:

"إذا قطعت هنا، الخصم سيهاجم مضادًا، سأحتاج لإحياء مجموعة، هذا سيعطي الخصم المبادرة لاحتلال نقطة كبيرة... في النهاية سأخسر حوالي 5 نقاط. لكن إذا عززت أولاً ثم قطعت، رغم خسارة المبادرة، لكن..."

هذا النوع من التفكير متعدد المستويات والأبعاد يتطلب معالجة المحلي والشامل، القصير والطويل المدى في وقت واحد.

النهاية: الحساب الدقيق والانقلاب

مرحلة النهاية تبدو بسيطة — مجرد إغلاق. لكن في الواقع:

"قيمة النقاط" لكل حركة تحتاج حسابًا دقيقًا
الفرق بين المبادرة والرد قد يحدد النتيجة
"معارك الكو" يمكن أن تغير الوضع تمامًا

دقة حساب اللاعبين المحترفين في النهاية يمكن أن تصل إلى 0.5 نقطة، والفرق في مباراة قد يكون نقطة واحدة فقط.

لماذا عدم النظر بعيدًا قاتل

لنجري حسابًا مبسطًا:

متوسط المباراة 250 حركة
للتنبؤ المثالي بالنتيجة، نظريًا نحتاج رؤية جميع 250 حركة
حتى لو انخفض عامل التفرع إلى 100 (مرحلة النهاية)، فضاء البحث هو 100^250 ≈ 10^500

هذا يفوق بكثير قدرة أي كمبيوتر.

لهذا يجب على ذكاء الغو الاصطناعي تعلم "تقييم" الأوضاع، وليس الاعتماد فقط على "الحساب".

أهمية الحدس: "هذه الحركة تبدو صحيحة"

طريقة تفكير اللاعبين البشر

عندما يصف لاعبو الغو من الطراز الأول عملية تفكيرهم، غالبًا يستخدمون كلمات مثل:

"هذه الحركة تبدو صحيحة."

"هذا الشكل مريح جدًا."

"تلك المجموعة لديها آجي سيء."

"هناك شعور بالخطر لا أستطيع وصفه."

هذا ليس وصفًا شاعريًا، بل عملية إدراكية حقيقية. يستخدم اللاعبون البشر التعرف على الأنماط والحكم الحدسي للتعامل مع تعقيد الغو.

التعرف على الأنماط: رؤية النقاط المهمة في ثانية

أظهرت التجارب أن اللاعبين المحترفين بنظرة واحدة على اللوحة (أقل من ثانية)، يمكنهم:

تحديد المناطق الرئيسية
اكتشاف "الحركات الجيدة" المحتملة
الشعور بالوضع العام تقريبًا

هذه القدرة تأتي من تراكم خبرة عشرات الآلاف من المباريات، تشكل "حس اللعبة".

قبل AlphaGo، أكبر صعوبة في الغو الحاسوبي كانت عدم القدرة على نسخ هذا الحدس.

الوصف الرياضي للحدس

من منظور التعلم الآلي، يمكن فهم حدس الغو البشري كـ:

P(\text{حركة جيدة} | \text{وضع اللوحة})

الدماغ المدرب يمكنه، بناءً على وضع اللوحة، إخراج توزيع احتمالي فوري لـ "الحركة الجيدة" في كل موقع.

هذا بالضبط ما تحاول شبكة السياسة تعلمه — وهذا يتطلب شبكات عصبية عميقة.

لماذا يُسمى "الكأس المقدسة للذكاء الاصطناعي"

معالم ألعاب اللوحات

في تاريخ الذكاء الاصطناعي، ألعاب اللوحات كانت دائمًا معالم مهمة:

السنة	الحدث	الأهمية
1951	أول برنامج داما	أقدم ذكاء ألعاب
1997	ديب بلو يهزم كاسباروف	انتصار البحث الشامل
2007	الداما تُحل بالكامل	حدود ألعاب المعلومات الكاملة
2016	AlphaGo يهزم لي سيدول	انتصار التعلم العميق

لماذا الغو خاص

الغو يُسمى "الكأس المقدسة للذكاء الاصطناعي" لأنه يجمع كل الخصائص الصعبة:

الخاصية	الغو	الشطرنج
فضاء الحالة	10^170	10^120
عامل التفرع	~250	~35
متوسط الحركات	~250	~40
صعوبة التقييم	عالية جدًا	متوسطة
الاعتماد على الحدس	عالي جدًا	عالي

إذا استطاع الذكاء الاصطناعي حل الغو، يعني:

يمكنه التعامل مع فضاءات بحث ضخمة
يمكنه تعلم تقييم مجرد
يمكنه التخطيط طويل المدى
يمكنه تشكيل "حدس"

هذه القدرات تتجاوز بكثير "لعب اللعبة"، هي خصائص أساسية لـالذكاء العام.

توقعات الأكاديمية

قبل 2016، توقعات الأكاديمية لـ "متى يمكن للذكاء الاصطناعي هزيمة بطل العالم في الغو" كانت عمومًا:

"على الأقل 10-20 سنة أخرى."

— معظم باحثي الذكاء الاصطناعي (2015)

هذا التوقع مبني على سرعة التقدم التقني آنذاك. برامج الغو كانت تتحسن حوالي 1-2 دان سنويًا، والفجوة مع اللاعبين المحترفين 9 دان هي 18 دان. بهذه السرعة، فعلاً كان مطلوبًا 10-20 سنة.

لم يتوقع أحد أن التعلم العميق سيحقق اختراقًا قفزيًا.

ربط الرسوم المتحركة

المفاهيم الأساسية في هذا المقال وأرقام الرسوم المتحركة المقابلة:

الرقم	المفهوم	المقابل في الفيزياء/الرياضيات
🎬 B2	انفجار فضاء الحالة	الرياضيات التوافقية، النمو الأسي
🎬 B8	الانفجار التوافقي	نمو العاملي، شجرة البحث
🎬 A3	مقارنة عامل التفرع	نظرية الرسوم البيانية، بنية الشجرة
🎬 B5	معضلة دالة التقييم	التعيين غير الخطي

ملخص النقاط الرئيسية

الغو يُسمى "الكأس المقدسة للذكاء الاصطناعي" لأنه يجمع ثلاث مشاكل رئيسية:

1. لعنة الفضاء

10^170 وضع ممكن، أكثر بكثير من عدد ذرات الكون
عامل التفرع ~250، شجرة البحث تنمو بشكل انفجاري
البحث الشامل مستحيل فيزيائيًا

2. صعوبة التقييم

كل حجر قيمته متساوية، لا ميزة مواد
مفاهيم "السماكة" "النفوذ" "الآجي" المجردة يصعب قياسها
تقييم الوضع مشكلة غير خطية للغاية، شاملة

3. تحدي الوقت

المباراة ~250 حركة، تحتاج تخطيطًا طويل المدى
قرارات الافتتاح تؤثر على أوضاع بعد 50-100 حركة
المعارك المحلية والتوازن الشامل يحتاجان مراعاة متزامنة

هذه التركيبة من المشاكل جعلت طرق الذكاء الاصطناعي التقليدية (البحث الشامل + التقييم اليدوي) تفشل تمامًا في الغو.

واختراق AlphaGo كان لأنه استخدم الشبكات العصبية العميقة لحل مشكلة التقييم، البحث في شجرة مونتي كارلو لحل مشكلة التخطيط، والتعلم المعزز لحل مشكلة تجاوز البشر.

قراءات إضافية

المقال التالي: حدود الطرق التقليدية — من Minimax إلى MCTS، لماذا كلها غير كافية
تفاصيل تقنية: شرح شبكة السياسة — كيف تعلم AlphaGo "الحدس"
العودة للنظرة العامة: تحليل AlphaGo الشامل — دليل سلسلة المقالات

المراجع

Tromp, J. (2016). "Number of legal Go positions." — حساب دقيق لفضاء حالة الغو
Allis, L.V. (1994). "Searching for Solutions in Games and Artificial Intelligence." PhD thesis, University of Limburg. — تحليل نظري لتعقيد الألعاب
Müller, M. (2002). "Computer Go." Artificial Intelligence, 134(1-2), 145-179. — مراجعة أبحاث الغو الحاسوبي المبكرة
Silver, D., et al. (2016). "Mastering the game of Go with deep neural networks and tree search." Nature, 529, 484-489. — ورقة AlphaGo الأصلية

انفجار فضاء الحالة: معنى 10^170​

ما هو فضاء الحالة؟​

المقارنة مع عدد ذرات الكون​

فهم حدسي للأرقام​

لماذا فضاء حالة الغو كبير جدًا؟​

1. حجم اللوحة​

2. ثلاث حالات لكل نقطة​

3. الأحجار لا تتحرك​

كود توضيحي: تقدير فضاء الحالة​

لعنة عامل التفرع: 250 خيارًا في المتوسط​

ما هو عامل التفرع؟​

النمو الانفجاري لشجرة البحث​

لماذا فشلت طريقة ديب بلو في الغو​

الافتتاح له خيارات أكثر​

صعوبة التقييم: لا قيمة بسيطة للقطع​

ميزة المواد في الشطرنج​

الغو: كل حجر متساوٍ​

تجريد السماكة والنفوذ​

السماكة (Thickness)​

النفوذ (Influence)​

الآجي (Aji)​

لماذا فشلت دوال التقييم اليدوية​

الحاجة للتخطيط طويل المدى: 150 حركة في مباراة​

المراحل الثلاث للغو​

الافتتاح: التخطيط لما بعد 30 حركة​

الوسط: التوازن بين المحلي والشامل​

النهاية: الحساب الدقيق والانقلاب​

لماذا عدم النظر بعيدًا قاتل​

أهمية الحدس: "هذه الحركة تبدو صحيحة"​

طريقة تفكير اللاعبين البشر​

التعرف على الأنماط: رؤية النقاط المهمة في ثانية​

الوصف الرياضي للحدس​

لماذا يُسمى "الكأس المقدسة للذكاء الاصطناعي"​

معالم ألعاب اللوحات​

لماذا الغو خاص​

توقعات الأكاديمية​

ربط الرسوم المتحركة​

ملخص النقاط الرئيسية​

1. لعنة الفضاء​

2. صعوبة التقييم​

3. تحدي الوقت​

قراءات إضافية​

المراجع​