انتقل إلى المحتوى الرئيسي

للباحثين المتعمقين

هذا القسم مخصص للمهندسين الذين يرغبون في التعمق في دراسة الذكاء الاصطناعي للعبة الغو، ويشمل التنفيذ التقني والأسس النظرية والتطبيقات العملية.


نظرة عامة على المقالات

التقنيات الأساسية

المقالةالوصف
شرح تفصيلي لبنية الشبكة العصبيةالشبكة المتبقية في KataGo، ميزات الإدخال، تصميم الإخراج متعدد الرؤوس
تفاصيل تنفيذ MCTSاختيار PUCT، الخسارة الافتراضية، التقييم الدفعي، التوازي
تحليل آلية تدريب KataGoاللعب الذاتي، دوال الخسارة، دورة التدريب

تحسين الأداء

المقالةالوصف
واجهات GPU والتحسينمقارنة وضبط واجهات CUDA وOpenCL وMetal
تكميم النموذج والنشرFP16، INT8، TensorRT، النشر على منصات مختلفة
التقييم والاختبار المعياريتقييم Elo، اختبار المباريات، طرق SPRT الإحصائية

المواضيع المتقدمة

المقالةالوصف
بنية التدريب الموزععمال اللعب الذاتي، جمع البيانات، نشر النماذج
القواعد المخصصة والمتغيراتقواعد صينية ويابانية وAGA، متغيرات حجم اللوحة
دليل قراءة الأوراق البحثية الرئيسيةتحليل النقاط الرئيسية في أوراق AlphaGo وAlphaZero وKataGo

المصادر المفتوحة والتنفيذ

المقالةالوصف
دليل قراءة الكود المصدري لـ KataGoهيكل الدليل، الوحدات الأساسية، أسلوب البرمجة
المشاركة في مجتمع المصادر المفتوحةطرق المساهمة، التدريب الموزع، المشاركة المجتمعية
بناء ذكاء اصطناعي للغو من الصفرتنفيذ نسخة مبسطة من AlphaGo Zero خطوة بخطوة

ماذا تريد أن تفعل؟

الهدفالمسار المقترح
فهم تصميم الشبكة العصبيةشرح بنية الشبكة العصبيةتفاصيل تنفيذ MCTS
تحسين أداء التنفيذواجهات GPU والتحسينتكميم النموذج والنشر
دراسة طرق التدريبتحليل آلية تدريب KataGoبنية التدريب الموزع
فهم مبادئ الأوراق البحثيةدليل قراءة الأوراق الرئيسيةشرح بنية الشبكة العصبية
البرمجة العمليةبناء ذكاء اصطناعي للغو من الصفردليل قراءة الكود المصدري لـ KataGo
المشاركة في المشاريع مفتوحة المصدرالمشاركة في مجتمع المصادر المفتوحةدليل قراءة الكود المصدري لـ KataGo

فهرس المفاهيم المتقدمة

عند التعمق في البحث، ستواجه المفاهيم المتقدمة التالية:

سلسلة F: القياس (8 مفاهيم)

الرقممفهوم الغوالمقابل في الفيزياء/الرياضيات
F1حجم اللوحة مقابل التعقيدقياس التعقيد
F2حجم الشبكة مقابل قوة اللعبقياس السعة
F3وقت التدريب مقابل العائدقانون تناقص العوائد
F4كمية البيانات مقابل التعميمتعقيد العينة
F5قياس موارد الحوسبةقوانين القياس
F6قوانين القياس العصبيةالعلاقة اللوغاريتمية المزدوجة
F7التدريب بدفعات كبيرةالدفعة الحرجة
F8كفاءة المعلماتحدود الضغط

سلسلة G: الأبعاد (6 مفاهيم)

الرقممفهوم الغوالمقابل في الفيزياء/الرياضيات
G1التمثيل عالي الأبعادالفضاء المتجهي
G2لعنة الأبعادمعضلة الأبعاد العالية
G3فرضية التشعبالتشعب منخفض الأبعاد
G4التمثيل الوسيطالفضاء الكامن
G5فصل الميزاتالمكونات المستقلة
G6الاتجاه الدلاليالجبر الهندسي

سلسلة H: التعلم المعزز (9 مفاهيم)

الرقممفهوم الغوالمقابل في الفيزياء/الرياضيات
H1MDPسلسلة ماركوف
H2معادلة بيلمانالبرمجة الديناميكية
H3تكرار القيمةنظرية النقطة الثابتة
H4تدرج السياسةالتحسين العشوائي
H5إعادة التجربةأخذ العينات الأهمية
H6عامل الخصمالتفضيل الزمني
H7تعلم TDالتقدير التزايدي
H8دالة الميزةخط الأساس لتقليل التباين
H9قص PPOمنطقة الثقة

سلسلة K: طرق التحسين (6 مفاهيم)

الرقممفهوم الغوالمقابل في الفيزياء/الرياضيات
K1SGDالتقريب العشوائي
K2الزخمالقصور الذاتي
K3Adamحجم الخطوة التكيفي
K4تناقص معدل التعلمالتبريد
K5قص التدرجحد التشبع
K6ضوضاء SGDالاضطراب العشوائي

سلسلة L: التعميم والاستقرار (5 مفاهيم)

الرقممفهوم الغوالمقابل في الفيزياء/الرياضيات
L1فرط التخصيصالتكيف المفرط
L2التنظيمالتحسين المقيد
L3Dropoutالتنشيط المتفرق
L4زيادة البياناتكسر التناظر
L5التوقف المبكرالتوقف الأمثل

متطلبات الأجهزة

للقراءة والتعلم

لا توجد متطلبات خاصة، أي حاسوب يكفي.

لتدريب النماذج

الحجمالأجهزة المقترحةوقت التدريب
صغير جداً (b6c96)GTX 1060 6GBعدة ساعات
صغير (b10c128)RTX 3060 12GB1-2 يوم
متوسط (b18c384)RTX 4090 24GB1-2 أسبوع
كامل (b40c256)مجموعة GPU متعددةعدة أسابيع

المساهمة في التدريب الموزع

  • أي حاسوب مع GPU يمكنه المشاركة
  • يُنصح بـ GTX 1060 أو ما يعادلها على الأقل
  • يتطلب اتصال إنترنت مستقر

ابدأ القراءة

يُنصح بالبدء من هنا: