جذبت الألعاب اللوحية مبرمجي الذكاء الاصطناعي الأوائل لعدة أسباب منها أنها تمتلك ظروفًا مناسبة لتطوير وامتحان برامجهم، وقد لخصها آرثر صاموئيل في الشروط التالية: لمثل هذه الألعاب نهايات واضحة مثل فوزٍ أو خسارة أو تعادل، والفوز هو الهدف المحدد للعبها، وهي ليست ألعاباً مختومة أي لا علم لنا بالمنتهى قبل البدء، وهي تتبع قواعد محددة، ونملك تاريخًا ثريًّا من مباريات لاختبار البرامج قياساً عليها، وأخيراً هنالك عددٌ كافٍ من الأشخاص على دراية بهذه الألعاب.
في هذه المقالة سنعرض أربع ألعاب لنتتبع مسار الذكاء الاصطناعي في مواجهة الأبطال البشر ضمن سلسلة عن المواجهات بين الإنسان والآلة بدأت مع الحركة اللاضية، الألعاب هي لعبة طاولة الزهر، والدامة، والشطرنج، وغو، كل لعبة مختارة لتمثل التطور في مجال الألعاب لكن كاتب المقالة لا يدعي إحاطتها بكل البرامج والإنجازات في كل لعبة، والهدف الثاني من هذه المقالة هو رسم تشبيه ثلاثي الأطوار في ديناميكية بين الإنسان والذكاء الاصطناعي، نطوّعه أداةً ثم نلقاه خصمًا وأخيرًا نسترشد به كما لو أنه علّامة.
"اه لو لعبت يا زهر"
طاولة الزهر مشهورة في الوعي الجمعي الشامي، سواء في المقاهي أو في الكثير من المسلسلات السورية هنالك رقعة ولقطة لطاولة الزهر، وفي هذه اللعبة التي تضرب جذورها في تاريخ الشرق الأوسط لما يقارب الخمس آلاف سنة نجد أوائل المواجهات التي تغلب فيها الذكاء الاصطناعي على بطل بشري، في سنة 1975 فاز برنامج BKG 9.8 على لويجي فيلا في أربع أشواط وخسر واحدة فقط في مباراة استعراضية جائزتها خمسة آلاف دولار.
BKG 9.8 برنامج كمبيوتر طوره هانز برلينر الذي كان يقود أيضًا فريق للعبة الشطرنج HiTech، يُقرُّ برلينر بأن تحليل مجريات المباراة يؤكد أن فيلا كان أمهر وقد كانت حركاته أفضل في الغالب مما كان سيختاره البرنامج لو انعكست الأدوار، وأن الزهر لعب دورًا في التخفيف من خطئين ارتكبهما برنامجه، عنصر حظ في لعبة الطاولة ليس موجودًا في سائر الألعاب ويزيد من تعقيدها واحدٌ وعشرون نتيجة لرمي الزهر، تحتوي اللعبة على ما يصل إلى 1020 ترتيبًا للقطع مما يجعلها معقدة مثل لعبة الدامة، ومع أن الحركات تعتمد على الزهر لكن الزهر لا يخبر اللاعب بالحركات الصحيحة فتلك تتطلب الذكاء والخبرة.
المواجهة مع فيلّا نحسبها إنجازًا للذكاء الاصطناعي لكن هانز برلنر يظن أن فيها شائبة، فهي كانت مباراة استعراضية أي أنها لم تجرِ وفق القوانين الصارمة لمباراة بطولة، كما أن فيلّا ربما لم يأخذ البرنامج على محمل الجد أثناء اللعب.
كي يبرمج برلنر BKG ليهزم فيلّا، استخدم هو وفريقه ما لقّبه بال SNAC ، وهو اختصار للسلاسة (Smoothness) واللاخّطية (Non-Linearity) ومعاملات التطبيق (Application Coefficients). أما السلاسة فهي تشير إلى منحنى أحوال اللعبة، ففي لعبة الشطرنج مثلًا هناك مرحلة افتتاحية ثم متوسطة ثم نهائية، وكل مرحلة تحمل اعتبارات تكتيكية مختلفة، إذا لم يكن البرنامج على دراية بأي مرحلة هو سوف يسيء الاختيار، وظيفة السلاسة هي جعل البرنامج يخطو بثبات بدون قفزات حادة بين المراحل المختلفة. أما اللّاخطية فهي تسمح بمزيد من الحساسية والتنوع في طريقة اللعب، ومعاملات التطبيق هي المتغيرات التي ترفع من حساسية البرنامج دون تقلبات قوية في طريقة لعبه.
لم يكن هذا البرنامج هو الأخير في محاولة توظيف الذكاء الاصطناعي في لعبة طاولة الزهر، لقد برمج لاحقاً جيرالد تيسارو Neurogammon الذي يستخدم شبكات عصبية متعددة الطبقات تعلمت اللعب من خلال التدريب عبر الانتشار الخلفي (Back propagation) على مجموعة من 400 لعبة لعبها خبراء الطاولة مسبقًا، وسنجد أن هذه العادة في نهاية المطاف شكلت إحدى أقوى برامج الذكاء الاصطناعي لكن كي لا نستبق الأحداث لنكمل الحديث عن برنامج تيسارو، الشبكات العصبية لها طبقة مخفية وبنية تغذية أمامية قياسية، وقد فاز برنامجه في أولمبياد الكمبيوتر لعام 1989 في لندن ضد خمسة خصوم من البرامج كما لعبت ضد بشري[i]، لكنها خسرت تلك المباراة بعد أداء أثنى عليه خصمها.
ولم يتوقف تيساريو عند ذلك الحد، ففي نظره لم يكن الاعتماد على أمهر اللاعبين البشر خطوة سديدة إذ لا عصمة لهم، لذلك تضمن برنامجه الجديد TD-Gammon شبكات بنية إدراك قياسية متعددة الطبقات (MLP) ليترك البرنامج يلعب ضد نفسه دون إدخال أفكار معينة عن طريقة اللعب سوى القواعد الأساسية، لاحظ أن البرنامج يبدأ باستنباط الاستراتيجيات والتكتيكات الأساسية، بعد مئتي ألف لعبة يمسي تقريبًا بجودة برنامجه السابق، بعد عبور ذلك الحد أضاف إليه الميزات لتحسّن من لعبه، وبهذا يكون برنامجه مثال مبكر على الذكاء الاصطناعي في آخر صوره كما سنوضح واتضح لاحقًا.
لم يلعب برنامجه الجديد بطولة رسمية لكن بعد تدريبه على مليون ونصف لعبة أتيح له لعب 38 مباراة استعراضية ضد لاعبين محترفين من البشر ومنهم بطل العالم آنذاك جو سيلفستر، كما اقترب من الفوز على بيل روبرتي بطل العالم لمرتين، وبعد أن أجرى لاعب بارز آخر تحليلًا مكثفًا لتلك الألعاب خلص إلى أن هذا البرنامج له الأفضلية على البشر في اللعب الموضعي، وأن قوته تكمن في الحكم على موضع اللعبة على عكس برامج الشطرنج التي تجيد الحساب التكتيكي.
لم يتخطى البرنامج أبطال اللعبة لكنه لامس طوره الأخير كعلّامة عندما اكتشف أحد اللاعبين أن البرنامج يفضل افتتاحية معينة بينما كان يفضل البشر افتتاحية أخرى وشاع بعد ذلك خيار البرنامج، لذلك يمكن القول بأننا ما زلنا في مرحلة الخصومة، ولعل نسخة مستقبلية من مسلسل مرايا تحتوي على لقطة يلعب فيها ياسر العظمة ضد برنامج ذكاء اصطناعي.
للمبرمجين الراغبين في قراءة المزيد من المعلومات التقنية عن البرامج المذكورة إليكم الأوراق البحثية عن برنامج برلنر، وبرنامج نيوروغامون، وتي دي غامون.
ماريون تينسلي الرهيب
عندما تقلب طاولة الزهر وتضع القطع على مربعات لوح الشطرنج فأنت تستطيع لعب الدامة أو الضامة، يبدأ تاريخ الآلات التي تلعبها في آواخر القرن التاسع عشر مع آلة توهم الرائي بأنها لاعب آلي لكنها في الحقيقة ميكانيكية محكمة خلف كواليسها لاعب بشري متمرس تندر خسارته ويحرك القطع دون أن يراه الخصم، وكان اسم الآلة "العجيب"، وهذا ليس ترجمة لاسم الأداة من الإنجليزية بل أنجلزَ مخترعُها كلمة العجيب من العربية، وللربط بين العرب والهندسة في مخيلة الغرب سوابق تاريخية لعل أشهر أمثلتها هو ساعة مائية أهداها الخليفة هارون الرشيد إلى شارلمان نظيره في الإمبراطورية الرومانية المقدسة، والتي احتوت على مجسمات فرسان تتحرك مع الدقات.
أما من حيث الذكاء الاصطناعي فقد بدأت رحلة البرمجة مع آرثر لي صموئيل الذي أشهر مصطلح "التعلم الآلي" في خمسينات القرن الماضي، وقد اعتبر البعض برنامجه أول برنامج حاسوب يتعلم بذاته وأول برنامج ذكاء اصطناعي يوفي بعمله.
كان البرنامج يتطلع إلى الأمام من خلال شجرة بحث خطية متعددة الحدود، وتقيّم الخطوات الممكنة وفق مقاييس تتحسن من خلال التعلم الذاتي، أو بمعنى آخر، يقوم البرنامج بتصوّر مآلات اللعبة من ترتيب القطع على اللوحة ويقيس أفضلية ترتيبٍ على آخر وفق مقاييس معينة، مثل عدد القطع وأماكنها، لكن عدد الحركات التي يتأملها مقيد بما تسمح له قدرات الحواسيب حينها، لتوفير وقت الحوسبة وضع بعض الشروط ليوقف صفنة البرنامج بالمستقبل الممكن، مثلًا إذا كانت الحركة التالية أو الأخيرة قفزة يوقف البحث، ولو لم يتأتى هذا الشرط يتوقف الجهاز على أي حال بعد إحدى عشرة خطوة.
لقد استخدم صموئيل فكرة minmax والتي ساعدت في اختصار الاحتمالات التي على الجهاز التفكر بها، ببساطة يسعى البرنامج لإيجاد مسارٍ يحاول فيه الحصول على القيمة القصوى من ترتيب الأحجار ويفترض اختيار الخصم مسار فيه أسوأ احتمال، بعد اختيار هذا الوجهة المستقبلية يؤدي الحركة التي توصله إلى هناك، ويعيد تقييم الموقف مع كل حركة من الخصم.
لم يُبلِ البرنامج بلاءًا حسنًا ضد خصوم بشريين، على الرغم من أنه استغرق من 8 إلى 10 ساعاتٍ فقط من التعلم حتى تغلب على المبرمج نفسه والذي يمكن اعتباره مبتدئًا، في عام 1966 ، استضافت شركة IBM بطولة الدامة بين والتر هيلمان وديريك أولدبري بشرط أن يلعبا ضد البرنامج، الذي خسر الأشواط الثمانية، لكنه عرضٌ أكسب الشركة 15 سهمًا، لاحقًا خسر أمام برنامج آخر برمجه إريك جنسن وتوم تروسكوت، وفي عام 1979 أرادا فرصة للعب ضد ماريون تينسلي، بطل العالم والملقب بتينسلي الرهيب، لكنهما لم يملكا ما يكفي لمقابلة رهان اتحاد لعبة الداما بقيمة 5000 دولار، كما أن تينسلي الرهيب عاين ست ألعاب من برنامجهم واعتبره بمستوى الهواة، وقال "ربما في يوم من الأيام سيحقق المبرمجون قفزةً حقيقية، ولكن حتى ذلك الحين فليتصرفوا مثل علماء ويمتنعوا عن تباهٍ غير مبرر بذريتهم" أي ببرنامجهم.
بعدها بعقدٍ بدأ المبرمج الرئيسي لبرنامج تشينوك، جوناثان شيفر، رحلته لمواجهة تينسلي، لكن شيفر في البداية وضع بطولة الشطرنج نصب عينيه، فهو لعب الشطرنج في سن مبكرة، وعندما كبر طوّر برنامج شطرنج يسمى بروديجي ثم تركه وبرمج فينيكس، وقد لاقى فينيكس نجاحًا حين تعادل على المركز الأول في بطولة العالم للكمبيوتر في عام 1986، لم يكن شيفر استثناءًا في المجتمع البرمجي الذي صب معظم تركيزه على على الشطرنج لعد أسباب أحدها الاعتقاد الخاطئ بأن صموئيل قد حل لعبة الدامة، لكن محادثة بسيطة سأل شيفرَ أحدُهم عن لعبة الدامة دفعته في اتجاهها، وبعد يوم واحد من بطولة الشطرنج عام 1989 قرر إعادة توجيه جهوده وعمل مع فريق سيضم في مراحل مختلفة عدة مساهمين منهم نورمان تريلور، لاعب دامة خبير أرسل بريدًا إلى شيفر يدعوه لبرمجة حاسوب يتقن اللعبة، تعاون الرجلان واعتنى شيفر بالتصميم بينما سخّر تريلور خبراته في اللعب.
كما فعل صموئيل قبلهم، كان للبرنامج آلية لتقييم موضع اللعبة، وكان السر في تصميم برنامج قادرٍ على مواجهة بطل العالم في هذه اللعبة يكمن في عدة مواضع إحداها هو تعيين المقاييس المناسبة لكل موضع، ونستخدم كلمة موضع هنا للإشارة إلى ترتيب كل القطع على الرقعة، ببساطة يجب على البرنامج أن يدرك بدقة عالية أهمية كل قطعة وكل حركة وكيف يفاضل باستخدام الأعداد بين موضع وآخر، ولذلك قضى الفريق الكثير من وقتهم في دوزنة الأوزان على مر السنين عبر التجربة والخطأ، سواء عندما يلعب تريلور بنفسه ضد البرنامج أو بعد مشاركة البرنامج في البطولات، وبما أن لعب مباريات البطولة مؤقت، وجب على التقييم أن يوفر الوقت ولذلك ابتكروا نوعين من التقييم، سريع وكامل، ليحدد السريعُ ما إذا لَزِمَ الكامل.
يختلف التغيير اليدوي في التقييم عن TD-Gammon نظرًا لأن المبرمج البشري يقوم بذلك بدلًا من ترك الأمر بيد البرنامج المجازية، وفي هذا التدخل البشري المفرط نشوزًا عن رؤية صموئيل الذي أراد أن يتعلم البرنامج من تلقاء نفسه، بينما لم يجد شيفر مبررًا للتخلي عن تراكم الخبرة البشرية، فكل اللاعبين البشر يدرسون ما سبقهم من معارف متعلقة باللعبة، من افتتاحيات معهودة وألعابٍ مشهورة، لكن شيفر والفريق لم يسكبوا المعارف هذه في البرنامج ليصير أداة بحثٍ بسيطة، وإنما تركوه يحلل الألعاب السابقة لتفادي بعض الأفخاخ الممكنة، مثلًا أثناء التحضير لإحدى المباريات ضد تينسلي، حلل البرنامج أكثر من 700 مباراة ولعب ألعابًا مماثلة للبحث عن أفضل الحركات، والمثير للدهشة أن تينسلي كان يختار دائمًا أفضل حركة ممكنة، حتى عندما وجد الفريق بعض الحركات التي ظنوها خاطئة اكتشفوا لاحقًا أنها حقًا الأصح وأن البرنامج هو القاصر عن فهم عمق حركات تينسلي.
قبل المواجهة الأخيرة جاءت العديد من المواجهات مع خصوم من بشر وحواسيب، أول لاعب خبير بشري تمكن شينوك من الفوز عليه هو الكندي إد طومسون، بطل اللعبة السابق لكنها لم تكن لعبة في ظروف رسمية، ثم نال البرنامج المركز الأول في أولمبياد الكمبيوتر لعام 1989 وبطولة ولاية ميسيسيبي لعام 1990، والمرتبة الثانية في البطولة الوطنية الأمريكية لعام 1990 وأولمبياد الكمبيوتر لعام 1990.
وعلى الرغم من تفوقه على خصوم من الأوزان الثقيلة إلا أنه خسر أمام تينسلي في أول مواجهة بينهما في عام 1990 ومرة أخرى في مباراة بطولة العالم للإنسان والآلة عام 1992، كما خسر أمام دون لافيرتي، الذي كان يعتبر البطل الثاني بعد تينسلي في عامي 1991 و1993، لذا دأب الفريق على تحسين البرنامج مع الوقت وتمكن من نيل التعادل مع كليهما في عام 1994، وأثناء كل التغييرات الممكنة اختلف شيفر ونورمان حول كتاب الافتتاحيات وانسحب الآخر من الفريق لأن شيفر اتبع سبيلًا مختلفًا حسّن من أداء الجهاز على حساب جرأته وخيارات نورمان، ثم لسوء الحظ اضطر تينسلي إلى الانسحاب من المواجهة الأخيرة بسبب ظروفه الصحية وتم منح لقب بطل العالم لبرنامج تشينوك، رفض الكثيرون ذلك واتهم العديد فريق المبرمجين بعدم مراعاة ظروف البطل، لكنها اتهامات باطلة إذ تولد مع الوقت صحبة بين شيفر وتينسلي وحرص شيفر على راحة تينسلي في شروط اللعبة، كما أشاد تينسلي بأسلوب لعب تشينوك الذي أعاد إليه ذكريات شبابه قبل أن يخاف منه خصومُه وينعكس ذلك على حرص مبالغٍ أثناء اللعب ضده.
في العام المقبل، أثبت تشينوك قدراته وأحقيته عندما فاز ببطولة العالم للإنسان والآلة ضد لافيرتي. ومع أن شيفر لم ينل شرف الفوز ضد تينسلي إلا أنه استمر في تطوير البرمجة التي تبحث في مآلات اللعبة حتى تمكن أخيرًا من أن يختمها، وكيف للعبة مثل الدامة أن تُختم؟ يقول أن هنالك ثلاث مستويات لختم لعبة من هذا النوع، الأولى ضعيفة للغاية وهي أن تحدد نتيجة اللعب المثالي دون معرفة الاستراتيجية، والثانية ضعيفة تحدد النتيجة والاستراتيجية، وهذا هو المستوى الذي ختم فيه شيفر وزملاؤه لعبة الدامة، وأثبتت أن اللعب المثالي يؤدي إلى التعادل. أخيرًا، الختمة القوية تعني حساب جميع المواضع الممكنة فيها، ولكن الأرقام الفلكية تتطلب إلى قدرات حاسوبية ضخمة وفي بعض الألعاب مثل الدامة حاليًا وهناك ألعابٌ مثل الشطرنج لن تُختم ولن يحصل ذلك في المستقبل المنظور وفقًا لشيفر بسبب العدد الكبير من المواضع الممكنة، فإن احتماليات المواضع في الشطرنج تساوي مربع مواضع لعبة الدامة وبالتالي لن تُحل في أي وقت قريب ما لم تتطور تقنية جديدة.
وليست لعبة الدامة هي أول لعبة مختومة، سبقها في عام 1989 وبعد سنوات قليلة بضع ألعاب، مثلًا في Connect Four تكون النتيجة دائمًا فوز اللاعب الذي يُعطى الحركة الأولى وكذلك الحال في لعبتي Go-Moku وQubic.
وأخيرًا، فإن في قصة لعبة الدامة تداخل بين مرحلة الخصم والعلّامة، عندما كان شينوك خصمًا جديرًا لتينسلي الرهيب، في مباراة بينه وبين إلبرت لودر طالت حتى ضاقا ذرعًا بها، قررا أن يُحَكِما شينوك ليعلن أنها تعادل، كيف لبطلين من البشر أن يثقا في قرار الكمبيوتر لولا أنه أخِذ على مجمل الجدية وبات أكثر من مجرد أداة.
للمبرمجين الراغبين في قراءة المزيد من المعلومات التقنية عن البرامج المذكورة يمكنكم قراءة كتاب شيفر عن رحلته مع التنويه لأنه مليء بتفاصيل حياته الشخصية وتعليقاته التي لا تفيد من الناحية التقنية، ويمكن الاطلاع على الورقة البحثية لختم لعبة الدامة والورقة عن برنامج آرثر صموئيل.
كش مات: الشطرنج
الشطرنج مضرب المثل في الألعاب التي تتطلب الذكاء والتفكير الاستراتيجي، وليس غريبًا أن آلان تورينج كان يعدّها معيار لقدرة التفكير الآلي، فهو مثل آرثر صموئيل كان مهتمًا بتعليم الكمبيوتر كيفية التفكير، وأرادا صنع آلة يمكنها أن تتعلم حتى تنافس الإنسان. ولذلك كان تورينج من أوائل من كتبوا برنامجًا للشطرنج يسمى Turochamp، ولكنه سبق عصره ولم تكن الحواسيب قادرة على تشغيله.
يدين الذكاء الاصطناعي وعلوم الحاسوب بالكثير لرؤية تورينج، وربما حددت أفكاره حول كيفية تفكير الآلات كيفية تفكير المبرمجين في الآلات، وربما صار هدفه من برمجة ما ينافس البشر بذرة لاعتبارنا الذكاء الصناعي خصمًا لا أداة.
أما الأداة الأولى التي لعبت الشطرنج لم تكن حاسوبًا بل آليًا مثل العجيب، وكان اسمها التركي الميكانيكي، لعبت الشطرنج بنفس الخدعة وفازت ضد معظم اللاعبين بمن في ذلك نابليون بونابرت وبنجامين فرانكلين، لكنها لم تفكر بنفسها لتحتسب ذكاء اصطناعيًا. أول محاولة جمعت بين الآلة والتفكير كانت على يد المهندس الإسباني ليوناردو توريس إي كيفيدو في عام 1912 الذي اخترع آلة "el Ajedrecista"، لم تخفِ أي إنسان ولكنها لم تكن قادرة على لعب لعبة كاملة، فقط تمكنت من اللعب بملك وقلعة ضد خصم يملك ملكًا فحسب.
أما الورقة الأولى التي وضعت الأسس لبرنامجٍ يمكنه لعب الشطرنج كتبها كلاود شانون، أولًا قدّر استحالة إجراء بحث يغطي كل حركة ممكنة لأن اللعبة النموذجية قد تستغرق 40 حركة ولكل خطوة 103 احتمالات مما يعني 10120 احتمالًا، عدد الاحتمالات في ألعاب الشطرنج أكبر مما يمكن حتى لقوى الحوسبة المعاصرة تحليله، ولذا يقتصر بحث البرنامج على بعض الخطوات وفق قدراته الحاسوبية، كما يستخدم البرنامج minmax الذي ترسّخ في برامج الألعاب اللوحية لقدرته على اختصار أعدادٍ الاحتمالات الضخمة.
مثال آخر على فكرة مستخدمة في ألعاب أخرى هو استخدام استراتيجيات مختلفة للمراحل المختلفة من اللعبة، وهذا عنى وجود كتاب للافتتاحيات. بالنسبة لمرحلة نهاية اللعبة، تم تعميم مفهوم قواعد بيانات نهاية اللعبة من قبل كين ثومبسون، الذي كتب برنامج لعبة Belle ، بينما عمل جو كوندون على الجزء الصلب من الحاسوب، وكان Belle أول حاسوب يحقق تصنيف خبير في الشطرنج كما فاز بعدة بطولات، عمل ثومبسون على بناء الكتاب الافتتاحي بتخصيص ساعة واحدة يوميًا لمدة ثلاث أعوام كي يدخل الحركات من موسوعة افتتاحيات الشطرنج المكونة من خمسة مجلدات، قبل أن يملك لاحقًا القدرة على أتمتة هذه المهمة.
وكما ذكرنا سابقًا كان مجتمع المبرمجين يميلون لبرمجة الشطرنج، كلٌ من شيفر وبرلينر المذكورين في الأجزاء السابقة عملا في مرحلة ما على برامج الشطرنج الخاصة بهما، Phoenix و HiTech، إضافة إلى العديد من المبرمجين الآخرين وبرامجهم التي تفاوتت بثمنها وقوتها، ومع ذلك فإننا عندما نفكر في برنامج للشطرنج يتبادر للذهن ديب بلو، والذي بدأت رحلته على يدي فينغ هسيونغ هسو قبل اثني عشر عامًا من تلك المواجهة المشهورة، آنذاك كان طالبًا في جامعة كارنيجي ميلون واتصل به فريق HiTech ليعمل معهم، لكنه اختلف مع نهجهم في بناء حاسوبهم وفي المنطق المستخدم، مما ولّد خلافًا مريرًا مع السيد برلينر الذي ترأس مشروع HiTech ونمت عداوة بين الاثنين استمرت لسنوات، أحد الفروق التي أعطت لهسو الأفضلية كما أثبت الزمن هو الاتكال على مكمن قوة الحاسوب في البحث الشامل بينما كان برلنر، ربما بحكم كونه بطل العالم في لعبة الشطرنج عن بُعد لثلاثة أعوام، يحاول برمجة الحاسوب ليفكر بانتقائية كما يفعل البشر.
في البداية بدأ تصميمه الخاص على حاسوب أسماه Chiptest، يحتوي على ثلاثة مكونات رئيسية، مولد الحركة للعثور على الحركة، دالة التقييم لتقييم جودة المواضع، والمتحكم البحثي الذي يحلل تسلسل الحركات المفحوصة.
لم يعمل هسو بمفرده في كارنيجي ميلون، انضم إليه موراي كامبل، وتوظفّا لاحقًا في شركة IBM للعمل على خليفة Chiptest وهو Deep Thought مع آخرين كما حصلا على مساعدة العديد من لاعبي الشطرنج وبالطبع مساعدة من كين ثومبسون في أكثر من موضع.
تنافس برنامجهم مع خصوم بشريين وانتهت المواجهات بنتائج مبهرة، كان برنت لارسن أول أستاذ كبير (Grand Master) يهزمه حاسوبٌ في مباراة بشروط البطولة، كما نال مرتبة متقدمة على ستة أساتذة كبار مما جعله يكسب نيشمًا آخر، من المفارقة نشير إلى أن كاسباروف في وقت سابق من ذلك العام ادّعى أن الحواسيب لا يمكنها هزيمة الأساتذة الكبار في المستقبل القريب.
بينما يعرف معظم الناس عن المباراة الشهيرة في عام 1997، هناك حقيقتان أقل شهرة، إحداها هي أن حاسوب لوجيستيلو فاز في لعبة أوثيلو على البطل تاكيشي موراكامي، والثانية هي أن كاسباروف سبق ولعب سابقًا لعبة استعراضية في 1989 مع نسخة أقدم كما لعب في العام المنصرم ضد سلف البرنامج، Deep Blue Jr. وانتصر بالمباراة ككل، لكن Jr انتزع فوزًا في أحد الأشواط ليكون أول حاسوب يحقق فوزًا على بطل العالم وينذر بما هو آتٍ.
قبل مباراة الإياب أجرى الفريق تغييرات واختبارات كبيرة وحسنوا من الكتاب الافتتاحي وأضافوا أداة تكتشف الأخطاء، وكانت التدريبات تعتمد على مساعدة نشطة من عدة أساتذة كبار، منهم من ملك خبرة باللعب ضد الحواسيب، ومنهم من لعب بشكل يومي مع إتاحة إمكانية التراجع عن بعض الخطوات بقصد استكشاف أي تقصير في خوارزميات الحاسوب لتحسينها.
أخيرًا، كان الفريق جاهزًا، صار برنامج Deep Blue أسرع من Deep Blue Jr بمقدار 5-10 مرات، بسرعة بحثٍ تصل مئتي مليون موضع في الثانية. في مباراة الإياب فاز الحاسوب مرتان، وفاز كاسباروف مرة واحدة، وتعادلا في ثلاث، ومع أن هناك الكثير مما يمكن قوله عن هذه المباراة لكن في سياق المقالة يمكن الاكتفاء بالإشارة إلى أن بعض الأرقام المهولة في الذكاء الاصطناعي قد تعطي انطباعًا خاطئًا عن القدرات الحقيقية في تحقيق الغاية، مثًلا رقم 200 مليون موضع في الثانية من الصعب علينا تخيله أصلًا، لكنه لم يُحَصّن البرنامج من الخسارة والتعادل أمام البشر، مما يعني أن العقل البشري يتمتع بمنطق يتحرك بطريقة مغايرة تغنيه عن الحاجة لحوسبة فلكية أو أن هذه الأرقام لا تساوي الأفضلية.
يمكننا التوقف قليلًا للإشارة إلى بعض المواقف التي تعكس عمق تحليل اللاعبين البشر أيضًا، في إحدى المباريات بين برنامج Deep Thought وبرينت لارسين تحرك البرنامج وكأنه يقدم بيدقًا دون فائدة ظاهرة، لكن لارسين رفض أخذه وفقًا لحدسه، وتبيّن لاحقًا أنه لو فعل لظهرت العاقبة لاحقًا، وفي مباراة مع تسي جون، أول لاعبة آسيوية تكسب لقب أستاذة كبيرة، اكتشف البرنامج حركة ممتازة ولاحظ هسو أنها أخذت وقتها لكنها لم تجد تلك الحركة، وحصل ذلك مرة ثانية، وبعد المباراة سألته ما إن فاتتها حركة ما وعندما حلل اللعبة أكّد لها ذلك، وسابقًا مع تينسلي في مباراة لم تكن ضد تشينوك شعر بأن حركة ما ستدفع اللعبة إلى تعادل دون أن يدرك كل الخطوات التي ستؤدي إلى ذلك التعادل، ولرغبته بالفوز اختار حركة ثانية وبعدها أخطأ خصمه ليفوز تينسلي، وبيّن تحليل تشينوك أن حدسه صدقه، ما نسميه حدسًا يعكس في لحظات مماثلة عمق تحليل الأساتذة الكبار دون تخطيط واعٍ بكل خطوة تفضي إلى ما أملى عليهم "حدسُهم".
تم تفكيك حاسوب Deep Blue مباشرة بعد المباراة، وأخذت حواسيب الشطرنج بالتطور المطرد، أقواها مؤخرًا Stockfish وKomodo وFritz، جرت آخر مواجهة بين بطل العالم وحاسوب في عام 2006، في مباراة فلاديمير كرامنيك، الذي انتزع البطولة من كاسباروف في مطلع الألفية، ضد Deep Fritz، تعادلا في أربعة أشواط وفاز الجهاز في اثنتين، علّق أستاذ علوم الكمبيوتر مونتي نيوبورن من جامعة ماكجيل، متسائلًا ما الفائدة المرجوة منذئذ فصاعدًا في مواجهة الحواسيب، وأن برمجة أجهزة الكمبيوتر لأغراض المنافسة يجب أن تصب تركيزها على لعبتي البوكر ولعبة غو[ii].
لكن لعبة الشطرنج ككل لم تتأثر سلبًا، فهي لا تزال تتمتع بشعبية عالمية، ولعل شهرة مسلسل مناورة الملكة المبني على رواية خيالية مثال على ذلك، وكذلك لم تتوقف بطولات بين اللاعبين البشر مقابل جوائز قيّمة، مباراة هذا العام بين الصيني دينغ ليرين والروسي إيان نيبومنياشتشي في أستانا جائزتها 2 مليون يورو (60٪ للفائز و 40٪ للوصيف)
انتقال الذكاء الصناعي من أداة لخصم لعلّامة ظاهرٌ في لعبة الشطرنج، بدايةً تمكن فريق Deep Blue من حل مشكلة شطرنج كلاسيكية كانت تتطلب بحثًا بعمق 35 حركة باستخدام بحث ثمان حركاتٍ فقط باستخدام امتدادات مفردة (Singular Extensions)، يمكن اعتبار هذا طور الأداة، كاسباروف بنفسه ساعد فريدريك فريدل على إنشاء قاعدة بيانات لألعاب الشطرنج تسمى Chess Base، كما تدرب على المباراة ضد Deep Blue لاحقًا من خلال اللعب ضد حواسيب الشطرنج التجارية، في حين أن طَور الخصومة نستشفّه في الرحلة الشاقة لهسو وكامبل وبقية الفريق، أما صيرورة الذكاء الاصطناعي علّامة جاء بعد فترة وجيزة، حين باتت برامج الشطرنج ترشد اللاعبين الصاعدين والصغار الذين يتدربون من خلال اللعب ضده على عكس الأبطال القدامى الذين تدربوا بقراءة أدب الشطرنج البشري، كما أن هنالك حركات صارت تصنف بأنها حركات حاسوب لأنها تختلف عن حركات البشر فهي لا تحترم الأعراف النمطية والاعتبارات الجمالية وفي المقابل تتمتع ببُعد نظرها الاستراتيجي الذي قد يصعب على الخصم البشري توقع عمقه وفقًا لكامبل.
علامة أخرى على طور العلّامة هي مباراة جرت بعد عام من خسارته أمام Deep Blue، وكانت بين كاسباروف وفيسيلين توبالوف، فيما يعرف الأسلوب بقنطور الشطرنج، وهي طريقة لعبٍ تسمح للاعب البشري الاستعانة بالحاسوب وكأنهما كائن واحد مثل الكائن الخيالي الذي يجمع نصف إنسان ونصف حصان، أقيمت المباراة من ستة أشواط في إسبانيا بين كاسباروف بمساعدة Fritz 5 وتوبالوف بمساعدة Chess Base 7 وانتهت المباراة بالتعادل.
أما طريقة الشطرنج الحر التي تسمح لكل لاعب أي شكل من أشكال التشاور أتاحت لهاويين، ستيفن كرامتون وزاكاري ستيفن، الفوز في بطولة بمساعدة قاعدة البيانات طوراها بأنفسهم.
هل هناك أملٌ في فوز البشر على حواسيب الشطرنج؟ أفضل ما يمكن فعله أي بشري هو محاولة اللعب ضد محرك شطرنج مع إعاقة تقلل من قوته[iii]، مثل التقليل من القطع أو الحد من الحركات، وبهذا خسر برنامج Komodo المعاق بالبدء دون أحصنته أمام ديفيد سميردون في خمس أشواط مقابل فوز واحد.
للمبرمجين الراغبين في قراءة المزيد من المعلومات يمكن قراءة ورقة تورينج عن رؤيته بما يخص الذكاء والحوسبة، وقراءة ورقة كلاود شانون، لتتبع رحلة هسو يمكن قراءة كتابه.
بطلٌ على الحواسيب أيضًا: لعبة غو وبرنامج ألفا زيرو
لا تحتوي لعبة غو على الزهر مثل الطاولة أو قطع مختلفة مثل الشطرنج ولوحها أكبر من لعبة الدامة، الهدف فيها هو احتلال أكبر مساحة في الرقعة وإخراج قطع الخصم، لعبةٌ استراتيجية قديمة لعبها الجنرالات والمثقفون في الشرق الأقصى على لوح ضلعه تسعة عشر مربعًا، عمر اللعبة آلاف السنين وقلل تعقيدها من محاولات ابتكار برنامج يفوز بطولة مثل الألعاب الآنف ذكرها، الحركات الممكنة في لعبة غو أكبر من لعبة الدامة أو الشطرنج، لتبسيط لعبة غو حتى تماثل الدامة، يجب لعبها على لوح عرضه ستة مربعات ولمطابقة الشطرنج ستكون اللوحة تساعية الضلع.
وربما كانت أول محاولة لبرمجة اللعبة هي على يد آلبرت زوبرست في أواخر الستينات، الذي رأى أن عدد التحركات الكبير يتطلب نهجًا مختلفًا في البرمجة، صمم برنامجا من جزئين رئيسيين، الأول يحول اللوحة إلى تمثيل داخلي في الحاسوب ويحفظ خصائص اللوح في مصفوفات، والجزء الثاني يقرأ ذاك التمثيل ليجري الحسابات تباعًا، كان برنامجه خطوة أولى متواضعة تمكنت من التغلب فقط على مبتدئين تقتصر خبرتهم على عشرين لعبة فحسب.
وكالعادة كانت هناك محاولات من عدة مبرمجين ولكن أيًّا منهم ومن برامجهم تمكنت من الفوز على أي لاعب خبير، بل ولم ينل أحد جائزة قيمتها مليون ونصف موعودة لأي جهاز يجتاز تحدي الفوز على البطل، واكتفت البرامج في بطولات بين بعضها إلى أن سُدت الفجوة بين لاعبي غو البشر عندما سطع نجم برنامج Alpha Go.
طوِّر هذا البرنامج من شركة Deep Mind التي استحوذت عليها شركة غوغل، وكان مثل أسلافه برنامجٌ يتعلم بدراسة خبرات الأبطال من البشر، ما فعله المبرمجون هو تركه يلعب اللعبة مرارًا وتكرارًا وأن يقيّم حركاته بمقارنتها بحركات مشابهة لأفضل اللاعبين البشر، يبحث البرنامج باستخدام شجرة مونت كارلو والشبكات العصبية العميقة، ويخضع تدريبه لمراحل عدة من التعلم الآلي.
تمكن البرنامج من الفوز على فان هوي الحامل للقب بطولة غو الأوروبية لمدة ثلاث سنوات متتالية، وعلى عكس البرامج المذكورة سابقًا لم يكن هناك تدرج وتحسن وتعادل وخسارة قبل إنجاز ذلك، بل فاز بجميع أشواط المباراة، ومع أن فان هوي محترفٌ لكن تصنيفه في اللعبة التي تتسلسل بين واحد وتسعة دان هو اثنان، البطل الذي يوازي تينسلي الرهيب وكاسباروف هو لي سيدول، بطل العالم بتصنيف 9 دان، يمكنك متابعة هذا الوثائقي للإلمام بمجريات المباراة التي أجريت في عام 2017 وتكونت من خمس أشواط فاز بأربعة منها، حفظ سيدول ماء وجهه وربما ماء وجه البشر أيضًا عندما فاز في أحد الأشواط، لكن هذه الهزيمة دفعته للتقاعد من اللعبة إذ صرّح تصريحًا يمكن أن نعتبره رثاء الأبطال البشر "حتى لو أصبحتُ الأول، فهناك كيان لا يُقهر".
تخطي الخبرة البشرية كلها
تستأحد هذه المواجهة بين ما سبقها، فالبرنامج لم يستغرق سنوات من التحسينات وعشرات البطولات لتصاغ معاييره يدويًا، فباستخدام الشبكات العصبية وقوى الحساب المعاصرة امتهر اللعبة، من خلال التعلم المعزز واللعب كما يفعل الأساتذة، ومِثل هيمنة الذكاء الاصطناعي في الشطرنج، لم يعد هناك أملٌ لهزيمة الذكاء الاصطناعي دون أن يلعب بإعاقة، في عام 2019 حاول لي سيدول مرة أخيرة ضد برنامج هان دول الكوري، مع إعاقة قطعتين، وتمكن من انتزاع فوزٍ واحدٍ من أصل ثلاثة.
على الرغم من فوزه على بطل بشري، إلا أن Alpha Go لا يزال برنامجًا تعلم اللعب من خلال محاكاة التجربة الإنسانية، أما أحلام آرثر صموئيل وآلان تورينج منذ عقود كانت برمجة ما يتعلم اللعبة من الصفر، وبالفعل تحقق ذلك مع AlphaGo Zero.
أسباب شعبية الألعاب المذكورة في مجتمع المبرمجين هو وفرة الخبرة البشرية للقياس ولتدريس البرامج، لكن الاتكال على قواعد البيانات يعيبها ببساطة الحاجة إلى وجودها أصلًا، البرنامج لا يصل مستوى الأبطال دونها، كما أن المبرمج قد يضطر -كما رأينا سابقًا مع كين ثومبسون- إلى إدخال البيانات بطريقة تستهلك الوقت والجهد، وبعض القواعد الجاهزة باهظة الثمن، ونذكر برأي تيساريو القائل بأنها قواعد بشرية يعتريها النقص الشري، وبالتالي، فإن فوائد تعلم الذكاء الاصطناعي دون الاعتماد على بيانات الخبراء تتجاوز كل هذه النواقص، كما تفتح الباب أمام الألعاب التي لا نملك قواعد بيانات عملاقة لأنها أحدث أو أقل عراقة من الشطرنج والدامة وغو.
تخلى الفريق عن فكرة الاعتماد على خبرات البشر فاستخدم برمجةٍ تتمتع بميزة اللعب والتحليل لتتعلم بمفردها، من خلال الشبكات العصبية وتحسين خوارزميات التعلم المعزز لِلعب ذاتي وشجرة مونتي كارلو البحثية، لَعِبَ البرنامج ضد نفسه 29 مليون لعبة[iv] حتى صار بكفاءة أعلى بكثير مقارنة بشبكة عصبية ثانية تستخدم نفس البنية ولكنها تعلمت من اللعب البشري، ثم تغلب بهامش كبير على Alpha Go بإصداراته المتعددة، مما يشهد على قوة التعلم الذاتي.
ويمكن القول بأن فلسفة المبرمجين الذين اعتمدوا على نقاط قوة الحواسيب بدلًا من تقليد ما يميز البشر أثبتت أفضليتها في كل مقابلة، عندما اختار هسو البحث الشامل مقابل اختيار برلنر للبحث الانتقائي، وعندما اختار شيفر الاعتماد على الخبرات المتراكمة بدلًا من قدرات الحاسوب عندما لم تكن الحواسيب بتلك القوة، وعندما تحسنت القدرات الحاسوبية والاعتماد على الشبكات العصبية انقلبت الاستراتيجية ليتفوق AlphaGo Zero على سلفه، ثم اتّبع الفريق هذا الإنجاز بآخر حيث نزعوا خصوصية لعبة غو وأتاحوا لبرنامج جديد أسموه Alpha Zero تجريب لعبة غو والشطرنج وشوغي، ليتمكن من إتقانها بسرعة تدرجت بين أربع ساعات وثلاثين ساعة لتفوز على أفضل البرامج في كل لعبة، أي أنه في غضون ثلاثين ساعة صار أفضل من AlphaGo Zero الذي كان أفضل من Alpha Go الذي كان أفضل من البطل لي سيدول الذي هو بطبيعة الحال أفضل من سائر اللاعبين.
للمبرمجين المهتمين بقراءة المزيد يمكن مطالعة ورقة ألفا غو، ورقة ألفا غو زيرو، ورقة ألفا زيرو. كما تتيح الشركة مجموعة من المحاضرات عن الذكاء الاصطناعي على قناتها.
خلاصة
وبما يخص الأطوار الثلاثة التي يزعم كاتب هذه المقالة أنها تمثل تشبيهًا لفهم الديناميكية بين البشر والذكاء الاصطناعي يمثل Alpha Zero قفزة فوق طور الخصومة لتجمع بين الأداة والعلّامة، تمكن من تعلم الاستراتيجيات الأساسية ورسم استراتيجيات جديدة، من المهم التنويه إلى أن الديناميكية بأطوارها الثلاث تنطبق فقط على الألعاب اللوحية، وكما نعلم يسعى المبرمجون بسرعة قد نصفها بأنها هوجاء بناء الذكاء الاصطناعي العام AGI ليطغى في كل المجالات (Artificial (General Intelligence، ومع كل التطورات نشهد تفنيدًا سريعًا لبعض الحجج المُطمئنة لنقاد تطوير الذكاء الاصطناعي دون الاعتناء بتطابق علومه مع قِيمنا أو ما يعرف بمشكلة الانتظام، مثلًا في السابق قيل أن الذكاء الاصطناعي سيتكفل بكل أعمالنا الروتينية ويسمح لنا أن نتفرغ للإبداع والفن، لكن الذكاء الاصطناعي اقتحم مجال الرسم والكتابة بأمثال Mid Journey وChat GPT، بل زاحم بطريقة ما المبرمجين المبتدئين أنفسهم وسهّل على الطلاب حل وظائفهم بطريقة تفوق مساعدة Google قد تغيّر طبيعة الواجبات الدراسية. فهل سوف تمر هذه التطبيقات في الأطوار هذه وهل يمكننا الاستفادة من معرفة هذه الأطوار كي نضع كل تطورات الذكاء الاصطناعي في تصنيفها المناسب ونتصرف وفقًا لذلك بدلًا من التخبط إلى أن تتحكم بنا الظروف؟
انقسم المستخدمون والنقاد لهذه التكنولوجيا بين زعمٍ يستحسن هذا التطور لأنه يسهّل كل مهامنا ويتيح مجالات للإبداع لم نحلم بها مسبقًا، واستشهدوا بأن الألعاب اللوحية لم تنقرض بعد تفوق الذكاء الاصطناعي فيها، وبين زعمٍ يشير إلى قطع الأرزاق المتسارع الذي لم يعد يفرّق بين سائق شاحنة ومبرمج وفنان، وأن لهذا تبعات اجتماعية وفلسفية واقتصادية لا نملك الوقت لدراستها ناهيك عن تجنبها بسبب سرعة التقدم، ومن الإنذار بالخطر الوجودي الذي يشكله الذكاء الاصطناعي العام.
أما كاتب هذه المقالة فهو، إن لم يُستبدَل ببرنامج ذكاء اصطناعي، قد دعا مسبقًا لاستخدام البرمجيات في التدقيق اللغوي، وسأسعى للتوسع في دراسة الديناميكية بيننا، معشر البشر، وبين التكنولوجيا، آملًا بأن يتعمق المهتمون والمعنيون بهذا الموضوع في الاستنتاج من المعلومات والمقدمات الواردة في مثل هذه المقالات.
[i] اعترتني الغرابة أثناء الكتابة المقالة بسبب الحاجة لاستخدام كلمة البشري للتفريق بيننا وبين كيان آخر.
[ii] في عام 2016، أي بعد عشر سنوات من تعليق نيوبورن، تمكن برنامج ألفا غو من الفوز على البطل لي سيدول وبعد عام من ذلك فاز برنامج ليبراتوس ببطولة ضد أفضل لاعبي البوكر.
[iii] بول مورفي الذي كان يعتبر بطل العالم في القرن 19th رفض لعب الشطرنج ما لم يكن يلعب بإعاقة ما، والآن يبدو أن الآلات قد امتلكت هذه الدرجة من الهيمنة.
[iv] وبصراحة لو استطاع أي بشري لعب 29 مليون لعبة لن نستغرب من قدرته على مراكمة خبرة تساوي خبرة الخبراء.