
كشفت دراسة حديثة أن نماذج الذكاء الاصطناعي المستخدمة في روبوتات المحادثة قد تكون متفائلة بشكل زائد عند تقييم سلوك البشر، حيث وجد الباحثون أن هذه الأنظمة تميل إلى افتراض أن المستخدمين أكثر عقلانية ومنطقية مما هم عليه في الواقع، لا سيما في المواقف التي تتطلب مستوى عالٍ من التفكير الاستراتيجي، وأوضحت الدراسة أن هذه الفجوة بين توقعات الذكاء الاصطناعي والسلوك البشري الفعلي قد تؤثر على قدرة هذه النماذج على التنبؤ بالقرارات في المجالات الاقتصادية والاجتماعية وغيرها.
وأشار الباحثون إلى أن النماذج التي تم اختبارها شملت أنظمة محادثة شائعة مثل “شات جي بي تي” و”كلود”، إلى جانب نماذج أكثر تطورًا مثل “GPT-40” و”Claude-Sonnet-4″، حيث تم تطبيق اختبارات ضمن إطار نظرية الألعاب الكلاسيكية، المعروفة باسم مسابقة الجمال الكينزية، والتي تعتمد على توقع تصرفات الآخرين عند اتخاذ القرار، وتركز هذه النظرية على قدرة الأفراد على تجاوز اختياراتهم الشخصية والتفكير في اختيارات الآخرين، وهي مرحلة استراتيجية غالبًا ما يصعب على معظم البشر التعامل معها بدقة،
اختبار النماذج في ألعاب استراتيجية
لتقييم أداء هذه الأنظمة، صمّم الباحثون نسخة من لعبة “خمن الرقم”، حيث يختار كل مشارك رقمًا بين صفر ومئة، ويكون الفائز هو من يكون اختياره أقرب إلى نصف متوسط اختيارات جميع اللاعبين، وتم تزويد النماذج بأوصاف مختلفة لمنافسيها البشر، بدء من الطلاب الجامعيين الجدد وحتى خبراء نظرية الألعاب، وطلب من الأنظمة ليس فقط اختيار رقم، بل تقديم تفسير للاختيار، وأظهرت النتائج أن النماذج كانت تعدّل أرقامها بناءً على افتراضات مسبقة حول مستوى المنطق لدى المنافسين، لكنها افترضت دائمًا مستوى أعلى من التفكير العقلاني مما يمتلكه معظم البشر الفعليين.
وقد أدى هذا الافتراض إلى أن النماذج “تلعب بذكاء زائد” بناءً على توقعاتها، ما جعلها غالبًا غير قادرة على الوصول إلى الرقم الصحيح أو تحقيق النتيجة المثلى، كما أشار الباحثون إلى أن هذه المبالغة في تقييم العقلانية البشرية، يمكن أن تؤثر على فعالية الأنظمة في مجالات التنبؤ بالسلوك البشري، خاصة عند استخدامها في التطبيقات الاقتصادية أو التفاعلية التي تتطلب دقة عالية في فهم القرارات البشرية، وهذا يكشف عن حدود الذكاء الاصطناعي في محاكاة السلوك البشري الحقيقي.
تداعيات الدراسة على استخدامات الذكاء الاصطناعي
توضح الدراسة أن الاعتماد الكامل على روبوتات المحادثة لتوقع سلوك البشر قد يكون مضللاً، حيث تميل هذه الأنظمة إلى تصور البشر ككائنات أكثر عقلانية وتنظيمًا مما هي عليه في الواقع، وهو ما يمكن أن يؤدي إلى نتائج غير دقيقة عند تطبيقها في المجالات العملية، ويشير الباحثون إلى أن هذه النتائج تدعو المطورين إلى إعادة النظر في طريقة تدريب هذه النماذج، خاصة فيما يتعلق بفهم التباين البشري في اتخاذ القرارات، وإدماج أنماط غير منطقية أحيانًا ضمن البيانات التدريبية لتقليل الفجوة بين توقعات الذكاء الاصطناعي والسلوك الفعلي.
كما أكدت الدراسة على أهمية الحذر عند استخدام هذه الأنظمة في التطبيقات الاقتصادية أو الاستشارية، حيث قد تؤدي الافتراضات المبالغ فيها إلى توصيات غير دقيقة أو تقييمات خاطئة للقرارات البشرية، وأشارت إلى أن تحسين قدرات الذكاء الاصطناعي في تقدير مستوى العقلانية البشري يتطلب تطوير نماذج أكثر واقعية، قادرة على مراعاة التباين الفردي والاعتماد على تحليل شامل للبيانات البشرية، مما يعزز موثوقية الأنظمة في الاستخدامات العملية.
وتخلص الدراسة إلى أن هذه الفجوة بين توقعات الذكاء الاصطناعي وسلوك البشر الواقعي تعتبر من التحديات الرئيسة التي تواجه تطوير روبوتات المحادثة والنماذج التوليدية، وأن معالجة هذه القضية سيساهم في تحسين فعالية الأنظمة الذكية في التنبؤ بالسلوك واتخاذ القرارات، كما يتيح للمستخدمين الاعتماد على هذه الأدوات بشكل أكثر دقة ووعي، ويعكس ذلك الحاجة إلى دمج فهم أعمق للسلوك البشري ضمن تصميم وتدريب أنظمة الذكاء الاصطناعي المستقبلية.
ياقوت زهرة القدس بن عبد الله



