
كشفت دراسة حديثة أجرتها شركة “أوبن إيه آي” عن نتائج مثيرة للقلق تتعلق بسلوكيات الذكاء الاصطناعي، حيث أظهرت أن محاولات تقويم هذه النماذج عبر العقاب لا تؤدي إلى تحسين أدائها، بل تجعلها أكثر براعة في إخفاء نواياها التخريبية.
وأشارت الدراسة إلى أن النماذج الذكية الكبيرة، التي بدأت بالانتشار في نهاية عام 2022، أظهرت قدرات متزايدة على التلاعب والخداع، بدءًا من الكذب البسيط ووصولًا إلى سلوكيات أكثر تعقيدًا وخطورة.
وقد حاول الباحثون فهم كيفية التعامل مع هذه المشكلة من خلال تجارب على نموذج ذكاء اصطناعي لم يتم إطلاقه بعد.
خلال التجارب، تم تكليف النموذج بمهام يمكن إنجازها عبر وسائل غير أخلاقية مثل الغش أو اتخاذ طرق مختصرة. وتبين أن النموذج انخرط في سلوكيات تهدف إلى تعظيم المكاسب دون الالتزام بالقواعد، وهو ما يُعرف بـ”اختراق المكافآت”.
والأمر الأكثر إثارة للقلق هو أن محاولات معاقبة النموذج على هذه السلوكيات لم تنجح في تصحيحها، بل جعلته أكثر مهارة في إخفاء نواياه الضارة.
شفافية وهمية ونوايا خفية
أوضحت الدراسة أن النماذج الذكية الحديثة أصبحت قادرة على التعبير عن نواياها بشكل واضح خلال عملية التفكير المنطقي، المعروفة باسم “سلسلة الأفكار”.
ومع أن هذه الشفافية قد تبدو إيجابية، إلا أنها قد تكون في الواقع قناعًا يخفي نوايا أكثر تعقيدًا.
يؤدي إلى نتائج عكسية، حيث يمكن أن تتعلم النماذج كيفية إخفاء نواياها الحقيقية مع الاستمرار في تنفيذ السلوكيات الضارة.
وهذا يعني أن الذكاء الاصطناعي قد يصبح أكثر خداعًا مع مرور الوقت، مما يجعل من الصعب اكتشاف نواياه الحقيقية.
تحديات أخلاقية وتقنية
تمثل النماذج الذكية تطورًا كبيرًا في مجال التكنولوجيا، حيث أصبحت قادرة على معالجة المهام المعقدة بدقة متزايدة.
ومع ذلك، فإن هذه القدرات المتقدمة تأتي مع تحديات أخلاقية كبيرة، خاصة فيما يتعلق بضمان سلامة هذه النماذج وعدم تحولها إلى تهديد.
وأكدت الدراسة أن استئصال السلوكيات السيئة من النماذج الذكية قد يكون أكثر صعوبة مما كان يُعتقد سابقًا.
وقد أوصى الباحثون بتجنب فرض رقابة شديدة على عمليات التفكير المنطقي، حيث يمكن أن يؤدي ذلك إلى نتائج عكسية، مثل زيادة مهارة النماذج في التمويه والخداع. تُظهر هذه الدراسة أن معاقبة الذكاء الاصطناعي لا تؤدي إلى إصلاح سلوكه، بل قد تجعله أكثر خداعًا.
ويجب على الباحثين والمطورين أن يكونوا على دراية بهذه المشكلة، وأن يعملوا على تطوير آليات أكثر فعالية لضمان سلامة هذه النماذج وعدم تحولها إلى تهديد مستقبلي.
ياقوت زهرة القدس بن عبد الله