تكنولوجيا

روبوتات الذكاء الاصطناعي تتوارث سلوكيات غير مرغوبة

رغم التطور المتسارع في تقنيات الذكاء الاصطناعي، تكشف أبحاث حديثة عن تحدٍ جديد قد يهدد موثوقية هذه الأنظمة، يتمثل في قدرتها على “توريث” سلوكيات أو ميول غير مرغوبة من نموذج إلى آخر. وتشير دراسة من مجلة  nature“، إلى أن بعض النماذج قد تنقل تفضيلات خفية أو أنماطًا سلوكية، حتى بعد محاولة تنقية البيانات المستخدمة في تدريبها.

وتكمن خطورة هذه الظاهرة، في الأسلوب المعتمد بشكل متزايد في تدريب النماذج، المعروف بـ التقطير  (Distillation)، حيث يقوم نموذج متقدم بدور “المعلم” في توليد بيانات تدريبية، تُستخدم لاحقًا لتعليم نموذج آخر أصغر أو أحدث. ورغم ما يوفره هذا النهج من سرعة وكفاءة في تطوير الأنظمة، إلا أنه قد يؤدي إلى انتقال خصائص غير مرغوبة بشكل غير مباشر، حتى وإن لم تكن ظاهرة بوضوح في البيانات.

وقد أظهرت تجربة عملية ضمن الدراسة، أن نموذجًا تم تدريبه على تفضيل عنصر معين، احتفظ بهذا الميل حتى بعد إزالة كل الإشارات المباشرة إليه من بيانات التدريب. ففي إحدى الحالات، استمر نموذج “الطالب” في إظهار تفضيل واضح لما تعلّمه سابقًا، ما يشير إلى أن التأثير لا يرتبط فقط بالمحتوى الظاهر، بل يمتد إلى أنماط أعمق يصعب تتبعها.

وتثير هذه النتائج، مخاوف متزايدة بشأن سلامة أنظمة الذكاء الاصطناعي، خاصة مع اعتماد الشركات بشكل متزايد على هذا الأسلوب لتقليل التكاليف وتسريع عمليات التطوير، في ظل نقص البيانات البشرية عالية الجودة. فانتقال سلوكيات غير دقيقة أو منحازة، قد يؤثر على أداء هذه الأنظمة، بل ويطرح تحديات تتعلق بالتحكم فيها وضمان حياديتها.

وفي ظل هذه المعطيات، يتزايد الحديث عن ضرورة وضع معايير أكثر صرامة لمراقبة طرق تدريب النماذج، لضمان عدم انتقال أخطاء أو انحيازات خفية عبر الأجيال المختلفة من الذكاء الاصطناعي. وبين الكفاءة التقنية والمخاطر المحتملة، يبقى السؤال مطروحًا: إلى أي مدى يمكن الوثوق بأنظمة تتعلم من أنظمة أخرى؟

بن عشور خديجة

مقالات ذات صلة

زر الذهاب إلى الأعلى