تكنولوجيا

تلخيص الأبحاث بالذكاء الاصطناعي: دراسة تكشف قصور الدقة

تلخيص الأبحاث بالذكاء الاصطناعي .. يعدّ تبسيط النتائج العلمية المعقدة للجمهور غير المتخصص مهمة جوهرية يقوم بها الصحفي العلمي كل يوم، وقد اعتُبرت هذه العملية من أبرز الاستخدامات التي يمكن أن تقدمها نماذج اللغة الضخمة التي تقف خلف روبوتات المحادثة، غير أنّ دراسة غير رسمية أجرتها الجمعية الأمريكية لتقدم العلوم على مدى عام كامل كشفت أن روبوت “شات جي بي تي” لا يرقى بعد إلى مستوى هذه المهمة بالشكل المطلوب.


 

فقد اختبر فريق الجمعية قدرة الروبوت على صياغة ملخصات مبسطة للأبحاث العلمية بأسلوب مشابه لذلك الذي يستخدمه فريق “ساي باك” في مجلة “ساينس”، وهي ملخصات موجزة تركز على الفرضية والمنهجية والسياق، إلا أنّ النتائج أوضحت أن الروبوت قادر على تقليد البنية العامة للموجز العلمي لكنه غالبًا ما يضحّي بالدقة لصالح البساطة.

وذكر تقرير تقني أنّ نصوص الروبوت تحتاج دائمًا إلى تدقيق دقيق من قِبل كتّاب “ساي باك”، فيما أكدت الكاتبة “أبيغيل آيزنشتات” أنّ هذه التقنيات قد تكون أدوات مساعدة مستقبلا للصحفيين العلميين لكنها ليست جاهزة للاعتماد الأساسي حاليا.

 

تجربة عام كامل على عشرات الأوراق

من ديسمبر 2023 وحتى ديسمبر 2024، اختار الباحثون ورقتين أسبوعيًا بحد أقصى لتلخيصهما عبر الروبوت باستخدام ٣ محاور بحثية مختلفة تتفاوت في الدقة، وقد شملت الأوراق موضوعات شديدة الصعوبة مثل المصطلحات التقنية والاكتشافات الجدلية والصيغ غير التقليدية والمشاركين في التجارب العلمية، واعتمدت الاختبارات على النسخة المطروحة للعامة من أحدث نموذج للروبوت خلال تلك الفترة.

وخلال التجربة جرى تلخيص 64 ورقة بحثية كاملة ثم خضعت الملخصات لعملية تقييم كمي ونوعي من قِبل كتّاب “ساي باك” الذين أعدّوا النسخ الأصلية بأنفسهم، وأشار الباحثون في هذا السياق إلى أنّ تصميم الاختبارات لا يمكنه إزالة جميع أشكال التحيز البشري، وهو ما يعد عاملا مهما للصحفيين الذين يخشون من منافسة هذه الأدوات لمهامهم الجوهرية.

لكن النتائج الكمية بدت صارخة، حيث جاءت الآراء متحيزة ضد الملخصات التي أعدها الروبوت، فعند سؤال المقيمين عن إمكانية دمج هذه الملخصات مع إنتاجهم الصحفي جاءت الدرجة 2.26 فقط على مقياس من ١ إلى ٥، أما بخصوص جاذبية الملخصات فقد نالت درجة 2.14 فقط، وفي كلا الاختبارين لم يحصل سوى ملخص واحد على درجة كاملة مقابل أكثر من ٣٠ تقييمًا بالدرجة الدنيا.

 

 

تلخيص الأبحاث بالذكاء الاصطناعي.. أخطاء متكررة وميل إلى المبالغة

كشفت التقييمات النوعية التي كتبها الصحفيون عن ثغرات واضحة في أداء الروبوت، فقد أشاروا إلى أنّ “شات جي بي تي” يخلط كثيرًا بين الارتباط والسببية ويفشل في تقديم السياق اللازم، ويميل إلى تضخيم النتائج باستخدام عبارات متكررة مثل “جديد” و”مبتكر”، وهو ما يفقد النصوص الدقة العلمية التي يتطلبها هذا النوع من الكتابة.

كما ظهر ضعف الروبوت بوضوح عند التعامل مع الأوراق متعددة النتائج، أو حين كان مطلوبًا دمج ورقتين مترابطتين في موجز واحد، فبدلًا من تحليل المنهجيات وتوضيح القيود والدلالات الكبرى، اكتفى في الغالب بنسخ ما هو مكتوب بلغة سطحية لا تعكس تعقيد المحتوى، وهو ما جعل الباحثين يؤكدون أن الروبوت قد يكون مناسبًا عندما تكون الورقة بسيطة ولا تحمل تفاصيل دقيقة لكنه غير قادر على التعامل مع الأوراق الغنية بالمعطيات.

وفي المحصلة بيّنت الدراسة أن روبوت المحادثة رغم قدرته على محاكاة الشكل الخارجي للملخصات، إلا أنه يفتقر إلى العمق المطلوب لتفسير الأبحاث، وهو ما يفرض على الصحفيين التمسك بدورهم في التدقيق والتحليل والنقل الدقيق بدل الاعتماد الكلي على الأدوات الآلية، وبذلك يظل الذكاء الاصطناعي حاضرًا كأداة تجريبية لا كبديل فعلي في الصحافة العلمية.

 ياقوت زهرة القدس بن عبد الله 

مقالات ذات صلة

زر الذهاب إلى الأعلى