
في بدايات الحوسبة، كانت العلاقة بين الإنسان والآلة قائمة على الأوامر المباشرة. المستخدم يكتب أمرًا، والحاسوب ينفذه. لم تكن الأجهزة قادرة على فهم سياق المستخدم أو حالته النفسية، ولم تكن تهتم بما إذا كان الشخص الذي يجلس أمامها غاضبًا أو محبطًا أو مرتاحًا.
كان الاهتمام الأكبر في ذلك الوقت منصبًا على محاكاة المنطق البشري: حل المعادلات، معالجة البيانات، تنفيذ العمليات المعقدة والتفوق في ألعاب تعتمد على التفكير مثل الشطرنج. أما المشاعر، فكانت تُنظر إليها غالبًا باعتبارها عنصرًا غير دقيق، يصعب قياسه، وقد يربك عملية التحليل.
مع بداية الألفية الجديدة، ظهرت مشاريع بحثية وتجارية حاولت إدخال المشاعر إلى عالم الحوسبة. ومن بين هذه المشاريع مشروع “بلو آيز” التابع لشركة “آي بي إم”، الذي سعى إلى تطوير أنظمة قادرة على ملاحظة المستخدم وتحليل بعض ملامح حالته أثناء التفاعل مع الأجهزة.
ومع ظهور تقنيات التعلم العميق، تغيّر المشهد بشكل واضح. أصبحت الخوارزميات قادرة على التعامل مع كميات ضخمة من البيانات، وتحليل أكثر من نوع من الإشارات في الوقت نفسه. وهنا برز مفهوم التحليل المتعدد الوسائط، الذي يجمع بين النص والصوت والصورة والبيانات الحيوية للوصول إلى قراءة أدق للحالة العاطفية.
وتشير بعض الدراسات إلى أن هذه النماذج يمكن أن تحقق دقة مرتفعة في البيئات المخبرية، قد تقترب في بعض الحالات من 90%، لكن هذه النسبة لا تعني أن التقنية أصبحت معصومة من الخطأ. فالدقة تتغير بحسب السياق، ونوع البيانات، وجودة الأجهزة، وطبيعة الأشخاص الذين يتم تحليلهم.
تعتمد أنظمة الذكاء الاصطناعي العاطفي على مصادر متعددة للبيانات. في النصوص، تستخدم الخوارزميات تقنيات معالجة اللغة الطبيعية لتحليل الكلمات والجمل ونبرة الخطاب. فاختيار الألفاظ، وطريقة صياغة الجملة، وكثرة التردد أو الحدة في التعبير، كلها قد تحمل مؤشرات عاطفية.
ومع تطور النماذج اللغوية الكبيرة، مثل “بيرت وجي بي تي”، أصبحت الأنظمة أكثر قدرة على التقاط الإيحاءات النفسية داخل النص، وليس فقط المعنى المباشر للكلمات. فالجملة الواحدة قد تحمل غضبًا أو سخرية أو قلقًا أو ترددًا، حتى لو لم تذكر هذه المشاعر صراحة.
أما في الصوت، فتركز الخوارزميات على مؤشرات مثل ارتفاع النبرة، سرعة الكلام، التوقفات، التردد، وتغير الإيقاع. فالشخص المتوتر قد يتحدث بسرعة أو بصوت أعلى من المعتاد، بينما قد تظهر علامات القلق في الانقطاع أو التردد أو تغير نمط التنفس أثناء الكلام.
وتعرف هذه التقنية باسم التعرف على المشاعر من خلال الكلام، وهي من المجالات التي شهدت تطورًا ملحوظًا خلال السنوات الأخيرة، خصوصًا في محاولة رصد التوتر أو الضيق النفسي قبل أن يعبّر عنه الشخص بالكلمات بشكل مباشر.
أما تعبيرات الوجه، فهي من أكثر المصادر استخدامًا في هذا المجال. إذ ترصد بعض الأنظمة الحركات الدقيقة في عضلات الوجه، مثل حركة الحاجبين، واتساع العينين، وشكل الفم.
بن عشور خديجة



