تكنولوجيا

من أجل حماية حقوق المؤلف

استثناء تنقيب الذكاء الاصطناعي عن النصوص والبيانات

الإطار القانوني للذكاء الاصطناعي يحتوي على تدابير، لجعل أعمال الذكاء الاصطناعي جديرة بالثقة ومتمحورة حول مصلحة الإنسان. هذا الإطار لا يشتمل فقط على قوانين لتنظيم الأمن السيبراني والخدمات الرقمية وإدارة البيانات، ولكنه يغطي أيضا قوانين الملكية الفكرية التي تحمي قواعد البيانات والبرمجيات.

وقد تطورت قوانين حقوق المؤلف التي تحمي التعبير عن الأفكار على مدى قرون عديدة ودعمت تقليديا فكرة الاقتصاد “القائم على الإذن”، بمعنى أن الشخص يحتاج إلى الحصول على إذن من المالك قبل استخدام مصنفاته ومنتجاته المحمية بقوانين حقوق المؤلف. ومن بين مجالات الملكية الفكرية، تعتبر قوانين حقوق المؤلف الأكثر امتدادًا من ناحية النطاق، حيث استوعبت مجموعة من المنتجات الجديدة التي لم يكن من المفترض أن تغطيها في الأصل.

فقوانين حماية حقوق المؤلف كانت مرتبطة فقط بالمواد المطبوعة، ولكنها مع التقدم التقني امتدت لتحمي في الولايات المتحدة الوسائط السمعية والبصرية والرقمية، وكذلك تمت إضافة البث الإذاعي والتلفزيون وأشرطة الفيديو وتلفزيون الكابل تدريجيًا في هذا القانون الذي كان مخصصًا للمصنفات المطبوعة. وامتد التوسع في حماية حق المؤلف إلى المدة أيضًا، فزادت مدة حقوق المؤلف في الولايات المتحدة من 14 عامًا في عام 1790 إلى 120 عامًا في عام 1998. واتبعت الدول والاتفاقيات الدولية هذا المنهج التوسعي في حقوق المؤلف. وأمَّا الآن، فقوانين حماية حقوق المؤلف أصبحت في منعطف لاستيعاب تقلبات تقنية جديدة مرتبطة بالذكاء الاصطناعي. فمع الذكاء الاصطناعي، قد تتغير قريبًا بعض المعايير التقليدية بخصوص طلب الحصول على الإذن من المالك قبل الاستخدام.

 

ما الاستراتيجية التي ينبغي اتباعها

إن الدول تتمتع بلا شك بحرية في اختيار المبادئ والأحكام القانونية التي تريد تطبيقها في الذكاء الاصطناعي. ويجب أن يبدأ أي سؤال قانوني حول تقنية ChatGPT الحديثة أو أي تقنية تدعم الذكاء الاصطناعي بالسؤال التالي: ما الاستراتيجية التي ينبغي اتباعها في الذكاء الاصطناعي؟ ونجد الإجابة عن هذا التساؤل في استراتيجية المملكة الوطنية للبيانات والذكاء الاصطناعي المعنونة بـ “لغدٍ نحقق فيه الأفضل”.

فتركيز هذه الاستراتيجية واضح تمامًا: وهو ترسيخ مكانة البلد كمركز عالمي في البيانات والذكاء الاصطناعي، بالإضافة إلى هدف الاستراتيجية في “سن التشريعات الأكثر ترحيبًا ببيانات الذكاء الاصطناعي”. فالإطار التنظيمي للبيانات والذكاء الاصطناعي في كل بلد يجب أن يهدف إلى تعزيز ودعم الجانب الأخلاقي لأبحاث البيانات والذكاء الاصطناعي. لذا، فإن رؤيتنا بشأن الذكاء الاصطناعي واضحة. ونحن هنا لن نتحدث عن مسألة على من تقع المسؤولية في انتهاك حق المؤلف؟.

 

الأعمال التقنيات التوليدية الذكية

إن التساؤل الأول الذي يرد إلى ذهن القانونيين حول أعمال التقنيات التوليدية الذكية مثل ChatGPT التي تستخدم نماذج اللغة الكبيرة (Large Language Model “LLM”) هو: هل أعمال هذه التقنيات تحقق شرط الأصالة المطلوب للحماية؟ للإجابة عن هذا السؤال، لابد أن نستحضر أن قانون حق المؤلف -على عكس قانون براءات الاختراع- يضع معايير منخفضة جدًّا في شرط الأصالة. وهناك اعتقاد بأن ChatGPT قد يسبب مشكلة كبيرة في التعليم من ناحية وجود حالات عدم مصداقية من بعض الطلاب في استخدام هذه التقنيات للغش في الواجبات والاختبارات. وتتمثل إحدى الطرق التي يمكن للمدرسين من خلالها التحقق من أصالة أعمال الطلاب في استخدام برنامج التحقق من الانتحال مثل برنامج Turnitin. إلا أن التقارير الأولية عن ChatGPT تظهر أنه ذكي جدًّا لدرجة أنه يستطيع التحايل على برامج اكتشاف الانتحال.

ولكن هناك أدوات أخرى لكشف اللجوء إلى الذكاء الاصطناعي، مثل أدوات الكشف عن محتوى الذكاء الاصطناعي التي يمكن أن تخبرك ما إذا كانت قطعة الكتابة قد تم إنشاؤها بواسطة روبوت. ولكن بالتأكيد، إنها مجرد مسألة وقت وسيتمكن الذكاء الاصطناعي من التغلب على برامج اكتشاف الانتحال. فإذا ظهرت مخرجات الذكاء الاصطناعي وكأنها أصلية، فسيكون إثبات انتهاك حق المؤلف فيها أمرًا صعبًا.

ونظرًا لأن الذكاء الاصطناعي يستخدم مجموعات من البيانات الضخمة، فقد يكون من المستحيل الحصول بشكل فردي على إذن من المؤلفين للأعمال المحمية بقوانين حقوق المؤلف. ولهذا السبب، وضعت الدول بعض الأحكام الخاصة في قوانين حقوق المؤلف لتسمح باستخدام البيانات لأغراض البحث في مجال التنقيب عن النصوص والبيانات الذي سنوضحه أدناه.

 

تحليل المصنفات الرقمية الحالية

إنه من المعلوم أن الذكاء الاصطناعي يجمع بين تكنولوجيا علوم الكمبيوتر ومجموعات البيانات لحل المشكلات وتحقيق النتائج المطلوبة منه. فهو يتعامل مع مجموعة من الأدوات والأنظمة والتقنيات التي تسمح له “بالتعلم”. ويتضمن جزءُ التعلم (الذي يتم تمكينه بواسطة خوارزميات التعلم الآلي التي تستخدم لتقليد الطريقة التي نتعلم بها ونحل المشكلات) استخدام البيانات.

ومن بين المسائل التي يتعين على قوانين حقوق المؤلف معالجتها هي مسألة مشروعية هذا التدريب، ونعني بذلك: ما إذا كانت هذه القوانين ستسمح أو تمنع استخدام البيانات من قبل أنظمة الذكاء الاصطناعي دون موافقة مالكي حقوق البيانات. فتطور مستقبل روبوتات المحادثة المدعومة بالذكاء الاصطناعي يعتمد على الإجابة عن هذا السؤال، كما يعتمد في الوقت نفسه على الإطار التنظيمي الذي نتبناه في هذا المجال.

إن واحدة من المناهج المستخدمة من قبل الذكاء الاصطناعي هي (منهجية التنقيب عن النصوص والبيانات – Text and Data Mining TDM). ويشير هذا المنهج إلى استخدام التقنيات الحسابية لتحليل المصنفات الرقمية الحالية، التي يمكن أن تكون محمية بموجب قوانين حقوق المؤلف لتحديد الأنماط والاتجاهات وغيرها من المعلومات. وبما أن عملية استخراج البيانات تنطوي على نسخ المصنفات الرقمية، فإنها يمكن أن تمثل انتهاكًا لحقوق المؤلف عندما تتم دون إذن.

ففي الولايات المتحدة نوقشت مسألة قانونية التنقيب عن الأعمال المحمية بحقوق المؤلف وعرض مقتطفات منها والسماح بالبحث فيها في بعض القضايا، كتلك المتعلقة بـ Google وHathi Trust. ويعد التنقيب عن النصوص والبيانات في الولايات المتحدة قانونيًا، حيث يسمح مبدأ الاستخدام العادل بالنسخ لتمكين الذكاء الاصطناعي من إجراء أبحاثه وتنقيبه. ويركز النقاش حول التنقيب عن النصوص والبيانات على قضية نسخ المصنفات التعبيرية لأغراض غير تعبيرية وكيف لا ينبغي أن يعد ذلك تعديًّا. إلا أن ChatGPT يتجاوز هذه القضية إلى أن يعرض التعبيرات التي يمكن أن تقلد أسلوب بعض الأعمال المحمية بحقوق المؤلف.

 

دور مكاتب البراءات

وقد اتبعت بعض الدول مناهج مختلفة في هذا الشأن. فبعض الدول اكتفت بإدخال استثناءات على قانون حقوق المؤلف للسماح للذكاء الاصطناعي بالتنقيب عن النصوص والبيانات، وبعض الدول فضلت أن تعدل إطار قانون حقوق المؤلف بشكل أشمل ليساهم في تطوير الذكاء الاصطناعي.

وبينما تستخدم الولايات المتحدة استثناءات الاستخدام العادل للسماح بـ TDM، قدمت اليابان أول استثناء يتعلق باستخراج النصوص والبيانات قبل عقد من الزمان. ويستثني توجيه الاتحاد الأوروبي بشأن حق المؤلف في السوق الرقمية الموحدة الذي صدر في عام 2019 النصَّ التجاري واستخراجَ البيانات. وكذلك قُدِّم تعديل عام 2014 على قانون حقوق المؤلف في المملكة المتحدة ليستثني النصوص غير التجارية واستخراجَ البيانات. ولكن الآن، تقوم المملكة المتحدة بتوسيع استثناء TDM ليشمل التنقيب للنصوص والبيانات لأغراض تجارية بموجب مبدأ “الوصول القانوني”، وهذا الأمر يساهم في تعزيز تنمية الذكاء الاصطناعي.

وتعد بيانات التنقيب جزءًا مهمًّا من البحث الذي يحدث في سيناريوهات مختلفة. فمثلًا، تقوم مكاتب البراءات بشكل روتيني باستخراج بيانات البراءات وغير البراءات أثناء فحص طلبات البراءات. فيعتبر استخراج مجموعات البيانات أمرًا بالغ الأهمية لأنظمة تدريب الذكاء الاصطناعي. فالاستثناء التجاري الجديد في المملكة المتحدة يسهل على مطوري الذكاء الاصطناعي استخراج النصوص والبيانات التي قد تؤثر على حقوق مالكي حقوق المؤلف.

 

حقوق المؤلف وحقوق قواعد البيانات

وفي السباق إلى أن تصبح لاعبًا رئيسًا في الذكاء الاصطناعي (وهي تكنولوجيا حاسمة في المستقبل)، جعلت بعض الدول نظمها الخاصة بحقوق المؤلف خاضعة لاستراتيجيتها في الذكاء الاصطناعي. ومن الأمثلة على ذلك المملكة المتحدة، التي تطمح وفقًا لاستراتيجيتها الوطنية الذكاء الاصطناعي التي تم إطلاقها في عام 2021 إلى أن تصبح قوة عظمى الذكاء الاصطناعي عالمية. وأطلقت الاستراتيجية مشاورات بخصوص الذكاء الاصطناعي والملكية الفكرية في مكتب المملكة المتحدة للملكية الفكرية، ونتج عنها اعتبار “استخراج النصوص والبيانات” أمرًا مهمًّا في استخدام الذكاء الاصطناعي وتنميته.

وأدت هذه المشاورات إلى استثناء جديد في حقوق المؤلف وحقوق قواعد البيانات للسماح باستخراج النصوص والبيانات لدواعٍ تجارية. فالآن سيغطي هذا الاستثناء استخدام التنقيب عن النصوص والبيانات لجميع الأغراض.

لسنا أقل طموحًا. وتتوق استراتيجيتنا للذكاء الاصطناعي إلى وضعنا في خريطة الذكاء الاصطناعي كمركز عالمي للبيانات والذكاء الاصطناعي. ولتحقيق هذا الهدف، سيكون توفير استثناءات للسماح للذكاء الاصطناعي بالتنقيب عن النصوص والبيانات لجميع الأغراض في نظام حماية حقوق المؤلف السعودي خطوةً في الاتجاه الصحيح.

مقالات ذات صلة

زر الذهاب إلى الأعلى