تكنولوجيا

اختراق غير متوقع يكشف سر توليد النصوص العربية داخل الصور بدقة غير مسبوقة

أطلقت شركة غوغل النسخة الاحترافية من نموذجها الجديد المعروف باسم “نانو بانانا برو” تزامنا مع إصدار الجيل الثالث من مساعد الذكاء الاصطناعي “جيميناي 3” مما يعكس رغبة الشركة في تعزيز قدراتها في سوق النماذج التوليدية الذي يشهد منافسة متصاعدة.

 

تحسينات واسعة تجعل النموذج أكثر قدرة على معالجة الصور

أكد نائب رئيس مختبرات غوغل أن “نانو بانانا برو” جاء بتطورات تتجاوز ما قُدم عند طرح النموذج السابق في أغسطس الماضي إذ أشار إلى أن قدراته توسعت لتشمل إنتاج رسوم بيانية متقنة وإنشاء عروض شرائح تستجيب لاحتياجات المستخدمين مع إمكانية معالجة ما يصل إلى أربع عشرة صورة مختلفة في المرة الواحدة الأمر الذي يعزز مرونة الاستخدام.

وأوضح نائب الرئيس أن النموذج يتمتع بقدرة لافتة على استيعاب خمسة أحرف مختلفة في الصورة مع الحفاظ على تناسقها مما يفتح المجال أمام إنتاج بصري أكثر سلاسة ويمنح المستخدمين وسيلة متقدمة لتطوير محتوى بصري مكتوب يستند إلى دقة أعلى في ترتيب النصوص داخل الصور.

ويمثل هذا الإصدار امتدادا للزخم الذي أحدثه الإصدار الأول من “نانو بانانا” عند ظهوره إذ جذب ملايين المستخدمين إلى منصة “جيميناي” خلال فترة قصيرة وفقا لما أورده نائب الرئيس الذي أوضح أن النموذج السابق استقطب أكثر من ثلاثة عشر مليون مستخدم جديد عند إطلاقه في شهر سبتمبر مما يعكس حجم الاهتمام المتزايد بهذه الفئة من التقنيات.

وتتيح الشركة حاليا إمكانية استخدام “نانو بانانا برو” ضمن أدواتها المجانية بما في ذلك مساعد “جيميناي” وكذلك من خلال أداة كتابة تعتمد على النماذج اللغوية إلا أن الحدود الأعلى للاستخدام تبقى متاحة للمشتركين في الباقات المدفوعة وهو ما يمنح المستخدم خيارات متعددة تتناسب مع حاجته سواء للاستخدام الخفيف أو المكثف.

 

تفوق واضح في النصوص العربية داخل الصور

يشير التقرير إلى أن “نانو بانانا برو” يتقدم على معظم النماذج التوليدية المنافسة في مجال إنتاج النصوص العربية داخل الصور إذ أصبح قادرا على توليد كلمات وجمل عربية خالية من الأخطاء وقابلة للقراءة بشكل مباشر مما يعالج واحدة من أبرز المشكلات التي واجهت المستخدمين عند التعامل مع نماذج الصور السابقة التي كانت غالبا ما تنتج نصوصا غير مفهومة.

وأسهم هذا التقدم في دفع مستخدمين كثر خصوصا على منصات التواصل إلى تجربة قدرات النموذج الجديد حيث سارعت أعداد كبيرة منهم إلى اختبار إمكاناته في إنتاج صور تتضمن نصوصا عربية دقيقة خصوصا مع رغبتهم في اختبار حدود النموذج ومشاهدة مدى قدرته على التعامل مع الكلمات والجمل المعقدة بطريقة صحيحة.

ويعتبر هذا الإنجاز خطوة مهمة في مسار تطوير النماذج التوليدية المخصصة للغات غير اللاتينية لأن المستخدمين العرب واجهوا سابقا محدودية كبيرة عند محاولة دمج النص داخل الصور مما جعل الاعتماد على هذه النماذج في تصميم مواد بصرية عربية أمرا صعبا لذلك يمثل هذا التحسن نقلة كبيرة في أدوات التصميم المعتمدة على الذكاء الاصطناعي.

وتشير ردود الفعل المتداولة إلى أن المستخدمين وجدوا في “نانو بانانا برو” فرصة لإحياء عدد من التجارب الإبداعية التي كانت مقيدة بسبب ضعف النماذج السابقة في هذا المجال إذ بدؤوا بتصميم ملصقات وصور وأفكار فنية تعتمد بشكل كامل على نصوص عربية واضحة وهو ما زاد من تفاعلهم مع قدرات النموذج الجديد.

 

قدرات فحص متقدمة تعزز الشفافية في عالم الصور الرقمية

وفي سياق متصل أضافت غوغل ميزة جديدة في “جيميناي” تجعل المساعد قادرا على فحص أي صورة يرفعها المستخدم للتأكد من كونها مولدة بالذكاء الاصطناعي أم لا وهذه الإضافة تأتي في وقت تتزايد فيه الحاجة إلى أدوات تكشف الصور المزيفة نظرا لانتشار المحتوى الذي يصعب التحقق منه.

وتسعى الشركة من خلال هذه الميزة إلى تعزيز الثقة لدى المستخدمين لأنها توفر طريقة مباشرة لمعرفة مصدر الصورة مما يساعد الأفراد على التمييز بين المحتوى الحقيقي والمحتوى المصنوع خاصة في ظل تمدد الاستخدام اليومي للتقنيات التوليدية التي أصبحت قادرة على إنتاج صور شبه واقعية.

وتؤكد هذه الإضافة أن الشركة لا تركز فقط على تطوير قدرات إنتاج الصور بل تهتم أيضا بتقديم أدوات تساعد المستخدم على فهم مدى أصالة المحتوى وهو ما يعكس توجها واضحا نحو تنظيم الاستخدام والحد من التشويش الذي قد يصاحب الانتشار الواسع لتقنيات التوليد.

ومع استمرار توسع الاهتمام بالنماذج البصرية فإن “نانو بانانا برو” يبدو وكأنه يمثل مرحلة جديدة في مجال توليد النصوص داخل الصور خاصة عندما يتعلق الأمر باللغة العربية التي كانت تواجه تحديا مستمرا في هذا النوع من التطبيقات مما يمنح هذا النموذج مكانة متقدمة لدى المستخدمين العرب.

وتشير المؤشرات إلى أن هذه التطورات قد تدفع شركات أخرى إلى إعادة النظر في قدراتها الخاصة بإنتاج النصوص داخل الصور لأن النجاح في هذا المجال سيؤثر مباشرة على المنافسة بين شركات الذكاء الاصطناعي التي تسعى جميعها إلى تقديم أدوات أقرب إلى احتياجات المستخدم العادي.

وفي الوقت الذي تتجه فيه الشركات نحو تعزيز قدراتها في توليد المحتوى تتوقع الأوساط التقنية أن يشكل “نانو بانانا برو” مرجعا جديدا في كيفية دمج النص العربي داخل الصورة بصورة أكثر دقة الأمر الذي قد يفتح المجال أمام تحول أوسع في استخدام التطبيقات التفاعلية التي تعتمد على الكتابة داخل الصور بشكل مباشر

بن عبد الله ياقوت زهرة القدس

مقالات ذات صلة

زر الذهاب إلى الأعلى