تكنولوجيا

“GEMINI 3”.. خطوة جديدة تكشف مسار تطور الذكاء الاصطناعي

أعلنت شركة “غوغل” عن إطلاق الإصدار الثالث من منظومتها المسماة “جيميني”، مؤكدة أن هذا الجيل يمثل أكبر تحديث لبرامج الذكاء التي تطورها منذ ظهور السلسلة قبل عامين، إذ يشمل تحسينات واسعة في مجالات العلوم والرياضيات، والمهام التي تحتاج إلى استدلال عميق وقدرات متعددة الوسائط.

 

ويأتي هذا الإصدار كمنظومة متكاملة تجمع بين نماذج رئيسية وأدوات تطوير مخصصة، مما يجعل وجوده مختلفا عن النسخ السابقة التي ركزت على قدرات محددة فقط، إذ تعمل جوجل على إبقاء هذه النماذج ضمن بيئتها الخاصة دون إتاحتها كمصدر مفتوح.

وتوضح الشركة أن استخدام هذه النماذج يظل محصورًا داخل خدماتها ومنصاتها، الموجهة للمطورين مع إتاحة تشغيلها في الواجهات الخاصة التي توفرها للمؤسسات والمبرمجين، وهو ما يعكس رغبة في إحكام السيطرة على التقنية وتوجيه استخدامها.

وتتضمن الحزمة الجديدة النموذج الأبرز “جيمينيبرو”، إضافة إلى وضع تفكير عميق يعزز قدرة النظام على الوصول إلى حلول أدق، كما تشمل نماذج لتوليد الواجهات البصرية وأدوات للتصميم الديناميكي، ونظامًا للتعامل مع المهام متعددة الخطوات، إلى جانب محرك خاص يعمل داخل بيئة تطوير تعتمد على الوكلاء.

وتشير “غوغل” إلى أنها ستوفر الإصدار الجديد في وقت واحد عبر محرك البحث،تطبيق “جيميني”،منصة التطوير وأدوات الشركات، مما يمنح المستخدمين والمطورين، وصولا متزامنا لقدراته، وهو ما يوضح رغبة الشركة في توحيد بيئة التعامل مع نموذجها الأحدث.

وتكشف الأرقام التي تعرضها جوجل أن تطبيق “جيميني” يحظى بمئات الملايين من المستخدمين شهريا، بينما يستخدم الملايين من المطورين الأدوات المبنية عليه كما يتفاعل مليارا مستخدم مع ميزة المطالعات الذكية داخل البحث، مما يعكس توسع الاعتماد عليه.

 

نقلة نحو الذكاء الوكيلي

يرتكز هذا الإصدار على مفهوم الذكاء الوكيلي، الذي يقوم على أنظمة تستطيع التخطيط والتنفيذ والتفاعل مع الواجهات الرقمية، وتنسيق الأدوات دون الاكتفاء بإنتاج نصوص، وهو تحول تراه الشركة نقطة جوهرية في مستقبل برامجها.

ويمكن للنموذج تحويل الأوامر العامة إلى خطوات متتابعة تنفذ عبر التطبيقات المختلفة سواء على مستوى الجهاز أو عبر خدمات الشركة، مع قدرة على بناء واجهات تفاعلية وتشغيل الأدوات وإدارة المهام المركبة، مما يمنحه استقلالية أكبر في العمل.

ويقدم “جيمينيبرو” في نسخته الثالثة، قفزات واضحة في مجالات الاستدلال وحل المسائل الرياضية، والتعامل مع بيانات متعددة الوسائط، إضافة إلى تقدم ملحوظ في استخدام الأدوات وفي المهام التي تحتاج إلى تخطيط بعيد المدى، حيث تظهر نتائج الشركة تفوقًا كبيرًا مقارنة بالنسخ السابقة.

وتوضح “غوغل” أن النموذج الجديد احتل صدارة الاختبارات الخاصة بالاستدلال النصي كما حقق نتائج مرتفعة في الرياضيات والعلوم، وبلغ نسبة عالية جدا في اختبار الرياضيات لعام 2025، سواء دون تشغيل الأكواد أو مع تشغيلها مما يعكس قدرته المحسنة في التعامل مع المعادلات المعقدة.

كما أظهرت النتائج تقدمًا واسعًا في مختلف المؤشرات الأخرى التي تنشرها الشركة والتي تقارن فيها بين هذا الإصدار، والنماذج السابقة ونماذج المنافسين، مما يدعم رؤيتها حول تعزيز قدراته في جوانب متعددة.

وتقدم “غوغل”ضمن هذا الإصدار مفهوم الواجهات التوليدية، وهي صفحات ثرية بالصور والرسوم المنظمة مع قدرات على تصميم مخططات ومحاكياتوأدوات تفاعلية تظهر ضمن وضع الذكاء داخل محرك البحث بحيث يختار النظام أسلوب العرض الأمثل بحسب نية المستخدم.

 

أدوات موسعة وبيئة تطوير جديدة

تشير الشركة إلى أن النظام الوكيلي”جيميني”، يقوم بتنظيم المهام المركبة عبر التطبيقات والتصفح الحي ويعد الردود ويضع الخطط ويرتب البيانات، مع طلب موافقة المستخدم قبل تنفيذ الخطوات الحساسة مما يمنح التحكم الكامل أثناء العمل وسيصل أولا إلى المشتركين في أعلى فئات الخدمة.

وتطرح جوجل بيئة تطوير جديدة تحمل اسم “أنتيجرافيتي” وهي مساحة تجمع بين النموذج والمحرر والمتصفح بهدف تنفيذ مهام كاملة تشمل كتابة الشيفرات وتصميم الواجهات، وتدقيق الأخطاء والتنفيذ المباشر وهو ما يعد توسعًا في الأدوات الموجهة للمطورين.وتتوسع أدوات التطوير في منصة الشركة عبر وضع بناء جديد وخيارات تتحكم في عمق التفكير ودقة النموذج، إضافة إلى أدوات مخصصة للبرمجة المتعددة اللغات مع وسائل لربط المعلومات بالبحث، مما يسهل العمل في المشاريع المعقدة.

وتوضح “غوغل”أن “جيميني” في نسخته الثالثة يناسب مهام المؤسسات التي تعتمد على مراجعة الوثائق أو إدارة سلاسل الإمداد أو التنبؤ المالي أو خدمات الدعم، حيث تساعد القدرات الجديدة في التعامل مع الفيديو وتحليل الواجهات، مما يفيد الأنظمة الذاتية مثل الروبوتات.

ويقدم الإصدار أيضًا قدرات موسعة في الفهم البصري وتفسير المسارات وتحليل الفيديو، مع إمكانية بناء تطبيقات تفاعلية كاملة انطلاقًا من أوامر نصية وهو ما تؤكده شركات تجريبية أشارت إلى تحسن الالتزام بالتعليمات واستقرار الأداء وقدرة أعلى على التعامل مع شيفرات طويلة.

وتصف “غوغل”هذا النموذج بأنه الأكثر أمانًا بين نماذجها نتيجة تعزيز مقاومته للهجمات ،وتحسين آليات منع الأخطاء الناتجة عن المجاملة مع تعاون مع جهات مستقلة لتقييم المخاطر، وهو ما تحرص الشركة على إبرازه في بياناتها الرسمية.

ياقوت زهرة القدس بن عبد الله 

مقالات ذات صلة

زر الذهاب إلى الأعلى