OnNEWS

جوجل تكشف عن Gemini 3.1 Pro بأرقام قياسية في اختبارات الذكاء الاصطناعي


كشفت منصة TechCrunch أن جوجل أطلقت إصدارًا جديدًا من نموذج الذكاء الاصطناعي Gemini Pro يحمل اسم Gemini 3.1 Pro، وهو متاح حاليًا في مرحلة المعاينة على أن يتم طرحه لاحقًا بشكل أوسع للمستخدمين والمؤسسات.

وأوضحت المنصة أن جوجل قدّمت النموذج الجديد بوصفه تطورًا مباشرًا لنسخة Gemini 3 التي طرحت في نوفمبر الماضي وحققت في حينها نتائج مرتفعة في الاختبارات القياسية مقارنة بالمنافسين. 

وأشارت TechCrunch إلى أن هدف جوجل من هذا الإصدار هو تقديم نموذج قادر على التعامل مع مهام أكثر تعقيدًا في ما يعرف بـ“العمل المعرفي”، مثل التحليل المتقدم وحل المشكلات متعددة الخطوات.​

نتائج قياسية في اختبارات مستقلة

أكدت TechCrunch أن جوجل شاركت نتائج اختبارات مستقلة أظهرت تفوق Gemini 3.1 Pro بشكل واضح على الإصدار السابق في عدد من معايير القياس، من بينها اختبار يُعرف باسم Humanity’s Last Exam، وهو واحد من المقاييس المستخدمة لتقييم قدرات النماذج على حل مشكلات معقدة. 

وذكرت المنصة أن جوجل اعتبرت هذه النتائج مؤشرًا على أن النموذج أصبح أكثر كفاءة في فهم التعليمات الطويلة وتنفيذ سلاسل من الأوامر المتتابعة، وهو ما يجعله مناسبًا للسيناريوهات التي تعتمد على “وكلاء” أو أنظمة قائمة على مهام متعددة المراحل. 

وأوضحت أن هذه الاختبارات تأتي في سياق تنافس متصاعد بين شركات التقنية الكبرى على تقديم نماذج لغوية ضخمة ذات أداء أعلى في المقاييس الأكاديمية والعملية على حد سواء.​

إشادة من منصات قياس أداء النماذج العملية

أشارت TechCrunch إلى أن بريندان فودي، الرئيس التنفيذي لشركة Mercor المتخصصة في تقييم أداء نماذج الذكاء الاصطناعي في مهام العمل الحقيقية، أعلن أن Gemini 3.1 Pro يتصدر حاليًا لوحة تصنيف APEX-Agents الخاصة بالشركة. 

وذكرت المنصة أن نظام APEX يقيّم النماذج بناءً على قدرتها على تنفيذ مهام مهنية عملية، وليس فقط على أساس اختبارات نظرية أو أسئلة قياسية، ما يعطي صورة أقرب لكيفية أداء النموذج في الاستخدام الفعلي داخل الشركات.

وأكد فودي في تعليق نقله التقرير أن نتائج Gemini 3.1 Pro تعكس سرعة تطور النماذج في التعامل مع “العمل المعرفي الحقيقي”، وهو ما يدعم استخدامه في تطبيقات الأعمال التي تتطلب تخطيطًا وتحليلًا واتخاذ قرارات ضمن سياقات معقدة.​

منافسة محتدمة في سباق النماذج اللغوية

أوضحت TechCrunch أن طرح Gemini 3.1 Pro يأتي في وقت تشهد فيه سوق الذكاء الاصطناعي سباقًا متسارعًا بين عدة أطراف، من بينها OpenAI وAnthropic وشركات أخرى تسعى إلى إطلاق نماذج قادرة على التفكير المتسلسل والعمل كـ“وكلاء ذكيين”. 

وذكرت المنصة أن هذه النماذج لا تقتصر على إنتاج النصوص أو الإجابة عن الأسئلة فحسب، بل تمتد إلى تنفيذ إجراءات على الإنترنت أو داخل أنظمة الشركات، استنادًا إلى تعليمات عامة يضعها المستخدم. 

وأشارت إلى أن جوجل تراهن من خلال نتائج Gemini 3.1 Pro القياسية على تعزيز موقعها في هذا السباق، تمهيدًا لتكامل النموذج مع منتجات وخدمات مختلفة داخل منظومة الشركة في الفترة المقبلة.




Source link

اضف تعليقك

إعلان

العربية مباشر

إعلان

Your Header Sidebar area is currently empty. Hurry up and add some widgets.