أخبار بوابة، 10 أبريل، حدّثت اليوم منصة التقييم الموثوقة عالميًا للذكاء الاصطناعي LMArena (منصة تقييم نماذج الذكاء الاصطناعي التي يشارك فيها مليون مستخدم في اختبارات عمياء) قائمة المتخصصين في Code Arena، حيث احتلّت GLM-5.1 المرتبة الأولى عالميًا بين النماذج مفتوحة المصدر، لتتبوأ أيضًا المركز الثالث عالميًا بين النماذج.
لم تكتفِ GLM-5.1 بوراثة قدرات الترميز مفتوحة المصدر على مستوى SOTA من الجيل السابق من النماذج فحسب، بل حققت اختراقًا في المهام طويلة المدى (Long-Horizon Task)، عبر تحقيق: إنشاء سطح مكتب Linux من الصفر خلال 8 ساعات؛ و655 تكرارًا لكسر عنق الزجاجة في تحسين قواعد البيانات المتجهية؛ و1000 جولة من تحسين استدعاءات الأدوات لرفع كفاءة حمل نماذج التعلم الآلي الواقعية.
وجدير بالذكر أنه، ضمن معايير التقييم المتساوية في قائمة METR، تُعدّ GLM-5.1 النموذج مفتوح المصدر الوحيد الذي يصل إلى مستوى العمل المستمر لمدة 8 ساعات، كما تُعد—على مستوى العالم—واحدة من القلة التي تمتلك هذه القدرة، إلى جانب Claude Opus 4.6 فقط.