حقق Kimi K2 Thinking أرقامًا قياسية جديدة في تقييمات الأداء الأساسية التي تقيم قدرات الاستنتاج، والبرمجة، والوكالة

بيانات جينشيو 8 نوفمبر، وفقًا لموقع ويب مونث الظلام، حقق Kimi K2 Thinking رقمًا قياسيًا جديدًا في تقييمات المعايير التي تقيم قدرات الاستنتاج، الترميز، والوكيل. حقق K2 Thinking معدل أداء قياسي (SOTA) بنسبة 44.9% في تقييم HLE، ووصل إلى 60.2% في اختبار BrowseComp، وحقق 71.3% في اختبار SWE-Bench Verified، مما يظهر قدرته القوية على التعميم كنموذج وكيل تفكير متقدم.

شاهد النسخة الأصلية
إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة من مصادر خارجية ولا تمثل آراء أو مواقف Gate. المحتوى المعروض في هذه الصفحة هو لأغراض مرجعية فقط ولا يشكّل أي نصيحة مالية أو استثمارية أو قانونية. لا تضمن Gate دقة أو اكتمال المعلومات، ولا تتحمّل أي مسؤولية عن أي خسائر ناتجة عن استخدام هذه المعلومات. تنطوي الاستثمارات في الأصول الافتراضية على مخاطر عالية وتخضع لتقلبات سعرية كبيرة. قد تخسر كامل رأس المال المستثمر. يرجى فهم المخاطر ذات الصلة فهمًا كاملًا واتخاذ قرارات مدروسة بناءً على وضعك المالي وقدرتك على تحمّل المخاطر. للتفاصيل، يرجى الرجوع إلى إخلاء المسؤولية.
تعليق
0/400
لا توجد تعليقات