OpenClaw fundador comparte el ranking de adaptabilidad de modelos de IA, con los nacionales minimax-m2.1 y kimi-k2.5 en segundo y tercer lugar respectivamente.

Gate News informa que, el 8 de marzo, Peter Steinberger, fundador de OpenClaw (marco de desarrollo de agentes de IA), compartió los resultados de las pruebas de referencia de terceros de PinchBench, que evalúan el rendimiento de los grandes modelos de lenguaje de IA en tareas de agentes OpenClaw. Los resultados muestran que Gemini 3 Flash, que procesa tareas de OpenClaw, tiene una tasa de éxito del 95,1%, ocupando el primer lugar. Los modelos nacionales minimax-m2.1 y kimi-k2.5 ocupan respectivamente el segundo y tercer lugar con un 93,6% y un 93,4%. Claude Sonnet 4.5 tiene una tasa de éxito del 92,7%, y GPT-4o alcanza el 85,2%.

Ver originales
Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el Aviso legal.
Comentar
0/400
Sin comentarios