Lanzamiento de la versión oficial DeepSeek V3.2: Mejora de la capacidad del agente, integración de pensamiento y razonamiento

Según Golden Finance, hoy lanzamos dos modelos de versión oficial: DeepSeek-V3.2 y DeepSeek-V3.2-Speciale. DeepSeek-V3.2 es nuestro primer modelo que integra el pensamiento en el uso de herramientas y al mismo tiempo admite la invocación de herramientas en modo de pensamiento y modo no de pensamiento. Hemos propuesto un método de síntesis de datos de entrenamiento de agentes a gran escala, construyendo una gran cantidad de tareas de aprendizaje por refuerzo “difíciles de responder, fáciles de verificar” (más de 1800 entornos, más de 85,000 instrucciones complejas), lo que mejora significativamente la capacidad de generalización del modelo. (DeepSeek)

Ver originales
Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el Aviso legal.
Comentar
0/400
GateUser-0ada9794vip
· 2025-12-04 16:10
Bull Run 🐂
Responder0
GateUser-0ada9794vip
· 2025-12-04 16:10
Bull Run 🐂
Responder0