Según el monitoreo de 1M AI News, Anthropic está probando un modelo nuevo llamado «Claude Mythos». Debido a un error de configuración en su sistema de gestión de contenidos, un borrador de blog no publicado fue almacenado en una base de datos pública y indexable, revelando accidentalmente la existencia de ese modelo. Anthropic confirmó posteriormente el modelo, afirmando que representa un «salto cualitativo» (step change) de las capacidades y que es «el modelo más potente que hemos construido hasta ahora».
El borrador filtrado muestra que Mythos es un nivel de modelo completamente nuevo, posicionado por encima de la serie Opus. El borrador afirma que «en comparación con el mejor modelo anterior, Claude Opus 4.6, este modelo logra puntuaciones significativamente más altas en pruebas de programación de software, razonamiento académico y ciberseguridad». En el borrador también aparece el código «Capybara», que apunta al mismo modelo subyacente que Mythos.
Anthropic está especialmente cautelosa con las capacidades de ciberseguridad del modelo. El borrador afirma que «en capacidades de ciberseguridad actualmente supera con mucha diferencia a cualquier otro modelo de IA» y que «anticipa una próxima oleada de modelos, cuyos conocimientos de explotación de vulnerabilidades superarán con creces la velocidad de respuesta de los defensores». Por ello, Anthropic adoptó una estrategia de lanzamiento más lenta que en el pasado: primero abrirá el acceso a un pequeño grupo de clientes iniciales, centrando el esfuerzo en escenarios de defensa de ciberseguridad y ayudando a las organizaciones a reforzar sus repositorios de código antes de que llegue la próxima ola de ataques impulsados por IA. El modelo tiene un costo de operación extremadamente alto, por lo que a corto plazo no se abrirá al público.
Esta filtración se debió a un «error humano» por parte de una herramienta externa de CMS de Anthropic, que provocó que cerca de 3000 activos no publicados (incluyendo borradores de blogs, imágenes y PDF) se almacenaran públicamente en una base de datos sin cifrar. Los investigadores en ciberseguridad Alexandre Pauwels, de la Universidad de Cambridge, y Roy Paz, investigador sénior de IA segura en LayerX Security, descubrieron esos archivos de forma independiente. El contenido filtrado también incluye detalles de la cumbre privada de CEO de empresas europeas que Anthropic celebrará en Reino Unido: el CEO Dario Amodei asistirá, y el evento tendrá lugar en un hotel-mansión del siglo XVIII en el campo del Reino Unido.
Un portavoz de Anthropic dijo: «Estamos desarrollando un modelo de propósito general, con avances significativos en razonamiento, programación y ciberseguridad. Dada la intensidad de sus capacidades, seremos muy prudentes en la forma en que lo demos a conocer».