Anthropic lanza Claude Opus 4.7 con salvaguardas de ciberseguridad

Mensaje de Gate News, 17 de abril — Anthropic anunció Claude Opus 4.7, un modelo de IA que incluye salvaguardas diseñadas para bloquear solicitudes de ciberseguridad de alto riesgo. El lanzamiento se basa en Claude Opus 4.6, presentado en febrero, y precede a un despliegue más amplio de los modelos de clase Mythos, más avanzados, de Anthropic. Mythos Preview, presentado a principios de este mes, sigue siendo más capaz que Opus 4.7, pero actualmente solo está disponible para un conjunto limitado de empresas a través de Project Glasswing, el programa de ciberseguridad de Anthropic.

Opus 4.7 ofrece mejoras significativas en los flujos de trabajo agentic y en las capacidades de visión. El rendimiento de codificación autónoma subió a 64.3% en SWE-bench Pro, un punto de referencia ampliamente utilizado para tareas de ingeniería de software, desde 53.4% en la versión anterior. El manejo de imágenes ahora admite más del triple de la resolución, con una mejora en la precisión de agudeza visual de 54.5% a 98.5% en pruebas estándar. Durante el entrenamiento se implementaron limitaciones intencionales de ciberseguridad; en CyberGym, un punto de referencia de rendimiento de ciberseguridad, Opus 4.7 obtuvo 73.1%, por debajo del 83.1% de Mythos Preview.

Anthropic restringió Mythos Preview después de pruebas previas al lanzamiento que descubrieron miles de vulnerabilidades de alta criticidad, incluida una falla en OpenBSD que no se detectó durante 27 años. Los investigadores de seguridad que realicen investigación de vulnerabilidades, pruebas de penetración o ejercicios de red team pueden solicitar a través del Programa de Verificación Cibernética de Anthropic acceso defensivo sin rechazos predeterminados. Los comentarios sobre las salvaguardas de Opus 4.7 informarán los próximos lanzamientos de modelos.

Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el Aviso legal.

Artículos relacionados

Intchains Group Revela 8,040 ETH en Staking y Acelera la Transformación de Operaciones Impulsadas por IA

Intchains Group informó un monto de staking acumulado de 8,040 ETH, con una estrategia que incluye la plataforma FalconX y su propio Goldshell Stake. La empresa también está mejorando las operaciones mediante automatización con IA para impulsar la eficiencia y la toma de decisiones.

GateNewsHace21m

¿Adata y Jay Chou ganan mucho? La agencia de gestión de GD se reúne a puerta cerrada con la familia real de Dubái para hablar sobre la OPV, la IA y los robots

La empresa de tecnología de entretenimiento de Corea Galaxy Corporation recientemente se ha expandido hacia el mercado de Oriente Medio, estableciendo la entidad en Dubái «Galaxy ME», y se reunió con miembros de la familia real de Emiratos Árabes Unidos para explorar la integración de la IA y el contenido. La empresa ya ha seleccionado a un intermediario bursátil para llevar a cabo su IPO; el año pasado sus ingresos alcanzaron 300 mil millones de wones surcoreanos y ha atraído inversiones de Jay Chou y de Adata, entre otros. Este planteamiento tiene como objetivo impulsar el desarrollo del ecosistema de entretenimiento en Oriente Medio, destacando la importancia de su estrategia de globalización.

ChainNewsAbmediahace1h

El equipo de China EvoMap enfurece: el Hermes Agent se vuelve viral por la explosión de popularidad, presunta copia: dentro del sistema de autoevolución existen similitudes de alta intensidad

El equipo de China EvoMap acusa al agente Hermes de Nous Research de copiar su arquitectura Evolver/GEP, y sostiene que ambos presentan un alto grado de similitud en varios módulos clave. EvoMap señala que el diseño de Hermes no hace referencia ni da reconocimiento a su contenido previamente publicado; la polémica ha despertado una amplia atención en la comunidad. Parte de los internautas chinos apoya a EvoMap y critica la conducta de copia de Hermes. Aunque el equipo de Nous aún no ha refutado punto por punto las acusaciones, el incidente se ha difundido rápidamente en la opinión pública sobre IA.

ChainNewsAbmediahace2h

¡A los primeros inversores de OpenAI les encantan! La nueva startup de interfaz cerebro-computadora Sabi lanzará a más tardar a fin de año un gorro de pelo que permite “escribir pensando”

La startup de Silicon Valley Sabi anunció que está desarrollando una interfaz cerebro-computadora portátil que no requiere cirugía invasiva; los usuarios solo tendrán que “pensar” para introducir texto en la pantalla, con una fecha prevista de lanzamiento a finales de 2026. El dispositivo contará con hasta cien mil micro sensores, lo que ayudará a interpretar con precisión la actividad cerebral; Sabi también recalca la protección de la privacidad de los datos.

ChainNewsAbmediahace2h

Se revela que “Claude pierde capacidad” no es un mito urbano; el modelo de IA es inestable y representa un riesgo empresarial

El artículo analiza el fenómeno de la inestabilidad del desempeño de los LLM (modelos de lenguaje a gran escala) en aplicaciones empresariales de IA, al que se le llama «descenso de capacidad» y se brindan ejemplos para explicar su impacto real en los flujos de trabajo de las empresas. Los datos muestran que la mayoría de los modelos principales se encuentran en un estado degradado, lo que afecta la productividad y la estabilidad de las empresas. Las empresas deben empezar a dar prioridad a la estabilidad del modelo como un nuevo estándar; de lo contrario, se enfrentarán a riesgos de infraestructura.

ChainNewsAbmediahace2h

OpenAI actualiza Codex a un agente de IA que controla el escritorio, automatizando los flujos de trabajo de desarrollo

El Codex mejorado de OpenAI evoluciona de un asistente de programación a un agente autónomo para entornos de escritorio, capaz de gestionar aplicaciones, automatizar flujos de trabajo e integrarse con más de 100 aplicaciones. Este cambio mejora la continuidad de las tareas y la automatización de flujos de trabajo, reflejando un panorama competitivo en herramientas de codificación con IA.

GateNewshace2h
Comentar
0/400
Sin comentarios