OpenAI y Paradigm lanzan EVMbench para la seguridad de Ethereum

ETH-1,25%
  • OpenAI y Paradigm crearon EVMbench a partir de 120 vulnerabilidades reales detectadas en auditorías.

  • Las pruebas de referencia evalúan a la IA en modos de detección, parcheo y explotación utilizando entornos sandbox de EVM.

  • GPT-5.3-Codex obtuvo una puntuación del 72,2 % en modo de explotación, superando los resultados anteriores de GPT-5.

OpenAI, en colaboración con Paradigm, presentó un nuevo estándar para evaluar el rendimiento de la IA en la seguridad de contratos inteligentes en Ethereum. El lanzamiento, anunciado esta semana, introdujo EVMbench como una forma de medir cómo los agentes de IA detectan, corrigen y explotan fallos en los contratos. El esfuerzo responde a los riesgos crecientes, ya que los contratos inteligentes aseguran más de 100 mil millones de dólares en activos criptográficos en redes EVM.

Estándar basado en fallos reales de auditoría

Según OpenAI, EVMbench se basa en 120 vulnerabilidades de alta gravedad identificadas en 40 auditorías profesionales de contratos inteligentes. Es importante destacar que muchos de estos problemas provienen de concursos de auditoría abiertos, como Code4rena. El estándar se centra en errores reales en lugar de ejemplos sintéticos.

Además, OpenAI indicó que el conjunto de datos incluye escenarios relacionados con trabajos de seguridad en la cadena Tempo. Tempo funciona como una red Layer-1 enfocada en pagos, diseñada para transferencias de stablecoins. Debido a esto, estos casos introducen riesgos de lógica de pagos en el entorno de prueba.

Para apoyar pruebas realistas, los ingenieros reutilizaron scripts de prueba de concepto para exploits cuando estaban disponibles. Sin embargo, construyeron manualmente los componentes faltantes cuando la documentación era incompleta. OpenAI afirmó que se preservó la capacidad de explotación mientras se aseguraba que los parches pudieran compilarse correctamente.

Tres modos de prueba que desafían a los agentes de IA

EVMbench evalúa a los agentes en modos de detección, parcheo y explotación. En modo de detección, los agentes escanean repositorios y reciben puntuaciones basadas en la recuperación de vulnerabilidades confirmadas. En modo de parcheo, los agentes deben corregir fallos manteniendo el comportamiento original del contrato.

El modo de explotación, sin embargo, simula ataques completos de drenaje de fondos en una blockchain sandbox. OpenAI indicó que los evaluadores confirman los resultados mediante la reproducción de transacciones y verificaciones del estado en cadena. Para garantizar la consistencia, la compañía desarrolló una herramienta en Rust para despliegues deterministas.

Las pruebas de explotación se ejecutan en un entorno local Anvil, no en redes en vivo. OpenAI señaló que todas las vulnerabilidades son históricas y de conocimiento público. Además, la herramienta restringe llamadas RPC inseguras para reducir el uso indebido.

Resultados y expansión del equipo

En los resultados reportados, GPT-5.3-Codex logró una puntuación del 72,2 % en modo de explotación. En comparación, GPT-5 alcanzó un 31,9 %, a pesar de haberse lanzado meses antes. Sin embargo, OpenAI afirmó que la cobertura en detección y parcheo aún no está completa.

Junto con EVMbench, OpenAI confirmó una incorporación clave. Peter Steinberger, fundador de OpenClaw, se unió a la empresa para trabajar en el desarrollo de agentes. Sam Altman confirmó el movimiento en X, señalando que Steinberger liderará proyectos de agentes personales de próxima generación.

Ver originales
Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el Aviso legal.

Artículos relacionados

El concesionario de Lamborghini en Estados Unidos acepta pagos en Ethereum, ETH abre un escenario de consumo de autos de lujo

Variados concesionarios de Lamborghini en Estados Unidos comienzan a aceptar Ethereum como método de pago para la compra de vehículos, lo que demuestra que los pagos con activos criptográficos se están expandiendo hacia el consumo de lujo en el mundo offline. Los concesionarios procesan las transacciones mediante pagos en criptomonedas, evitando el riesgo de volatilidad de precios y promoviendo la integración gradual de los activos digitales en la economía real. Aunque existen diferentes opiniones, cada vez más marcas intentan aceptar pagos en criptomonedas, mostrando que los activos digitales están estableciendo nuevos escenarios de pago en el comercio convencional.

GateNewsHace2m

La fila de validadores de Ethereum alcanza un máximo histórico, los grandes inversores optan por apostar en lugar de vender

Actualmente, aproximadamente 3.4 millones de ETH están en espera para unirse al conjunto de validadores de Ethereum, con un tiempo de espera de 60 días. La demanda proviene principalmente de grandes empresas y exchanges, que obtienen ingresos estables a través del staking. Esta tendencia indica una preferencia de los inversores institucionales por mantener a largo plazo, relacionada con un aumento en la confianza del mercado.

MarketWhisperHace53m

El conflicto en Oriente Medio impacta los mercados bursátiles asiáticos, Bitcoin mantiene el nivel de 67,000 dólares, Ethereum y Solana enfrentan presión y retroceden

La tensión geopolítica en Oriente Medio continúa, aumentando la aversión al riesgo en los mercados financieros asiáticos, con las principales bolsas cayendo significativamente. Bitcoin sufrió una ligera caída pero aún se mantiene en un rango clave, mientras el mercado presta atención a la entrada de fondos institucionales y ETF. Ethereum, Solana y otras criptomonedas principales han corregido, y la preferencia por el riesgo se ha reducido. La incertidumbre en el entorno macroeconómico y la volatilidad en el mercado energético han aumentado la presión en el mercado.

GateNewshace1h

Ayer, la entrada neta en los ETF de Bitcoin en EE. UU. fue de 225 millones de dólares, y los ETF de Ethereum tuvieron una salida neta de 10,8 millones de dólares.

El 4 de marzo, la entrada neta en los ETF de Bitcoin al contado en EE. UU. alcanzó los 225.2 millones de dólares, siendo BlackRock IBIT el que más ingresó, mientras que Fidelity FBTC tuvo una salida significativa; los ETF de Ethereum al contado tuvieron una salida neta de 10.8 millones de dólares, siendo Fidelity FETH la que más salió.

GateNewshace1h

Vitalik Buterin insta a Ethereum a ampliar su misión más allá de las finanzas

En resumen Vitalik Buterin dijo que Ethereum debería construir un ecosistema completo más allá de las finanzas descentralizadas. Instó a los desarrolladores a apoyar herramientas de privacidad, coordinación descentralizada e infraestructura abierta. Algunos observadores dicen que Ethereum debería mantenerse enfocado en DeFi, mientras que otros respaldan el

Decrypthace1h
Comentar
0/400
Sin comentarios
Opera con criptomonedas en cualquier momento y lugar
qrCode
Escanea para descargar la aplicación de Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)