¿Pueden los agentes de IA mejorar la seguridad de Ethereum? OpenAI y Paradigm crearon un campo de pruebas

ETH-2,62%

En resumen

  • EVMbench prueba a agentes de IA en 120 vulnerabilidades reales de contratos inteligentes de Ethereum.
  • La herramienta evalúa detección, parcheo y explotación en tres modos distintos.
  • GPT-5.3-Codex logró una tasa de éxito del 72.2% en pruebas en modo de explotación.

El creador de ChatGPT, OpenAI, y la firma de inversión centrada en criptomonedas Paradigm han presentado EVMbench, una herramienta para mejorar la seguridad de los contratos inteligentes en la Máquina Virtual de Ethereum. EVMbench está diseñada para evaluar la capacidad de los agentes de IA para detectar, parchear y explotar vulnerabilidades de alta gravedad en contratos inteligentes de la Máquina Virtual de Ethereum (EVM). Los contratos inteligentes son el corazón de la red de Ethereum, conteniendo el código que impulsa todo, desde protocolos de finanzas descentralizadas hasta lanzamientos de tokens. Según Token Terminal, el número semanal de contratos inteligentes desplegados en Ethereum alcanzó un máximo histórico de 1.7 millones en noviembre de 2025, con 669,500 desplegados solo la semana pasada.

EVMbench se basa en 120 vulnerabilidades seleccionadas de 40 auditorías, la mayoría provenientes de competencias abiertas de auditoría como Code4rena, según una publicación en el blog de OpenAI. También incluye escenarios del proceso de auditoría de seguridad para Tempo, la blockchain de capa 1 diseñada por Stripe, centrada en pagos con stablecoins de alto rendimiento y bajo costo. El gigante de pagos Stripe lanzó la red de prueba pública de Tempo en diciembre, afirmando en ese momento que se construía con aportes de Visa, Shopify y OpenAI, entre otros. El objetivo es fundamentar las pruebas en código del mundo real y económicamente relevante, especialmente a medida que los pagos con stablecoins impulsados por IA se expanden, añadió la firma.

Presentamos EVMbench, un nuevo estándar que mide qué tan bien pueden detectar, explotar y parchear vulnerabilidades de alta gravedad en contratos inteligentes los agentes de IA. https://t.co/op5zufgAGH

— OpenAI (@OpenAI) 18 de febrero de 2026

EVMbench está diseñado para evaluar modelos de IA en tres modos: Detectar, parchear y explotar. En “detectar,” los agentes auditan repositorios y se les califica por su capacidad de recordar vulnerabilidades reales. En “parchear,” los agentes deben eliminar vulnerabilidades sin romper la funcionalidad prevista. Finalmente, en la fase de “explotar,” los agentes intentan ataques completos de drenaje de fondos en un entorno de blockchain aislado, con la calificación basada en la reproducción determinista de transacciones. En modo de explotación, GPT-5.3-Codex, ejecutándose a través de la CLI de Codex de OpenAI, logró una puntuación del 72.2%, en comparación con el 31.9% de GPT-5, que fue lanzado seis meses antes. El rendimiento fue menor en las tareas de detección y parcheo, donde los agentes a veces no auditaron exhaustivamente o tuvieron dificultades para mantener toda la funcionalidad del contrato. Los investigadores de OpenAI, creadores de ChatGPT, advirtieron que EVMbench no captura completamente la complejidad de la seguridad en el mundo real. Sin embargo, añadieron que medir el rendimiento de la IA en entornos económicamente relevantes es fundamental a medida que los modelos se convierten en herramientas poderosas tanto para atacantes como para defensores. Sam Altman de OpenAI y Vitalik Buterin, cofundador de Ethereum, ya habían tenido desacuerdos sobre el ritmo del desarrollo de la IA. En enero de 2025, Altman afirmó que su firma estaba “segura de saber cómo construir una AGI como la hemos entendido tradicionalmente.” Pero Buterin abogó por que los sistemas de IA incluyeran una capacidad de “pausa suave” que pudiera restringir temporalmente operaciones de IA a escala industrial si surgían señales de advertencia.

Ver originales
Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el Aviso legal.

Artículos relacionados

Vitalik: Los mercados de predicción nos ayudan a entender el mundo y el futuro cercano

BlockBeats Noticias, el 6 de marzo, el fundador de Ethereum, Vitalik Buterin, expresó que los mercados de predicción ayudan a entender mejor el mundo y el futuro cercano posible. Espero que los proyectos de mercados de predicción optimicen más esta dirección, especialmente los mercados condicionales. BlockBeats ya ha lanzado la sección de mercados de predicción, donde los usuarios pueden suscribirse a notificaciones exclusivas.

GateNewsHace3m

Datos: en las últimas 24 horas, liquidaciones en toda la red por 274 millones de dólares, liquidaciones de posiciones largas por 189 millones de dólares, liquidaciones de posiciones cortas por 85,946,900 dólares

ChainCatcher mensaje, según datos de Coinglass, en las últimas 24 horas se han liquidado 274 millones de dólares en toda la red, con 189 millones de dólares en posiciones largas y 85,946.9 mil dólares en posiciones cortas. Entre ellas, las liquidaciones en Bitcoin en posiciones largas alcanzaron 72,595.5 mil dólares, y en posiciones cortas 31,113.8 mil dólares. En Ethereum, las liquidaciones en posiciones largas fueron de 38,541.4 mil dólares y en posiciones cortas de 24,849.9 mil dólares.

GateNewshace3h

Datos: Si ETH supera los 2,168 dólares, la intensidad total de liquidación de posiciones cortas en los principales CEX alcanzará los 624 millones de dólares

ChainCatcher mensaje, según datos de Coinglass, si ETH supera los 2,168 dólares, la fuerza total de liquidación de posiciones cortas en los principales CEX alcanzará los 6.24 mil millones de dólares. Por el contrario, si ETH cae por debajo de 1,964 dólares, la fuerza total de liquidación de posiciones largas en los principales CEX alcanzará los 3.05 mil millones de dólares.

GateNewshace5h

Las predicciones del precio de Bitcoin cambian a alcistas, pero Ethereum todavía está atascado

Los pronosticadores se han vuelto alcistas en el precio a corto plazo de Bitcoin, sugiriendo un aumento hasta $84,000 antes de una posible caída. Sin embargo, los analistas siguen divididos sobre la sostenibilidad, mientras que el sentimiento hacia Ethereum es bajista, con expectativas de una caída a $1,500.

Decrypthace7h

Mejor Cripto para Comprar Ahora: SOL y LINK en alza, pero Pepeto apunta a 100x mientras la Fundación Ethereum planea convertir ETH en la capa de confianza para la IA

La Fundación Ethereum acaba de anunciar planes para posicionar la red como la capa de confianza para la inteligencia artificial, con el líder de IA de la fundación diciendo que ETH actuará como la capa de coordinación y verificación en un mundo cada vez más mediado por IA, y cuando la plataforma de contratos inteligentes más grande en

CaptainAltcoinhace7h
Comentar
0/400
Sin comentarios