OpenAI ha presentado un marco de referencia para medir qué tan eficazmente pueden detectar, mitigar e incluso explotar vulnerabilidades de seguridad en contratos inteligentes de criptomonedas los agentes de IA. El proyecto, titulado “EVMbench: Evaluando agentes de IA en la seguridad de contratos inteligentes”, fue lanzado en colaboración con Paradigm y OtterSec, dos organizaciones con amplia experiencia en seguridad y inversión en blockchain. El estudio evalúa a los agentes de IA frente a un conjunto seleccionado de 120 posibles puntos débiles extraídos de 40 auditorías de contratos inteligentes, buscando cuantificar no solo sus capacidades de detección y corrección, sino también el potencial teórico de explotación de estos agentes en un entorno controlado.
Aspectos clave
EVMbench prueba a los agentes de IA contra 120 vulnerabilidades seleccionadas de 40 auditorías de contratos inteligentes, haciendo énfasis en vulnerabilidades provenientes de competencias de auditoría de código abierto.
Entre los modelos evaluados, Claude Opus 4.6 de Anthropic lideró con un premio promedio de detección de $37,824, seguido por OC-GPT-5.2 de OpenAI con $31,623 y Gemini 3 Pro de Google con $25,112.
OpenAI enmarca el marco de referencia como un paso hacia la medición del rendimiento de la IA en “entornos económicamente significativos”, no solo tareas de juguete, destacando las implicaciones reales para atacantes y defensores en el panorama de seguridad en cripto.
Los investigadores señalan que los contratos inteligentes aseguran miles de millones de dólares en activos, subrayando el valor estratégico de las herramientas habilitadas por IA para actividades ofensivas y defensivas.
Los observadores de la industria han vinculado estos avances con discusiones más amplias sobre pagos impulsados por IA y el papel de las stablecoins en transacciones cotidianas, con altos ejecutivos prediciendo un uso creciente de agentes en los próximos años.
El contexto para este trabajo se refuerza con los datos de incidentes de seguridad en cripto de 2025, que muestran un flujo continuo de fondos a través de vulnerabilidades y ataques, reforzando la demanda de auditorías y mecanismos de defensa robustos habilitados por IA.
Los premios de detección para los agentes de IA se detallan en el PDF de OpenAI que acompaña al estudio, el cual también describe la metodología de evaluación y los escenarios utilizados para simular riesgos en contratos inteligentes reales. Los autores enfatizan que, aunque los agentes de IA han evolucionado para automatizar una amplia gama de tareas rutinarias, evaluar su rendimiento en “entornos económicamente significativos” es esencial para entender cómo actuarán bajo presión en sistemas de producción.
“Los contratos inteligentes aseguran miles de millones de dólares en activos, y es probable que los agentes de IA sean transformadores tanto para atacantes como para defensores.”
OpenAI señala que espera que las tecnologías agenticas amplíen el alcance de pagos y liquidaciones, incluyendo las stablecoins utilizadas en flujos de trabajo automatizados. La discusión sobre pagos habilitados por IA va más allá de las pruebas de seguridad y aborda la cuestión más amplia de cómo los sistemas autónomos participarán en la actividad financiera diaria. Las propias proyecciones de la compañía sugieren que los pagos agenticos podrían volverse más comunes, fundamentando las capacidades de IA en casos prácticos que afectan las transacciones cotidianas de los consumidores.
Junto con los resultados del marco de referencia, Jeremy Allaire, CEO de Circle, ha pronosticado públicamente que en los próximos cinco años miles de millones de agentes de IA podrían estar realizando transacciones con stablecoins para pagos diarios. Esa visión se cruza con un tema recurrente en círculos cripto: el potencial de que las criptomonedas se conviertan en la moneda nativa de los agentes de IA, una narrativa que ha ganado atención notable por parte de líderes de la industria e inversores. Aunque estas predicciones siguen siendo especulativas, la tendencia subyacente es clara: la automatización por IA avanza del laboratorio a la capa de transacción, donde podría transformar la forma en que se mueve el valor a través de las redes.
El estudio llega en un momento en que la seguridad en cripto sigue siendo un factor de riesgo importante para los inversores. El dato sobre el ataque a fondos cripto en 2025, donde los atacantes sustrajeron aproximadamente 3.4 mil millones de dólares, resalta la urgencia de mejorar las herramientas y acelerar los mecanismos de parcheo confiables. El marco EVMbench se posiciona, en parte, como una forma de medir si los agentes de IA pueden contribuir de manera significativa a las capacidades defensivas a escala, reduciendo oportunidades de explotación y acelerando la mitigación de amenazas.
Para construir el marco de referencia, los investigadores analizaron 120 vulnerabilidades seleccionadas de 40 auditorías de contratos inteligentes, muchas de las cuales se remontan a desafíos de auditoría de código abierto. OpenAI argumenta que el marco ayudará a seguir el progreso de la IA en el reconocimiento y mitigación de debilidades a nivel de contrato a gran escala, ofreciendo una forma estandarizada de comparar futuros modelos de IA a medida que evolucionan. El estudio también proporciona una visión sobre cómo la IA podría aplicarse para normalizar la evaluación de riesgos en una amplia variedad de arquitecturas de contratos inteligentes, en lugar de centrarse únicamente en casos aislados.
Los contratos inteligentes no fueron diseñados para humanos: Dragonfly
En un hilo contemporáneo en X, Haseeb Qureshi, socio de Dragonfly, argumentó que la promesa de las criptomonedas de reemplazar los derechos de propiedad y los contratos tradicionales nunca se materializó no porque la tecnología fallara, sino porque nunca fue diseñada pensando en la intuición humana. Ha destacado el temor persistente asociado a firmar transacciones grandes en un entorno donde las billeteras drenadoras y otros vectores de ataque siguen siendo una amenaza constante, en marcado contraste con la experiencia más fluida de las transferencias bancarias tradicionales.
Qureshi sostiene que la próxima fase de las transacciones cripto podría ser habilitada por billeteras autoconducidas e intermediadas por IA. Estas billeteras monitorearían riesgos, gestionarían operaciones complejas y responderían de forma autónoma a amenazas en nombre de los usuarios, potencialmente reduciendo la fricción y el temor que caracterizan las transferencias grandes hoy en día.
“Una tecnología suele encajar en su lugar una vez que llega su complemento. GPS tuvo que esperar al smartphone, TCP/IP tuvo que esperar al navegador. Para las criptomonedas, quizás ya la hemos encontrado en los agentes de IA.”
La conclusión más amplia de este hilo es que los agentes de IA podrían jugar un papel clave en transformar la forma en que las personas interactúan con las criptomonedas—pasando de transacciones manuales y propensas a errores a procesos automatizados y conscientes del riesgo que puedan escalar con la adopción. A medida que los agentes de IA demuestren mayor competencia en la gestión de preocupaciones de seguridad, los usuarios podrían experimentar mayor fiabilidad y resiliencia en los flujos de trabajo de finanzas descentralizadas, incluso mientras las tecnologías subyacentes continúan madurando.
Qué seguir observando
Publicación y replicación independiente del conjunto completo de datos de EVMbench en otros modelos y arquitecturas de IA.
Mayor adopción de flujos de auditoría asistidos por IA por parte de auditores, exchanges y proyectos DeFi que buscan fortalecer sus posturas de seguridad.
Exploraciones en billeteras agenticas y flujos de pagos autónomos, incluyendo consideraciones regulatorias y de cumplimiento para activos gestionados por IA.
Próximos benchmarks comparando más sistemas de IA a medida que se lanzan nuevas versiones, siguiendo mejoras en precisión de detección y velocidad de parcheo.
Fuentes y verificación
OpenAI: EVMbench: Evaluando agentes de IA en la seguridad de contratos inteligentes — PDF: https://cdn.openai.com/evmbench/evmbench.pdf
OpenAI: Presentando EVMbench — https://openai.com/index/introducing-evmbench/
Pérdidas en seguridad cripto en 2025 (cobertura del informe): https://cointelegraph.com/news/crypto-3-4-billion-losses-2025-wallet-hacks
Dragonfly: Haseeb Qureshi sobre IA y experiencia de usuario en cripto (publicación en X): https://x.com/hosseeb/status/2024136762424185208
Liderazgo en IA en China y sus implicaciones en cripto (análisis): https://cointelegraph.com/news/china-ai-lead-future
AI Eye — Desarrollo de IronClaw y bots de IA en cobertura de Polymarket: https://cointelegraph.com/magazine/ironclaw-secure-private-sounds-cooler-openclaw-ai-eye/
Figuras clave y próximos pasos
El estudio EVMbench demuestra que los grandes modelos de lenguaje y los agentes de IA relacionados están comenzando a realizar trabajos de seguridad relevantes en el espacio de contratos inteligentes, con diferencias claramente cuantificables entre modelos. La ventaja de Claude Opus 4.6 en premios de detección promedio indica que ciertas arquitecturas pueden ser más hábiles para detectar y mitigar vulnerabilidades en lógica compleja de contratos, mientras que otras quedan rezagadas, ofreciendo un espectro de capacidades que los investigadores probablemente querrán perfeccionar. La inclusión de múltiples asociaciones industriales en el proyecto subraya el consenso creciente de que la seguridad habilitada por IA y la gestión automatizada de riesgos podrían volverse esenciales para escalar en entornos descentralizados.
A medida que el campo evoluciona, los observadores estarán atentos a qué tan rápido los agentes de IA pueden pasar de la detección a la remediación, y si estos agentes pueden operar de manera confiable en sistemas en vivo sin introducir nuevos riesgos. La discusión sobre billeteras impulsadas por IA y pagos autónomos aborda un conjunto más amplio de preguntas sobre gobernanza de seguridad, consentimiento del usuario y alineación regulatoria. Si la trayectoria sugerida por OpenAI y sus socios continúa, las herramientas asistidas por IA podrían convertirse en un componente central de la infraestructura cripto futura, cambiando tanto el cálculo de riesgos como la experiencia del usuario de manera significativa. La próxima ronda de benchmarks, junto con despliegues en el mundo real, ayudará a determinar qué tan rápido se materializa esta visión y qué salvaguardas deben acompañarla.
Este artículo fue publicado originalmente como OpenAI enfrenta a agentes de IA entre sí para realizar pruebas de seguridad en contratos inteligentes en Crypto Breaking News, tu fuente confiable de noticias cripto, noticias de Bitcoin y actualizaciones de blockchain.