OpenAI совместно с Paradigm запускает EVMbench, тестирование возможностей AI-агентов в защите и атаке смарт-контрактов EVM, выявляя слабые стороны и сильные стороны.
Лидер в области искусственного интеллекта OpenAI объявил о сотрудничестве с известной компанией по рисковым инвестициям в криптовалюты Paradigm и компанией по безопасности OtterSec для запуска EVMbench — инструмента для оценки безопасности AI-агентов в контексте смарт-контрактов Ethereum Virtual Machine (EVM).
По мере углубления интеграции AI и криптотехнологий, смарт-контракты становятся ключевой инфраструктурой для управления более чем триллионом открытых криптоактивов. Появление этого инструмента символизирует начало осознания индустрией практических возможностей AI в условиях «экономически значимой среды».
Команда OpenAI отмечает, что с ростом возможностей AI-агентов в написании и планировании кода, в будущем эти модели будут играть трансформирующую роль в атаках и защите блокчейна. Поэтому создание стандартизированной системы оценки становится критически важным для мониторинга прогресса AI.
Ядро EVMbench построено на базе 120 уязвимостей, извлечённых из 40 профессиональных аудиторских отчётов, включая известные публичные конкурсы по аудиту Code4rena, что обеспечивает реалистичность сценариев. Стандарт включает три режима оценки AI-агентов:
Источник: OpenAI EVMbench — ядро системы заключается в оценке AI-агентов в трёх режимах работы
Для обеспечения строгой повторяемости и надёжности тестирования команда разработала архитектуру на базе Rust, использующую детерминированное воспроизведение транзакций для проверки успешности атак или исправлений AI.
В первых результатах тестирования видно, что AI показывает значительные различия в эффективности в зависимости от задачи. Новое поколение GPT-5.3-Codex показывает отличные результаты в режиме эксплуатации (Exploit Mode), набрав 72,2 %, что значительно превосходит показатели GPT-5, выпущенной всего шесть месяцев назад (31,9 %), демонстрируя поразительный рост возможностей.
Источник: Обзор результатов различных моделей AI OpenAI в трёх режимах
Это свидетельствует о том, что при ясной цели «вывести средства из системы» AI обладает мощными возможностями по планированию и выполнению атак. Однако в защитных сценариях показатели остаются слабее: AI часто останавливается после обнаружения одной уязвимости и не продолжает поиск, а при исправлении сложных логик зачастую не удаётся устранить уязвимость без нарушения работы контракта. Эксперты по безопасности выражают обеспокоенность, что AI может значительно сократить время от обнаружения уязвимости до разработки атаки, что повышает требования к скорости защиты DeFi-проектов.
Помимо разработки инструментов, OpenAI активно занимается привлечением специалистов и укреплением экосистемы защиты. Недавно был нанят основатель проекта открытых AI-агентов OpenClaw Питер Штайнбергер, который возглавит разработку следующего поколения персонализированных агентов и преобразует проект в фонд, поддерживаемый OpenAI.
Для противодействия возможным киберрискам, связанным с AI, OpenAI обещает выделить 10 миллионов долларов на гранты по кибербезопасности через свою программу поддержки, чтобы финансировать разработку открытых инструментов защиты и исследование ключевой инфраструктуры. Эта инициатива особенно актуальна после инцидента с протоколом Moonwell, где из-за ошибки в коде, связанной с AI, было потеряно около 1,78 миллиона долларов.
Дополнительные материалы
Отказ от миллиардных предложений Meta, создатель OpenClaw присоединяется к борьбе за таланты в OpenAI, предсказания о сбоях в протоколе Moonwell — кто заплатит за убытки в 1,78 миллиона долларов?
В будущем, по мере внедрения более автоматизированных и AI-ассистированных платежных решений и автоматизированных кошельков, использование таких инструментов, как EVMbench, для различения моделей, способных только описывать уязвимости, и моделей, способных надёжно обеспечивать защиту, станет ключевым моментом в развитии индустрии блокчейн-безопасности.
Связанные статьи
Core Scientific продаст 2 500 биткоинов в связи с переходом компании к ИИ
Visa расширяет сферу использования стабильных валют: совместно с Bridge выпускает стабильную валютную карту, планируя охватить более 100 стран
Ripple объем платежей превысил 100 миллиардов долларов, ликвидность XRP на Binance достигла нового минимума
Stripe приобрела платформу для организации стабильных монет Bridge, объем торгов которой вырос в четыре раза, активно расширяя глобальную платежную сеть VISA
Byreal движется к Agent-Native DEX, открытый исходный код первого AI Skill, поддерживающего копирование стратегий
Ripple расширяет платежную платформу до полноценной инфраструктуры для стабильных монет