OpenAI и Paradigm запускают EVMbench для безопасности Ethereum

ETH3,05%
  • OpenAI и Paradigm создали EVMbench на основе 120 реальных уязвимостей, обнаруженных в аудитах.
  • Тестирование включает режимы обнаружения, исправления и эксплуатации с использованием изолированных сред EVM.
  • GPT-5.3-Codex набрал 72,2% в режиме эксплуатации, превзойдя предыдущие результаты GPT-5.

OpenAI в сотрудничестве с Paradigm представили новый бенчмарк для оценки эффективности ИИ в области безопасности смарт-контрактов Ethereum. Выпуск, анонсированный на этой неделе, включает EVMbench как инструмент для измерения способности ИИ обнаруживать, исправлять и эксплуатировать уязвимости контрактов. Эта инициатива актуальна в связи с ростом рисков, поскольку смарт-контракты обеспечивают безопасность более 100 миллиардов долларов в криптоактивах на сетях EVM.

Бенчмарк, основанный на реальных ошибках аудита

По данным OpenAI, EVMbench основан на 120 уязвимостях высокой степени серьезности, выявленных в 40 профессиональных аудитах смарт-контрактов. Многие из этих проблем возникли в ходе открытых конкурсов по аудиту, включая Code4rena. Бенчмарк фокусируется на реальных ошибках, а не на синтетических примерах.

Кроме того, OpenAI сообщил, что в набор данных включены сценарии, связанные с безопасностью сети Tempo. Tempo функционирует как платежная Layer-1 сеть, предназначенная для переводов стейблкоинов. Поэтому эти случаи вводят в бенчмарк риски, связанные с платежной логикой.

Для реалистичного тестирования инженеры использовали готовые скрипты доказательства концепции эксплуатации, где они были доступны. В случае отсутствия документации компоненты создавались вручную. OpenAI заявил, что при этом сохранили возможность эксплуатации уязвимостей и обеспечили корректную компиляцию патчей.

Три режима тестирования для проверки ИИ

EVMbench оценивает агенты в режимах обнаружения, исправления и эксплуатации. В режиме обнаружения агенты сканируют репозитории и получают оценки за полноту обнаружения подтвержденных уязвимостей. В режиме исправления агенты должны устранить недостатки, сохраняя исходное поведение контракта.

Режим эксплуатации симулирует полное исчерпание средств в песочнице блокчейна. OpenAI сообщил, что результаты проверяются через повтор транзакций и проверки состояния на блокчейне. Для обеспечения повторяемости компания создала тестовую среду на базе Rust для детерминированных развертываний.

Тесты эксплуатации выполняются в локальной среде Anvil, а не в реальных сетях. OpenAI отметил, что все уязвимости являются историческими и публично раскрытыми. Также среда ограничивает опасные RPC-запросы для предотвращения злоупотреблений.

Результаты и расширение команды

По результатам, GPT-5.3-Codex достиг 72,2% в режиме эксплуатации. Для сравнения, GPT-5 показал 31,9%, несмотря на запуск за несколько месяцев до этого. Однако OpenAI отметил, что охват обнаружения и исправления уязвимостей еще не завершен.

В дополнение к EVMbench OpenAI подтвердили ключевое новое назначение. Питер Штайнбергер, основатель OpenClaw, присоединился к компании для работы над развитием агентов. Сэм Альтман подтвердил это в X, отметив, что Штайнбергер возглавит проекты следующего поколения персональных агентов.

Посмотреть Оригинал
Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к Отказу от ответственности.

Связанные статьи

«Мачжи» увеличил позицию на 150 ETH в длинную сторону

BlockBeats сообщение, 5 марта, согласно мониторингу Hyperinsight, «麻吉大哥» 黄立成 увеличил позицию на Hyperliquid на 150 ETH (316,290 долларов)), текущая общая стоимость позиции составляет 14,561,890 долларов, цена ликвидации — 2,036 долларов, текущая прибыль и убыток по контракту — 240,897 долларов.

GateNews30м назад

ETH опустился ниже 2100 USDT

Gate News бот сообщение, отображение курса Gate, ETH опустился ниже 2100 USDT, текущая цена 2099.9 USDT.

CryptoRadar1ч назад

Кит 0x8f01 конвертирует 650 ETH в 1.88M ASTER в транзакции на сумму 1.4 миллиона долларов

Сообщение бота Gate News, адрес кита 0x8f01 продал 650 ETH на сумму 1.4 миллиона долларов 14 часов назад и впоследствии приобрёл 1.88 миллиона токенов ASTER на сумму 1.4 миллиона долларов. В настоящее время кит держит 4.45 миллиона токенов ASTER на общую сумму 3.18 миллиона долларов.

GateNews2ч назад

Прогноз цены Ethereum: ETH приближается к 2200 долларам, быки нацелены на важный уровень сопротивления в 2400 долларов

Цена Ethereum (ETH) недавно выросла до 2192 долларов, достигнув четырехнедельного максимума, под влиянием роста биткоина и положительных новостей о переговорах между США и Ираном. В рынке деривативов резко увеличился объем закрытия коротких позиций, активизировались длинные, заметен приток институциональных средств. Технический анализ показывает, что Ethereum может преодолеть психологический уровень в 2200 долларов, целевой уровень — 2400 долларов, что указывает на возможный разворот бычьего тренда.

GateNews2ч назад

Владельцы криптовалюты столкнулись с насильственным ограблением на сумму 24 миллиона долларов, объявлен награду в размере 10% за возврат украденных средств

Один из держателей криптовалюты сообщил в социальных сетях о нападении, в результате которого он потерял около 24 миллионов долларов в криптоактивах. Нападавшие с помощью угрозы насилием заставили его перевести средства, инцидент вызвал широкий резонанс, и компания по безопасности блокчейна отслеживает украденные средства. Этот случай подчеркивает рост риска физических атак в сфере криптовалют.

GateNews2ч назад
комментарий
0/400
Нет комментариев