OpenAI та Paradigm запускають EVMbench для безпеки Ethereum

ETH2,58%
  • OpenAI та Paradigm створили EVMbench на основі 120 реальних вразливостей під час аудиту.

  • Бенчмарк тестує ШІ у режимах виявлення, виправлення та експлуатації за допомогою ізольованих середовищ EVM.

  • GPT-5.3-Codex набрав 72,2% у режимі експлуатації, перевершивши попередні результати GPT-5.

OpenAI у співпраці з Paradigm представили новий бенчмарк для тестування продуктивності ШІ у сфері безпеки смарт-контрактів Ethereum. Випуск, оголошений цього тижня, запроваджує EVMbench як спосіб оцінки здатності агентів ШІ виявляти, виправляти та експлуатувати вразливості контрактів. Це зусилля спрямоване на зростаючі ризики, оскільки смарт-контракти забезпечують понад 100 мільярдів доларів у криптоактивах у мережах EVM.

Бенчмарк створений на основі реальних помилок аудиту

За словами OpenAI, EVMbench базується на 120 високоризикових вразливостях, виявлених у 40 професійних аудитах смарт-контрактів. Важливо, що багато з цих проблем виникли під час відкритих конкурсів аудиту, зокрема Code4rena. Бенчмарк зосереджений на реальних багів, а не на синтетичних прикладах.

Крім того, OpenAI повідомила, що набір даних включає сценарії, пов’язані з безпековою роботою на мережі Tempo. Tempo функціонує як мережа Layer-1, орієнтована на платежі, створена для переведень стабільних монет. Через це ці випадки вводять ризики, пов’язані з логікою платежів, у середовище бенчмарку.

Для підтримки реалістичного тестування інженери повторно використовували скрипти доказів концепції експлойтів, де вони були доступні. Однак, у разі відсутності документації, вони вручну створювали необхідні компоненти. OpenAI заявила, що зберегла можливість експлуатації, водночас забезпечуючи коректне компілювання патчів.

Три режими тестування навантажують ШІ-агентів

EVMbench оцінює агентів у режимах виявлення, виправлення та експлуатації. У режимі виявлення агенти сканують репозиторії та отримують бали за кількістю підтверджених вразливостей. У режимі виправлення агенти повинні усунути недоліки, зберігаючи початкову поведінку контракту.

Режим експлуатації імітує повномасштабні атаки з витіканням коштів у ізольованому блокчейні. OpenAI повідомила, що оцінювачі підтверджують результати через повторний запуск транзакцій та перевірки стану на ланцюгу. Для забезпечення послідовності компанія створила рушій на мові Rust для детермінованих розгортань.

Тести експлуатації виконуються у локальному середовищі Anvil, а не у живих мережах. OpenAI зазначила, що всі вразливості є історичними та публічно розкритими. Крім того, рушій обмежує небезпечні виклики RPC для зменшення зловживань.

Результати та розширення команди

У оприлюднених результатах GPT-5.3-Codex набрав 72,2% у режимі експлуатації. Для порівняння, GPT-5 досяг 31,9%, хоча був запущений кілька місяців раніше. Водночас, OpenAI зазначила, що покриття виявлення та виправлення ще не є повним.

Разом із EVMbench OpenAI підтвердила найм ключового співробітника. Петер Штайнбергер, засновник OpenClaw, приєднався до компанії для роботи над розвитком агентів. Сем Альтман підтвердив цю новину у X, зазначивши, що Штайнбергер очолить проєкти наступного покоління персональних агентів.

Переглянути оригінал
Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.

Пов'язані статті

«ETH波段大师» збільшив свою нереалізовану прибутковість до 12 мільйонів доларів і поки що не закрив позиції, нещодавно успішно закупив BTC за середньою ціною 68 000 доларів.

3 березня повідомляється, що адреса «ETH波段大师» наразі має ETH з 15-кратним кредитним плечем у довгих позиціях, з плаваючим прибутком у 9,2 мільйона доларів. Також ця адреса на короткостроковому дні дно BTC і ETH також купувала BTC на дні, з плаваючим прибутком понад 2,8 мільйона доларів. Загальний плаваючий прибуток перевищує 11 мільйонів доларів, очікується подальше зростання.

GateNews12хв. тому

Bitmine знову купує на дні! Том Лі впевнений у трьох великих перевагах Ethereum

Bitmine Immersion Technologies минулого тижня збільшила свої володіння на 51,162 ETH, загальна кількість активів становить 4,42 мільйони ETH, що оцінюється приблизно у 8,7 мільярдів доларів США, ставши найбільшим публічною компанією за кількістю володінь ETH. Незважаючи на складний ринок, голова правління Том Лі вважає, що фундаментальні показники ETH сильні, і вказує на три основні фактори позитиву. 68,7% ETH компанії вже поставлено на стейкінг, що, за прогнозами, принесе значний пасивний дохід.

区块客16хв. тому

«Мачі» збільшили позицію на 150 ETH у довгий бік

BlockBeats повідомляє, 5 березня, згідно з моніторингом Hyperinsight, «Маджі Деґо» Хуан Ліченг збільшив позицію на 150 ETH (загальна вартість 316,290 доларів)). Поточна вартість позиції становить 14,561,890 доларів, ціна ліквідації — 2,036 доларів, поточний прибуток/збиток по цій позиції — 240,897 доларів.

GateNews56хв. тому

ETH прорвала позначку 2100 USDT

Бот новин Gate повідомляє, що ціна ETH опустилася нижче 2100 USDT, поточна ціна 2099.9 USDT.

CryptoRadar1год тому

Кит 0x8f01 конвертує 650 ETH у 1.88M ASTER у транзакції на $1.4M

Повідомлення бота Gate News, адреса киту 0x8f01 продала 650 ETH на суму $1.4 мільйона 14 годин тому та згодом придбала 1.88 мільйонів токенів ASTER на суму $1.4 мільйона. Кіт наразі має 4.45 мільйонів токенів ASTER із загальною вартістю $3.18 мільйона.

GateNews2год тому
Прокоментувати
0/400
Немає коментарів