Чи можуть агенти ШІ підвищити безпеку Ethereum? OpenAI та Paradigm створили тестове поле

ETH-2,82%

Коротко

  • EVMbench тестує AI-агенти на 120 реальних вразливостей смарт-контрактів Ethereum.
  • Інструмент оцінює виявлення, виправлення та експлуатацію у трьох різних режимах.
  • GPT-5.3-Codex досяг 72,2% успішності в тестуванні режиму експлуатації.

Розробник ChatGPT, компанія OpenAI, та інвестиційна фірма, орієнтована на криптовалюти, Paradigm, представили EVMbench — інструмент для підвищення безпеки смарт-контрактів Ethereum Virtual Machine. EVMbench створений для оцінки здатності AI-агентів виявляти, виправляти та експлуатувати вразливості високої серйозності у смарт-контрактах EVM. Смарт-контракти — це серце мережі Ethereum, що містить код, який забезпечує роботу всього — від децентралізованих фінансових протоколів до запуску токенів. За даними Token Terminal, щотижнева кількість розгорнутих смарт-контрактів на Ethereum досягла рекордних 1,7 мільйона у листопаді 2025 року, з 669 500 — лише минулого тижня. 

EVMbench базується на 120 відібраних вразливостях із 40 аудитів, здебільшого з відкритих конкурсів аудиту, таких як Code4rena, згідно з блогом OpenAI. Також у нього включені сценарії з процесу аудиту безпеки для Tempo — спеціалізованого блокчейну рівня-1 від Stripe, орієнтованого на високий пропуск та низькі витрати для стабільних монет. Гігант платежів Stripe запустив публічний тестнет для Tempo у грудні, заявивши, що його створювали з урахуванням думки Visa, Shopify та OpenAI. Мета — базувати тестування на економічно значущому реальному коді, особливо з урахуванням розширення AI-управління стабільними монетами, додали в компанії.

Представляємо EVMbench — новий бенчмарк, що вимірює, наскільки добре AI-агенти можуть виявляти, експлуатувати та виправляти вразливості високої серйозності у смарт-контрактах. https://t.co/op5zufgAGH

— OpenAI (@OpenAI) 18 лютого 2026

EVMbench призначений для оцінки моделей AI у трьох режимах: Виявлення, виправлення та експлуатація. У режимі “виявлення” агенти аналізують репозиторії та оцінюються за здатністю пам’ятати справжні вразливості. У режимі “виправлення” вони повинні усунути вразливості, не порушуючи функціональність. Нарешті, у фазі “експлуатація” агенти намагаються провести повномасштабні атаки з витіканням коштів у ізольованому блокчейн-середовищі, а оцінювання здійснюється через детермінований повтор транзакцій. У режимі експлуатації GPT-5.3-Codex, запущений через CLI OpenAI Codex, набрав 72,2%, тоді як GPT-5, випущений шість місяців раніше, — 31,9%. Виявлення та виправлення вразливостей показали слабшу продуктивність, оскільки агенти іноді не проводили повне аудиту або мали труднощі з збереженням повної функціональності контракту. Дослідники OpenAI застерегли, що EVMbench не повністю відображає реальну складність безпеки. Водночас вони додали, що вимірювання продуктивності AI у економічно важливих середовищах є критичним, оскільки моделі стають потужними інструментами як для атакуючих, так і для захисників. Раніше співзасновник Ethereum Віталік Бутерін та засновник OpenAI Сем Альтман неодноразово мали розбіжності щодо темпів розвитку AI. У січні 2025 року Альтман заявив, що його компанія “впевнена, що знає, як створити AGI, як ми її традиційно розуміємо”. Але Бутерін виступав за те, щоб системи AI мали можливість “м’якої зупинки”, яка могла б тимчасово обмежити промислові масштаби AI, якщо з’являться попереджувальні ознаки.

Переглянути оригінал
Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.

Пов'язані статті

Чому шлях Ethereum до $2.5K може бути складнішим — ось чому

Ether зазнав нових тисків на продажі, оскільки світові ринки відступили, а трейдери врахували геополітичний ризик у ризикові активи. Після короткочасного зростання до $2,200 ETH приблизно на 6% знизився під час сесії, оскільки американські акції охололи, а поставки нафти і газу в Близькому Сході порушили ланцюги постачання. Макро

CryptoBreaking11хв. тому

Culper Research оголосила про короткі позиції ETH та відповідних цінних паперів, заявивши, що модель економіки токенів після оновлення Fusaka зазнала шкоди

Короткі позиції на інституцію Culper Research оголосили про короткі позиції щодо Ethereum та відповідних цінних паперів, вважаючи, що оновлення Fusaka 2025 року пошкодить економічну модель токена ETH. Після оновлення витрати Gas знизилися більше ніж очікувалося, а дані на блокчейні свідчать, що зростання активних адрес і обсягів транзакцій походить від транзакцій низької вартості. Culper вважає, що Віталік це усвідомлює і продовжить продавати ETH, прогнозуючи подальше зниження ціни ETH.

GateNews12хв. тому

Віталік: у сфері рівня застосунків та зовнішніх інтерфейсів Ethereum слід сміливо повністю перебудувати різні концепції

Віталік Бутерін у Farcaster зазначив, що Ethereum потребує більш відкритого та сміливого мислення, особливо на рівні додатків, підкреслюючи незмінність основних характеристик. Він наголосив на важливості перебудови концепцій і технічних напрямків, пропонуючи переосмислити дизайн додатків з нової перспективи для сприяння розвитку та зростанню Ethereum.

GateNews33хв. тому

Дані: Якщо ETH прорве рівень 2175 доларів, загальна сила ліквідації коротких позицій на основних централізованих біржах досягне 6.94 мільярдів доларів

Згідно з повідомленням ChainCatcher, за даними Coinglass, якщо ETH прорве рівень 2 175 доларів, сукупна сила ліквідації коротких позицій на основних централізованих біржах (CEX) досягне 6.94 мільярдів доларів. Навпаки, якщо ETH опуститься нижче 1 975 доларів, сукупна сила ліквідації довгих позицій на основних CEX досягне 4.52 мільярдів доларів.

GateNews44хв. тому
Прокоментувати
0/400
Немає коментарів