Штучний інтелект для аудиту виходить у реальну практику, OpenAI випустила EVMbench, посилюючи безпеку оцінки смарт-контрактів

ETH4,36%
WELL5,4%

OpenAI спільно з Paradigm запускає EVMbench, що тестує здатність AI-агентів до атак і захисту в смарт-контрактах EVM, викриваючи слабкі місця та переваги.

Зосереджуючись на реальних економічних умовах, OpenAI у партнерстві з Paradigm посилює оцінку безпеки блокчейну

Лідер у сфері штучного інтелекту OpenAI оголосив про співпрацю з відомою компанією з ризикових інвестицій у криптовалюти Paradigm та компанією з безпеки OtterSec для запуску базового інструменту EVMbench, який оцінює безпеку AI-агентів у контексті Ethereum Virtual Machine (EVM).

Зі зростанням інтеграції AI та криптотехнологій, смарт-контракти стали ключовою інфраструктурою для управління понад 100 мільярдами відкритих криптоактивів. Вихід цього інструменту символізує початок серйозного ставлення галузі до практичних можливостей AI у «економічно значущих» середовищах.

Команда OpenAI зазначає, що з розвитком здатностей AI-агентів у написанні та плануванні коду, ці моделі у майбутньому відіграватимуть трансформуючу роль у атаках і захисті блокчейнів, тому створення стандартної системи оцінки є надзвичайно важливим для моніторингу прогресу AI.

Три основні режими тестування, 120 реальних вразливостей — випробування для AI

Ядро EVMbench побудоване навколо 120 високоризикових вразливостей, витягнутих із 40 професійних аудитів, зокрема з відомих відкритих конкурсів аудиту Code4rena, що забезпечує реалістичність сценаріїв тестування. Стандарт оцінки оцінює AI-агентів у трьох режимах роботи:

Зображення: Основна концепція EVMbench — оцінка AI-агентів у трьох режимах роботи

  • Перший — «Режим виявлення (Detect)», коли AI аналізує код контракту та ідентифікує відомі вразливості, оцінюючи їхню серйозність;
  • Другий — «Режим виправлення (Patch)», де AI має зберегти функціональність контракту, одночасно видаляючи вразливості та виправляючи код;
  • Третій — «Режим експлуатації (Exploit)», коли AI у ізольованому середовищі імітує атаки з крадіжки коштів.

Щоб забезпечити точність і повторюваність тестів, команда розробила тестову архітектуру на базі Rust, яка використовує детальне відтворення транзакцій для перевірки успішності атак або виправлень AI.

Значний тренд — перевага атак, GPT-5.3-Codex демонструє вражаючий ріст у здатності до атак

Перші результати тестування показали, що AI демонструє значні відмінності у здібностях залежно від завдання. Найновіша модель GPT-5.3-Codex показала високий результат у режимі експлуатації (Exploit Mode) — 72.2 %, що значно перевищує 31.9 %, показані у моделі GPT-5, випущеній лише шість місяців тому, що свідчить про неймовірний прогрес.

Зображення: Огляд результатів різних моделей AI у трьох режимах

Це свідчить про те, що при цілі «повністю вивести кошти» AI має потужні можливості для ітеративного планування та виконання атак. Водночас, у захисних функціях AI показує слабкі результати: у режимі виявлення він часто зупиняється після знаходження однієї помилки, а при складних логіках — важко виправити вразливості без порушення роботи контракту. Експерти з безпеки висловлюють занепокоєння, що AI може значно скоротити час від виявлення вразливості до створення атаки, що ставить під високий ризик DeFi-проєктів і вимагає швидшої реакції.

Привлечение талантів і підтримка захисту — стратегія OpenAI щодо безпеки екосистеми AI-агентів

Крім розробки інструментів, OpenAI активно залучає фахівців і розвиває екосистему захисту. Нещодавно компанія найняла засновника проекту відкритих AI-агентів OpenClaw Пітера Штайнбергера для керівництва розробкою наступного покоління персоналізованих агентів, перетворюючи цей проект у фонд OpenAI.

Щоб протистояти потенційним кіберризикам, OpenAI пообіцяв виділити 10 мільйонів доларів через свою програму підтримки безпеки для фінансування відкритих інструментів захисту та досліджень ключової інфраструктури. Це особливо актуально після інциденту з протоколом Moonwell, де через помилку у коді AI сталася втрата близько 1,78 мільйона доларів.

Додаткові матеріали
Відмова від багатомільярдної пропозиції Meta, приєднання творця OpenClaw до OpenAI — боротьба за таланти, чи все через Vibe Coding? Прогноз Moonwell — збитки на 1,78 мільйона, хто заплатить?

У майбутньому, з появою все більшої кількості AI-помічників для стабільних монет і автоматизованих гаманців, важливо буде використовувати EVMbench для розрізнення моделей, які лише описують вразливості, і тих, що здатні надійно забезпечити захист, що стане ключовим моментом у розвитку галузі безпеки блокчейну.

Переглянути оригінал
Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.

Пов'язані статті

12 європейських банків просувають стабільну монету євро, запуск очікується у 2026 році

Коаліція з 12 провідних європейських банків у рамках ініціативи Qivalis планує запустити стабільну монету, прив'язану до євро, до кінця 2026 року. Ця ініціатива має на меті конкурувати з стабільними монетами, прив'язаними до долара США, забезпечуючи повну забезпеченість та відповідність регулюванням ЄС.

TapChiBitcoin3хв. тому

Pump.fun мобільний додаток вже підтримує випуск токенів на конкурентних платформах та інших неоригінальних активів

Платформа Meme-коінів екосистеми Solana Pump.fun оголосила про додавання підтримки мобільного додатку для токенів конкурентних платформ та неоригінальних активів. Користувачі тепер можуть торгувати токенами, випущеними на інших платформах, а також обгортати біткоїн і Ethereum, з метою зменшення торгових бар'єрів та покращення досвіду користувачів.

GateNews17хв. тому

Керівник зростання Base: функція користувацьких тегів вже запущена в Base

Odaily星球日报訊 Base зростання керівник AntonioGarcíaMartínez на платформі X повідомив, що код розробника, який дозволяє додавати теги до застосунків або протоколів, вже запущений на Base. Ця функція забезпечить дані про атрибуцію на рівні ланцюга для активності на Base. Він зазначив, що цей механізм може принести нові бізнес-моделі для різних застосунків і стане джерелом даних для майбутніх програм нагородження Base.

GateNews26хв. тому

Віталік Бутерін стежить за “Big FOCIL” та криптовалютним пулом пам’яті, щоб запобігти централізації процесу побудови блоків

Співзасновник Ethereum Віталік Бутерін нещодавно опублікував технічний довгий текст, у якому обговорюється майбутній дорожній план Ethereum, підкреслюючи ризики централізації у побудові блоків, пропонуючи розширити механізм FOCIL і ввести криптографічний пам’ятний пул для підвищення стійкості до цензури. Вони планують випустити оновлення Glamsterdam у 2026 році, використовуючи механізм ePBS для зменшення ризиків централізації та протидії можливим новим тенденціям централізації.

GateNews1год тому

Riot Platforms у 2025 році досягла рекордного доходу в 647 мільйонів доларів, прискорюючи розвиток бізнесу в галузі штучного інтелекту та високопродуктивних обчислень

Біткоїн-майнингові компанії Riot Platforms опублікували фінансові результати за 2025 рік, дохід склав 647,4 мільйона доларів США, встановивши новий історичний рекорд. За рік було вироблено 5686 біткоїнів, дохід склав 576,3 мільйона доларів США. Генеральний директор заявив, що компанія прискорює перехід до інфраструктури штучного інтелекту та високопродуктивних обчислень для створення довгострокової цінності.

GateNews1год тому

Core Scientific у 4 кварталі знизив дохід, значно зменшилися доходи від майнінгу біткоїнів, прискорюючи трансформацію у сферу інфраструктури дата-центрів

Біткоїн-майнингові компанії Core Scientific опублікували фінансовий звіт за четвертий квартал 2025 року, загальний дохід склав 79,8 мільйонів доларів США, що на рік знизився. Доходи від майнінгу зменшилися до 42,2 мільйонів доларів США, тоді як доходи від хостинг-послуг зросли до 31,3 мільйонів доларів США. Незважаючи на зростання валового прибутку до 20,8 мільйонів доларів США, скоригований EBITDA становив -42,7 мільйонів доларів США, що свідчить про очевидний тиск на прибутковість у процесі трансформації.

GateNews1год тому
Прокоментувати
0/400
Немає коментарів