OpenAI запроваджує систему оцінки безпеки для безпеки криптовалютних токенів та смарт-контрактів

CoinsProbe

2026-02-25 20:21:28

ETH0,7%

DEFI-9,65%

GPT-5,43%

Ключові висновки

OpenAI запустила EVMbench — нову систему бенчмаркінгу, розроблену спільно з Paradigm для тестування здатності передових моделей штучного інтелекту виявляти, виправляти та використовувати вразливості в смарт-контрактах Ethereum.
Перші результати показують “Розрив у Exploit” — найкращі моделі наразі краще виконують атаки, ніж всебічно аналізують або виправляють помилки — що підкреслює швидкий прогрес ШІ та зростаючі ризики.
EVMbench може змінити стандарти безпеки у криптоіндустрії, дозволяючи постійно проводити аудити за допомогою ШІ для команд DeFi та забезпечуючи інституційний рівень гарантій, оскільки на блокчейн переходять мільярди активів.

У важливому злитті штучного інтелекту та технологій блокчейн, OpenAI офіційно запустила EVMbench. Розроблений у стратегічній співпраці з гігантом криптоінвестицій Paradigm, цей бенчмарк-система створена для ретельного тестування здатності ШІ-агентів виявляти, використовувати та усувати вразливості в екосистемі Ethereum Virtual Machine (EVM).

З понад 100 мільярдами доларів у відкритих криптоактивах, захищених смарт-контрактами, ставки ніколи не були вищими. EVMbench є проактивним кроком у напрямку використання “передових моделей” для захисту децентралізованих фінансів (DeFi) від все більш складних кіберзагроз.

Джерело: openai

Три стовпи EVMbench

EVMbench виходить за межі статичного аналізу коду, оцінюючи ШІ-агентів у трьох високоризикових режимах роботи. Цей цикл “Виявлення — Виправлення — Використання” імітує реальний робочий процес провідного фахівця з безпеки.

1. Режим Виявлення (Аудитор): Агент сканує складні репозиторії коду, щоб знайти приховані вразливості. Оцінка базується на “Пам’яті” — здатності знаходити “правдиві” проблеми — та симульованих нагородах за виявлення багів.
2. Режим Виправлення (Інженер): Після виявлення багу агент переписує код. Бенчмарк використовує автоматизовані тестові комплекти, щоб переконатися, що виправлення усуває вразливість і не порушує функціональність контракту.
3. Режим Використання (Агресор): У безпечному ізольованому середовищі Anvil sandbox агенти намагаються виконати повномасштабні атаки для виведення коштів. Це оцінює наступальне мислення агента та його здатність “з’єднувати” дрібні помилки у катастрофічний прорив.

Джерело: openai

Внутрішній аналіз: реальні ризики

EVMbench базується не на теоретичних головоломках, а на ретельно відібраній бібліотеці з 120 високоризикових вразливостей, зібраних із 40 професійних аудитів. Більша частина даних походить із реальних конкурсів аудитів (наприклад, Code4rena) та внутрішніх процесів безпеки Paradigm на блокчейні Tempo.

Зосереджуючись на “платіжних” контрактах, бенчмарк гарантує, що моделі ШІ проходять випробування на коді, що обробля мільярди вільних капіталів.

Результати бенчмарку: зростання GPT-5.3-Codex

Внутрішні тести OpenAI показали вражаюче прискорення можливостей ШІ. За кілька місяців провідні моделі перейшли від базових логічних задач до виконання складних багатоступеневих експлойтів.

“Розрив у Exploit”: Цікаво, що агенти наразі значно краще виконують експлуатацію (72.2%), ніж виявлення або виправлення. Дослідники OpenAI зазначили, що агенти чудово справляються з чіткою, явно поставленою метою — наприклад, “зняти кошти”, — але потребують більш тонкого мислення для складних, довгострокових завдань аудиту.

Джерело: Openai

Чому це важливо: зміщення безпеки “наліво”

Для ширшої криптоекосистеми EVMbench — це не просто оцінка, а прискорювач розвитку “Безпеки-наліво” — інтеграція висококласних аудитів безпосередньо у процес кодування, а не після розгортання.

Демократизована безпека: Малі команди DeFi, які не можуть дозволити собі ручний аудит за 200 тис. доларів, можуть використовувати ШІ-агенти, сертифіковані EVMbench, для безперервних високоточних перевірок коду.
Інституційна готовність: Оскільки гіганти традиційних фінансів, такі як Goldman Sachs і Franklin Templeton, переходять у блокчейн, їм потрібен “Золотий стандарт” управління ШІ, який забезпечує стандартизований бенчмарк.
Двонапрямкова проблема: Відкриваючи вихідний код бенчмарку, OpenAI і Paradigm надають “хорошим хлопцям” інструменти для вимірювання та випередження “поганих”, одночасно підтримуючи рамки “Довіреного доступу для кібербезпеки” для моніторингу нових ризиків.

Погляд у майбутнє

Хоча EVMbench є революційним кроком, наразі він обмежений детермінованими, ізольованими середовищами. Очікується, що майбутні версії враховуватимуть мульти-ланцюгові залежності та MEV (Maximal Extractable Value) для кращого моделювання “Темного лісу” живого Ethereum.

Якщо ШІ-агенти перейдуть від “писання коду” до “захисту економік,” EVMbench стане головним орієнтиром для наступного покоління безпечних фінансів без довіри.

Застереження: Усі думки та аналіз у цій статті наведені виключно для ознайомлення і не є фінансовою порадою. Технічні моделі та індикатори можуть залежати від волатильності ринку і не гарантують очікуваних результатів. Інвесторам рекомендується проявляти обережність, проводити незалежні дослідження та приймати рішення відповідно до власної толерантності до ризику.

Про автора: Нілеш Хембаде — засновник і головний автор Coinsprobe, має понад 5 років досвіду у криптовалютній та блокчейн-індустрії. З моменту запуску Coinsprobe у 2023 році він щодня надає аналітичні дослідження, глибокий аналіз ринку та дані з блокчейну.

Переглянути оригінал

Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.

Прокоментувати

0/400

Немає коментарів