OpenAI запроваджує систему оцінки безпеки для безпеки криптовалютних токенів та смарт-контрактів

CoinsProbe
ETH2,83%
DEFI-7,37%


Ключові висновки

  • OpenAI запустила EVMbench — нову систему бенчмаркінгу, розроблену разом із Paradigm, для тестування здатності передових моделей штучного інтелекту виявляти, виправляти та використовувати вразливості в смарт-контрактах Ethereum.

  • Перші результати показують “Розрив у експлойтах”: найкращі моделі наразі краще виконують атаки, ніж всебічно аналізують або виправляють помилки — що підкреслює швидкий прогрес ШІ та зростаючі ризики.

  • EVMbench може змінити стандарти безпеки у криптоіндустрії, забезпечуючи безперервний аудит за допомогою ШІ для команд DeFi та надаючи інституційний рівень гарантій, оскільки на блокчейн переходять мільярди активів.


У важливому злитті штучного інтелекту та технологій блокчейн, OpenAI офіційно запустила EVMbench. Розроблений у стратегічному партнерстві з гігантом криптоінвестицій Paradigm, цей бенчмарк-система створена для ретельного тестування здатності ШІ-агентів виявляти, використовувати та усувати вразливості в екосистемі Ethereum Virtual Machine (EVM).

З понад 100 мільярдами доларів у відкритих криптоактивах, захищених смарт-контрактами, ставки ніколи не були вищими. EVMbench є проактивним кроком у напрямку використання “фронтір-моделей” для захисту децентралізованих фінансів (DeFi) від все більш витончених кіберзагроз.

Джерело: openai

Три стовпи EVMbench

EVMbench виходить за межі статичного аналізу коду, оцінюючи ШІ-агентів у трьох високоризикових режимах роботи. Цикл “Виявлення — Виправлення — Використання” імітує реальний робочий процес провідного дослідника з безпеки.

  • 1. Режим Виявлення (Аудитор): Агент сканує складні репозиторії коду, щоб знайти приховані вразливості. Успіх вимірюється за показником “Recall” — здатністю знаходити “правдиві” проблеми — та симульованими нагородами за баг-баунті.

  • 2. Режим Виправлення (Інженер): Після виявлення помилки агент переписує код. Бенчмарк використовує автоматизовані тестові комплекти, щоб переконатися, що виправлення усуває вразливість, не порушуючи функціональність контракту.

  • 3. Режим Використання (Зловмисник): У безпечному ізольованому середовищі Anvil sandbox агенти намагаються виконати повномасштабні атаки для виведення коштів. Це оцінює їхню здатність до офензивного мислення та “ланцюгового” використання дрібних помилок у масштабну катастрофу.

Джерело: openai

Внутрішній аналіз: реальні ризики

EVMbench базується не на теоретичних головоломках, а на ретельно відібраній бібліотеці з 120 високоризикових вразливостей, зібраних із 40 професійних аудитів. Більша частина даних походить із реальних конкурсів аудитів (наприклад, Code4rena) та внутрішніх процесів безпеки Paradigm у блокчейні Tempo.

Зосереджуючись на “платіжних” контрактах, бенчмарк гарантує, що моделі ШІ проходять випробування на коді, що обробля мільярди вільних капіталів.

Результати бенчмарку: зростання GPT-5.3-Codex

Внутрішні тести OpenAI показали вражаюче прискорення можливостей ШІ. За кілька місяців провідні моделі пройшли шлях від базових логічних задач до виконання складних багатоступеневих експлойтів.

“Розрив у експлойтах”: цікаво, що агенти наразі значно краще виконують експлуатацію (72,2%), ніж виявлення або виправлення. Дослідники OpenAI зазначають, що агенти чудово справляються з чітко поставленим завданням — наприклад, “вивести кошти”, — але потребують більш тонкого мислення для комплексного аудиту.

Джерело: OpenAI

Чому це важливо: зміщення безпеки “наліво”

Для ширшої криптоекосистеми EVMbench — це не просто оцінка; це прискорювач розвитку “Security-Left” — інтеграція висококласного аудиту безпосередньо у процес кодування, а не після розгортання.

  • Демократизація безпеки: малі команди DeFi, які не можуть дозволити собі ручний аудит за 200 тис. доларів, можуть використовувати ШІ-агенти, сертифіковані EVMbench, для безперервних високоточних перевірок коду.

  • Інституційна готовність: оскільки традиційні фінансові гіганти, такі як Goldman Sachs і Franklin Templeton, переходять у блокчейн, їм потрібен “золотий стандарт” управління ШІ, який забезпечує стандартизований бенчмарк.

  • Двонапрямна проблема: відкриваючи вихідний код бенчмарку, OpenAI і Paradigm надають “хорошим хлопцям” інструменти для вимірювання та випередження “поганих”, зберігаючи при цьому “Довірений доступ для кібербезпеки” для моніторингу нових ризиків.

Погляд у майбутнє

Хоча EVMbench є революційним кроком, наразі він обмежений детермінованими, ізольованими середовищами. Очікується, що майбутні версії враховуватимуть мульти-ланцюгові залежності та MEV (Maximal Extractable Value) для кращого моделювання “Темного лісу” живого Ethereum.

Якщо ШІ-агенти перейдуть від “писання коду” до “захисту економік,” EVMbench стане головним орієнтиром для наступного покоління безпечних фінансів без довіри.


Застереження: Усі думки та аналізи, викладені в цій статті, є суто інформаційними і не слугують фінансовою порадою. Технічні патерни та індикатори можуть залежати від ринкової волатильності і не гарантують очікуваних результатів. Інвесторам рекомендується проявляти обережність, проводити незалежне дослідження та приймати рішення відповідно до власної толерантності до ризику.


Про автора: Нілеш Хембаде — засновник і головний автор Coinsprobe, має понад 5 років досвіду у криптовалютній та блокчейн-індустрії. З моменту запуску Coinsprobe у 2023 році він щодня надає аналітичні дослідження, глибокий аналіз ринку та дані on-chain.

Переглянути оригінал
Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.
Прокоментувати
0/400
Немає коментарів