OpenAI запроваджує систему оцінки безпеки для безпеки криптовалютних токенів та смарт-контрактів

CoinsProbe
ETH6,33%
DEFI3,36%

Ключові висновки

  • OpenAI запустила EVMbench — нову систему бенчмаркінгу, розроблену спільно з Paradigm для тестування того, як передові моделі штучного інтелекту виявляють, виправляють і використовують уразливості в смарт-контрактах Ethereum.

  • Перші результати виявили «Розрив у експлойтах», коли найкращі моделі наразі краще виконують атаки, ніж всебічно аналізують або виправляють помилки — що підкреслює швидкий прогрес ШІ та зростаючі ризики.

  • EVMbench може переосмислити стандарти безпеки у криптоіндустрії, забезпечуючи безперервний аудит за допомогою ШІ для команд DeFi та надаючи інституційний рівень гарантій, оскільки мільярди активів переходять в ончейн.


У важливому злитті штучного інтелекту та блокчейн-технологій OpenAI офіційно запустила EVMbench. Розроблений у стратегічному партнерстві з гігантом криптоінвестицій Paradigm, цей бенчмарк-система створена для ретельного тестування того, як агенти ШІ визначають, використовують і усувають уразливості в екосистемі Ethereum Virtual Machine (EVM).

З понад 100 мільярдами доларів у відкритих криптоактивах, захищених смарт-контрактами, ставки ніколи не були вищими. EVMbench символізує проактивний перехід до використання «передових моделей» для захисту децентралізованих фінансів (DeFi) від все більш витончених кіберзагроз.

Джерело: openai

Три опори EVMbench

EVMbench виходить за межі статичного аналізу коду, оцінюючи агентів ШІ у трьох високоризикових режимах роботи. Цикл «Виявлення-Виправлення-Експлуатація» імітує реальний робочий процес провідного дослідника з безпеки.

  • 1. Режим виявлення (Аудитор): агенти сканують складні репозиторії коду, щоб знайти приховані помилки. Успіх вимірюється за показником «Recall» — здатністю знаходити «правдиві» проблеми — та симульованими нагородами за баг-баунті.

  • 2. Режим виправлення (Інженер): після виявлення помилки агент має переписати код. Бенчмарк використовує автоматизовані тестові комплекти, щоб переконатися, що виправлення усуває уразливість, не порушуючи функціональність контракту.

  • 3. Режим експлуатації (Агресор): у безпечній ізольованій пісочниці Anvil агенти намагаються виконати повномасштабні атаки для виведення коштів. Це оцінює наступальне мислення агента та його здатність «злочинно» поєднувати дрібні недоліки у катастрофічний прорив.

Джерело: openai

Внутрішній аналіз: реальні ризики

EVMbench не базується на теоретичних головоломках. Він створений на основі ретельно відібраної бібліотеки з 120 уразливостей високої серйозності, зібраних з 40 професійних аудитів. Більша частина даних походить із реальних конкурсів аудитів (наприклад, Code4rena) та внутрішніх процесів безпеки Paradigm на блокчейні Tempo.

Зосереджуючись на «платіжних» контрактах, бенчмарк гарантує, що моделі ШІ проходять випробування на коді, який обробля мільярди у ліквідних капіталах.

Результати бенчмарку: зростання GPT-5.3-Codex

Внутрішні тести OpenAI показали вражаюче прискорення можливостей ШІ. За кілька місяців провідні моделі пройшли шлях від базових логічних задач до виконання складних багатоступеневих експлойтів.

«Розрив у експлойтах»: цікаво, що агенти наразі значно краще справляються з експлуатацією (72,2%), ніж з виявленням або виправленням. Дослідники OpenAI зазначили, що агенти чудово працюють, коли їм ставлять чітке, однозначне завдання — наприклад, «злити кошти» — але потребують більш тонкого мислення для виконання довгого та складного аудиту.

Джерело: OpenAI

Чому це важливо: зміщення безпеки «наліво»

Для ширшої криптоекосистеми EVMbench — це не просто оцінка, а прискорювач розвитку «Security-Left» — інтеграція висококласного аудиту безпосередньо у процес кодування, а не чекання після розгортання.

  • Демократизація безпеки: малі команди DeFi, які не можуть дозволити собі ручний аудит за 200 тисяч доларів, можуть використовувати ШІ-агенти, сертифіковані EVMbench, для безперервних високоточних оглядів коду.

  • Інституційна готовність: оскільки гіганти традиційних фінансів, такі як Goldman Sachs і Franklin Templeton, переходять в ончейн, їм потрібен «золотий стандарт» управління ШІ, який забезпечує стандартизований бенчмарк.

  • Двонапрямна проблема: відкриваючи вихідний код бенчмарку, OpenAI і Paradigm надають «хорошим хлопцям» інструменти для вимірювання та випередження «поганих», зберігаючи при цьому рамки «Довіреного доступу для кібербезпеки» для моніторингу нових ризиків.

Погляд у майбутнє

Хоча EVMbench є революційним кроком, наразі він обмежений детермінованими, ізольованими середовищами. Очікується, що майбутні версії враховуватимуть мульти-ланцюгові залежності та MEV (Maximal Extractable Value) для кращого моделювання «Темного лісу» живого Ethereum.

Якщо агенти ШІ перейдуть від «писання коду» до «захисту економік», EVMbench стане визначальним інструментом для наступного покоління безпечних фінансів без довіри.


Застереження: Відгуки та аналіз, наведені у цій статті, мають суто інформаційний характер і відображають точку зору автора, а не фінансову пораду. Технічні шаблони та індикатори, що обговорюються, піддаються ринковій волатильності і можуть не давати очікуваних результатів. Інвесторам рекомендується проявляти обережність, проводити незалежні дослідження та приймати рішення відповідно до власної толерантності до ризику.


Про автора: Нілеш Хембаде — засновник і головний автор Coinsprobe, має понад 5 років досвіду у криптовалютній та блокчейн-індустрії. З моменту запуску Coinsprobe у 2023 році він надає щоденні аналітичні огляди, дослідження на основі даних з блокчейну та технічні аналізи.

Переглянути оригінал
Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.
Прокоментувати
0/400
Немає коментарів