AIエージェントはイーサリアムのセキュリティを向上させることができるか?OpenAIとParadigmがテスト環境を作成

ETH-2.62%

概要

  • EVMbenchは、120の実世界のイーサリアムスマートコントラクトの脆弱性を対象にAIエージェントをテストします。
  • ツールは、検出、修正、悪用の3つの異なるモードで評価を行います。
  • GPT-5.3-Codexは、悪用モードのテストで72.2%の成功率を達成しました。

ChatGPTの開発元であるOpenAIと、暗号通貨に特化した投資会社Paradigmは、イーサリアム仮想マシン(EVM)のスマートコントラクトのセキュリティ向上を目的としたツール、EVMbenchを発表しました。
EVMbenchは、AIエージェントがイーサリアム仮想マシン(EVM)スマートコントラクトの高重大度脆弱性を検出、修正、悪用できる能力を評価するために設計されています。
スマートコントラクトは、分散型金融プロトコルやトークンのローンチなど、イーサリアムネットワークの中心的な役割を担っています。Token Terminalによると、2025年11月にはイーサリアム上に展開されたスマートコントラクトの週次数が史上最高の170万件に達し、先週だけで66万9500件が展開されました。

EVMbenchは、OpenAIのブログ投稿によると、Code4renaなどのオープン監査コンペティションから得られた40の監査から選定された120の脆弱性を基にしています。また、TempoやStripeの高スループット・低コストのステーブルコイン決済に特化したレイヤー1ブロックチェーンのセキュリティ監査のシナリオも含まれています。
決済大手Stripeは、2024年12月にTempoのパブリックテストネットを開始し、その際にVisaやShopify、OpenAIなどの意見を取り入れて構築していると発表しました。
この取り組みの目的は、特にAI駆動のステーブルコイン決済が拡大する中で、実用的なコードに基づいたテストを行うことにあります。

EVMbenchの紹介—AIエージェントが高重大度のスマートコントラクトの脆弱性を検出、悪用、修正できる能力を測定する新しいベンチマークです。https://t.co/op5zufgAGH

— OpenAI (@OpenAI) 2026年2月18日

EVMbenchは、「検出」「修正」「悪用」の3つのモードでAIモデルを評価します。
「検出」モードでは、エージェントがリポジトリを監査し、実際の脆弱性をどれだけ正確に把握できるかでスコア付けされます。
「修正」モードでは、エージェントは意図した機能を損なうことなく脆弱性を排除しなければなりません。
最後に、「悪用」モードでは、エージェントがサンドボックス化されたブロックチェーン環境でエンドツーエンドの資金流出攻撃を試み、決定論的なトランザクションリプレイによって評価されます。
悪用モードでは、OpenAIのCodex CLIを使用したGPT-5.3-Codexが72.2%のスコアを獲得し、6ヶ月前にリリースされたGPT-5の31.9%を上回りました。
検出と修正のタスクでは、エージェントが網羅的に監査できなかったり、コントラクトの完全な機能を維持するのに苦労したりするため、パフォーマンスはやや劣る傾向にあります。

ChatGPTの開発者たちは、EVMbenchは実世界のセキュリティの複雑さを完全には反映していないと警告しています。それでも、モデルが攻撃者と防御者の両方にとって強力なツールとなる中、経済的に重要な環境でのAIのパフォーマンス測定は非常に重要だと付け加えました。
サム・アルトマン率いるOpenAIとイーサリアムの共同創設者ビタリック・ブテリンは、これまでAIの進展速度について意見が対立してきました。
2025年1月、アルトマンは「私たちは従来理解してきた通りにAGIを構築できると自信を持っている」と述べました。一方、ブテリンは、警告サインが現れた場合に一時的に産業規模のAI運用を制限できる「ソフトポーズ」機能を備えるべきだと提言しています。

原文表示
免責事項:このページの情報は第三者から提供される場合があり、Gateの見解または意見を代表するものではありません。このページに表示される内容は参考情報のみであり、いかなる金融、投資、または法律上の助言を構成するものではありません。Gateは情報の正確性または完全性を保証せず、当該情報の利用に起因するいかなる損失についても責任を負いません。仮想資産への投資は高いリスクを伴い、大きな価格変動の影響を受けます。投資元本の全額を失う可能性があります。関連するリスクを十分に理解したうえで、ご自身の財務状況およびリスク許容度に基づき慎重に判断してください。詳細は免責事項をご参照ください。

関連記事

Vitalik:予測市場は、私たちが世界と今後の近い未来を理解するのに役立ちます

BlockBeatsのニュースによると、3月6日にイーサリアムの創始者Vitalik Buterin氏は、予測市場は私たちが世界や今後の近い未来をより良く理解するのに役立つと述べました。私は予測市場のプロジェクトがこの方向性をさらに最適化し、特に条件付き市場を増やすことを期待しています。 BlockBeatsは予測市場のセクションを立ち上げており、ユーザーは専用のプッシュ通知を購読できます。

GateNews12分前

データ:過去24時間で全ネットワークの強制清算額は2億7400万ドル、ロングポジションの強制清算は1億8900万ドル、ショートポジションの強制清算は8594.69万ドル

ChainCatcherのメッセージによると、Coinglassのデータによると、過去24時間で全ネットワークの爆発的清算額は2億7400万ドルであり、ロングポジションの爆発的清算は1億8900万ドル、ショートポジションの爆発的清算は8594.69万ドルです。その中でビットコインのロングポジションの爆発的清算は7255.55万ドル、ビットコインのショートポジションの爆発的清算は3111.38万ドル、イーサリアムのロングポジションの爆発的清算は3854.14万ドル、イーサリアムのショートポジションの爆発的清算は2484.99万ドルです。

GateNews4時間前

データ:ETHが2,168ドルを突破した場合、主要なCEXの累積ロング清算強度は6.24億ドルに達する

ChainCatcher のメッセージによると、Coinglass のデータによれば、ETH が 2,168 ドルを突破した場合、主要な CEX の空売り清算強度の合計は 6.24 億ドルに達します。逆に、ETH が 1,964 ドルを下回った場合、主要な CEX の買いポジション清算強度の合計は 3.05 億ドルに達します。

GateNews5時間前

ビットコインの価格予測は強気に転じる一方、イーサリアムは依然として停滞したままです

予測者はビットコインの短期価格について強気に転じており、84,000ドルまで上昇した後、潜在的な下落を示唆しています。ただし、アナリストの間では持続可能性について意見が分かれており、イーサリアムに対するセンチメントは弱気で、1,500ドルまでの下落が予想されています。

Decrypt7時間前

今買うべき最高の暗号資産:SOLとLINKが上昇する中、Pepetoは100倍を目指し、Ethereum財団はETHをAIの信頼層にする計画

イーサリアム財団は、ネットワークを人工知能の信頼層として位置付ける計画を発表しました。財団のAIリーダーは、ETHがますますAIを媒介とした世界において調整と検証の層として機能し、最大のスマートコントラクトプラットフォームとしても同様に役割を果たすだろうと述べています。

CaptainAltcoin7時間前
コメント
0/400
コメントなし