AI代理能提升以太坊的安全性吗?OpenAI和Paradigm创建了一个测试平台

ETH1.71%

简要介绍

  • EVMbench 测试 AI 代理在 120 个真实世界的以太坊智能合约漏洞上表现。
  • 工具在检测、修补和利用三个不同模式下进行评估。
  • GPT-5.3-Codex 在利用模式测试中取得了72.2%的成功率。

ChatGPT的开发者OpenAI和专注于加密的投资公司Paradigm推出了EVMbench,这是一款旨在提升以太坊虚拟机智能合约安全性的工具。
EVMbench旨在评估AI代理检测、修补和利用以太坊虚拟机(EVM)智能合约中高严重性漏洞的能力。
智能合约是以太坊网络的核心,承载着从去中心化金融协议到代币发行的所有代码。据Token Terminal数据显示,2025年11月,以太坊部署的智能合约数量达到历史最高的170万,上周仅部署了66.95万。

EVMbench借鉴了40次审计中的120个精选漏洞,主要来源于Code4rena等公开审计竞赛,OpenAI在一篇博客中介绍。它还包括Tempo的安全审计场景,Tempo是Stripe专为高吞吐、低成本稳定币支付打造的Layer-1区块链。
支付巨头Stripe在12月推出了Tempo的公共测试网,并表示该项目在Visa、Shopify和OpenAI等的建议下开发。
其目标是以经济上有意义的真实代码为基础进行测试,特别是在AI驱动的稳定币支付不断扩展的背景下。

推出EVMbench——一项衡量AI代理检测、利用和修补高严重性智能合约漏洞能力的新基准。https://t.co/op5zufgAGH

— OpenAI (@OpenAI) 2026年2月18日

EVMbench旨在通过三个模式评估AI模型:检测(Detect)、修补(Patch)和利用(Exploit)。在“检测”阶段,代理审计代码仓库,并根据其对真实漏洞的识别能力评分。在“修补”阶段,代理需在不破坏预期功能的前提下消除漏洞。最后,在“利用”阶段,代理在沙箱区块链环境中尝试端到端的资金转移攻击,评分通过确定性交易重放进行。

在利用模式中,运行OpenAI的Codex CLI的GPT-5.3-Codex取得了72.2%的分数,而六个月前发布的GPT-5仅为31.9%。在检测和修补任务中表现较弱,代理有时未能全面审计或难以保持完整的合约功能。

ChatGPT的开发者们警告称,EVMbench尚未完全反映现实世界的安全复杂性,但他们补充说,在经济相关环境中衡量AI性能至关重要,因为模型正成为攻击者和防御者的强大工具。

OpenAI的Sam Altman和以太坊联合创始人Vitalik Buterin此前在AI发展速度上存在分歧。
2025年1月,Altman表示公司“有信心按照传统理解的方式构建AGI”。但Buterin则主张AI系统应具备“软暂停”功能,以便在出现预警信号时暂时限制工业规模的AI操作。

免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见声明

相关文章

Aave 紧急动议反击 7,300 万美元 ETH 冻结:“小偷不拥有他偷走的东西”

Aave 向纽约南区法院提出紧急动议,要求解除对 30,766 ETH(约7,300万美元)的冻结。核心主张:赃物仍属原始用户,小偷无法取得所有权;赃物在 Arbitrum 安全委员会回拨时立即归还受害人;对北韩 Lazarus Group 的证据属传闻,听证预计于五月底举行。此案将影响 DeFi 治理与未来资产归属风险。

鏈新聞abmedia5 分钟前

Bitmine 在 6 小时内质押了 192,816 ETH,价值 4.5621 亿美元,总持仓达到 106.9 亿美元

根据 Onchain Lens,Bitmine 于 6 小时前质押了 192,816 ETH,价值约 4.56 亿美元。该实体目前的总质押 ETH 规模达到 4,555,573 ETH,价值约 106.9 亿美元。

GateNews40 分钟前

Upbit 推出支持 Optimism 的以太坊二层 GIWA 链

据周一一则公告,韩国最大的加密货币交易所 Upbit 已与 Optimism 合作,使用 OP Stack 技术构建一条新的以太坊 Layer 2 区块链。GIWA Chain 将成为首个在 OP Enterprise 的自主管理(Self-Managed)层级上启动的区块链,这意味着 Upbit 将

Crypto Frontier1小时前

家属为北韩受害者寻求被冻结的Arbitrum ETH

持有对朝鲜长达数十年之久的判决的家属正试图扣押在 Arbitrum 上冻结的 30,765 ETH,此前发生在上个月的 rsETH 被盗事件。家属已援引一项纽约的禁制令通知,意在阻止 Arbitrum 释放资金,理由是其指称存在其与(att)之间的关联 att

Crypto Frontier3小时前

Bitmine 连续第三周向 100,000 以上代币增持 101,745 ETH,用时 2.38 亿美元

根据该公司的公告,Bitmine Immersion Technologies 上周新增 101,745 ETH,约合 2.377 亿美元,单价为每枚 2,336 美元。此次买入使 Bitmine 的持仓总量达到 5,180,131 ETH,占以太坊总供应量的 4.29%,并将该公司定位在 86% 的 th

GateNews8小时前

3 种受关注的山寨币——精明投资者正在盯着 BTC、ETH 和 SOL

比特币凭借强劲的机构型 ETF 资金流入领先,并且受监管投资者需求不断增长推动。 以太坊通过区块链实用性、DeFi 领域的领先地位以及 ETF 兴趣上升而增强。 Solana 以速度、生态系统增长以及对现货 ETF 的潜在乐观预期吸引投资者。 加密货币投资者

Crypto News Land8小时前
评论
0/400
暂无评论