AI代理能提升以太坊的安全性嗎?OpenAI與Paradigm打造測試平台

ETH1.31%

簡要介紹

  • EVMbench 測試 AI 代理在 120 個現實世界的以太坊智能合約漏洞中表現。
  • 該工具在三個不同模式下評估檢測、修補和利用能力。
  • GPT-5.3-Codex 在利用模式測試中達成 72.2% 的成功率。

ChatGPT 的開發者 OpenAI 和專注於加密貨幣投資的 Paradigm 共同推出了 EVMbench,一款旨在提升以太坊虛擬機(EVM)智能合約安全性的工具。
EVMbench 旨在評估 AI 代理檢測、修補和利用高嚴重性漏洞的能力。
智能合約是以太坊網絡的核心,承載著從去中心化金融協議到代幣發行的所有代碼。根據 Token Terminal 的數據,2025 年 11 月,以太坊部署的智能合約數量達到歷史新高的 170 萬,僅上週就部署了 66 萬9,500 個。

EVMbench 參考了來自 40 次審計的 120 個經過篩選的漏洞,這些漏洞大多來自開放審計比賽如 Code4rena,根據 OpenAI 的部落格文章。它還包括來自 Tempo 的安全審計場景,Tempo 是 Stripe 為高吞吐量、低成本穩定幣支付而專門打造的 Layer-1 區塊鏈。
支付巨頭 Stripe 在 12 月推出了 Tempo 的公開測試網,當時表示該系統在 Visa、Shopify 和 OpenAI 等的意見下建造。
其目標是將測試建立在經濟上具有意義的現實代碼中,尤其是在 AI 驅動的穩定幣支付擴展的背景下,該公司補充說。

推出 EVMbench——一個衡量 AI 代理在檢測、利用和修補高嚴重性智能合約漏洞方面能力的新基準。https://t.co/op5zufgAGH

— OpenAI (@OpenAI) 2026 年 2 月 18 日

EVMbench 旨在評估 AI 模型在三個模式下的表現:檢測(Detect)、修補(Patch)和利用(Exploit)。在“檢測”階段,代理會審計存儲庫,並根據其對真實漏洞的回憶率進行評分。在“修補”階段,代理必須在不破壞預期功能的前提下消除漏洞。最後,在“利用”階段,代理在沙盒區塊鏈環境中嘗試端到端的資金抽取攻擊,評分則通過確定性交易重放完成。
在利用模式中,運行 OpenAI 的 Codex CLI 的 GPT-5.3-Codex 達到 72.2% 的得分,而較早發布的 GPT-5 則為 31.9%。在檢測和修補任務中,性能較弱,代理有時未能徹底審計或難以保持完整的合約功能。
ChatGPT 的開發者團隊的研究人員提醒,EVMbench 並未完全反映現實世界的安全複雜性,但他們補充說,隨著模型成為攻擊者和防禦者的強大工具,衡量 AI 在經濟相關環境中的表現變得至關重要。
OpenAI 的 Sam Altman 和以太坊聯合創始人 Vitalik Buterin 之前在 AI 發展速度上存在分歧。
2025 年 1 月,Altman 表示他的公司“有信心我們知道如何像傳統理解的那樣構建 AGI”。但 Buterin 主張,AI 系統應該包括一個“軟暫停”功能,以便在出現警示信號時暫時限制工業規模的 AI 運作。

免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見聲明

相關文章

XRP 以 8.91% 的單週漲幅領先,跑贏比特幣、以太坊和 Solana

根據市場分析師 Xaif Crypto,截至 5 月 5 日,XRP 以每週上漲 8.91% 領先主要加密貨幣,表現優於以太坊(7.85%)、比特幣(5.72%)、Solana(4.74%)、狗狗幣(6.25%)以及 BNB(6.28%)。

GateNews1小時前

比特幣在選擇權市場部位調整中突破 80,000 美元

比特幣在週一短暫回撤後,已重新站回 80,000 美元之上;根據來源材料,該回撤被歸因於一則伊朗飛彈指稱的爭議。期權市場正在布局潛在的突破,不過偏度指標仍較偏向下行防護。 ## 市場布局 選項市場

Crypto Frontier1小時前

CertiK 於 5 月 5 日向以太坊安全之四次方資助(Quadratic Funding)輪次貢獻 $50K

根據 mpost.io,CertiK 於 2026 年 5 月 5 日向以太坊安全「四次方資助」(QF)回合捐獻了 50,000 美元。這筆資金將透過 Giveth 部署,資助專注於強化以太坊整體安全的計畫。「四次方資助」將擴大來自更廣泛基礎的貢獻

GateNews3小時前

以太坊 Glamsterdam 升級目標 2026 年 6 月推出,Gas 上限將從 60M 大幅提升至 200M

根據以太坊基金會的說法,Glamsterdam 升級預計將在 2026 年 6 月左右部署到主網,區塊 gas 上限將由 6,000 萬提高至 2 億。開發正在加速,核心目標多數已達成,包括提高最低共識限制

GateNews3小時前

比特幣上漲至 81,300 美元,長期持有者累積 331,000 BTC,現貨 ETF 流入激增:3 天內達 11.8 億美元

根據 ChainCatcher 稱,週二比特幣上漲至 81,300 美元,週漲幅與 30 日漲幅分別達到 5% 與 21%。CryptoQuant 的數據顯示,長期持有者在 30 天內累計淨增 331,000 BTC,以目前價格計約 267 億美元,佔總供應量的 1.6%。

GateNews4小時前

鯨魚向 Hyperliquid 存入 500 萬 USDC,今日開啟 5 倍槓桿比特幣多單持倉

根據 Onchain Lens,某個鯨魚將 500 萬 USDC 存入 Hyperliquid,並在今天(5 月 5 日)開啟了比特幣 5 倍槓桿多頭部位。該鯨魚的兩個錢包目前在多頭部位持有 629.16 BTC,總部位價值約為 5100 萬美元。

GateNews5小時前
留言
0/400
暫無留言