
區塊鏈安全審計公司 OpenZeppelin 對 OpenAI 與 Paradigm 合作推出的智能合約安全 AI 基準測試 EVMbench 進行了獨立審計,並發現兩大嚴重問題:訓練資料污染以及至少 4 個被標記為「高危漏洞」的分類實際上屬於無效偽造。
EVMbench 的資料污染問題:AI 訓練截止日期的關鍵漏洞
EVMbench 於 2026 年 2 月中旬發布,旨在評估不同 AI 模型識別、修復和利用智能合約漏洞的能力,測試期間 AI 代理的網路存取權限被切斷,防止其從網路搜尋答案。然而,OpenZeppelin 的審計揭示了一個結構性漏洞:該基準測試是基於 2024 年至 2025 年年中期間開展的 120 次審計中篩選的漏洞,而多數頂尖 AI 模型的知識訓練截止日期同樣設定在 2025 年年中。
這意味著,AI 代理很可能在預訓練期間已接觸過 EVMbench 的漏洞報告,其記憶體中可能已儲存了所有問題的答案。OpenZeppelin 表示:「AI 安全最重要的能力是發現模型以前從未見過的程式碼中的新漏洞。」資料集規模有限進一步放大了污染對整體評估的影響。
EVMbench 審計發現的關鍵問題
訓練資料污染:AI 代理的預訓練可能已包含 EVMbench 的漏洞報告,使「零知識發現」測試失去意義
無效高危漏洞分類:至少 4 個被標記為高危的漏洞實際上無法被利用
評分系統缺陷:EVMbench 此前對 AI 發現這些偽漏洞的行為給予積分,評分基礎存在問題
資料集規模有限:進一步放大了污染對整體評估結果的影響
當前排行榜:Anthropic 的 Claude 4.6 領先,OpenAI 的 OC-GPT-5.2 和 Google 的 Gemini 3 Pro 緊隨其後
偽漏洞危機:至少 4 個高危分類被證實無效
除資料污染外,OpenZeppelin 還發現了更具體的事實錯誤。他們評估了至少 4 個被 EVMbench 歸類為高危的漏洞,發現這些漏洞實際上不存在——更關鍵的是,其描述的漏洞利用方式根本無法奏效。
「這些並非主觀上的嚴重性分歧;而是發現所描述的漏洞利用方式並未奏效,」OpenZeppelin 指出。若 AI 代理在測試中「發現」了這些偽漏洞,意味著評分系統在獎勵錯誤的結果。
OpenZeppelin 強調,這次審計並非否定 AI 在區塊鏈安全中的潛力:「問題不在於 AI 是否會改變智能合約的安全性——它肯定會。問題在於,我們用來建構和評估這些工具的資料和基準,是否與它們旨在保護的合約遵循相同的標準。」
常見問題
OpenZeppelin 對 EVMbench 的審計發現了什麼問題?
OpenZeppelin 發現兩大核心問題:一是訓練資料污染,EVMbench 的測試漏洞來自 2024 至 2025 年中的審計報告,與 AI 模型訓練截止日期重疊,這些模型可能在預訓練中已「見過」答案;二是至少 4 個高危漏洞分類屬於無效偽造,其描述的攻擊方式實際上無法執行。
資料污染為何對 AI 安全評測如此危險?
如果 AI 模型在預訓練中已接觸過基準測試的漏洞報告,它可能透過記憶體「回答」問題,而非真正的漏洞發現能力。這使整個評測失去「零知識測試」的意義,無法真實反映 AI 面對全新未知智能合約時的實際安全審計能力。
OpenZeppelin 對 AI 在區塊鏈安全領域的前景持何種態度?
OpenZeppelin 明確表示,AI 將對智能合約安全產生重大影響,但強調這種影響必須建立在可信的方法論和準確評測基礎之上。他們認為 EVMbench 的問題不是否定 AI 的信號,而是對行業標準的一次重要警示。
免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見
聲明。
相關文章
Elon Musk 的 X 首次發布加密貨幣貼文並自動鎖定帳戶
X 正在實作一項新功能:當使用者發布第一篇加密貨幣貼文時,系統會自動鎖定帳戶,以打擊釣魚攻擊。此舉旨在降低被盜用帳戶用於詐騙的濫用,同時提升使用者安全性。
Coinpedia2小時前
ZachXBT 指控 Circle 自 2022 年以來因「合規失誤」涉及 4.2億美元
鏈上偵探 ZachXBT 宣稱,USDC 穩定幣(USDC)的發行方 Circle 自 2022 年以來,已未能凍結或封鎖約 4.2 億美元的非法資金流。
Circle 可以凍結非法資金並封鎖錢包地址,但要嘛對「最小」程度的行動來凍結非法資金流,或
Cointelegraph2小時前
Circle 遭控放任 4.2 億美元非法資金流動!ZachXBT 揭 USDC 合規漏洞引爆爭議
美國穩定幣公司 Circle 被指控未能有效凍結超過 4.2 億美元的可疑 USDC 資金。調查員 ZachXBT 指出,自 2022 年以來,Circle 在多起駭客事件中延誤了凍結行動,引發市場對其合規性的質疑。事件中的 Drift Protocol 攻擊更是令 Circle 批評成為焦點。市場呼籲 Circle 提高風險管理標準,隨後其合規執行延誤已對用戶造成嚴重損失。
鏈新聞abmedia2小時前
Elon Musk 的 X 將部署詐騙「緊急切斷開關」,透過自動鎖定首次提及加密貨幣者
社群媒體平台 X 將對首次提及加密貨幣的帳戶自動鎖定,並要求額外驗證,以遏止加密釣魚詐騙。這項新措施旨在消除被攻擊者挾持帳戶以宣傳詐騙代幣的動機。
CoinDesk3小時前
four.meme 因技術缺陷暫停稅費模式代幣建立,將為受影響使用者全額退款
four.meme 公告指出,因以 0x9f4 開頭之專案稅費收款地址存在缺陷,導致賣出交易失敗,已暫停相關代幣建立功能並建議用戶停止交易。同時,將為 4 月 3 日 22:50 前購買之受影響用戶提供全額退款。
GateNews4小時前
上傳私密影片裸貸虛擬貨幣?「英雄貸」鎖定走投無路的人,違約就上傳 OnlyFans
一個結合加密貨幣、成人內容與高風險借貸機制的產品,近日在幣圈與社群平台引發熱議。名為「Hero Loan(英雄貸)」的專案,打出「無質押貸款」的口號,卻要求用戶上傳私密影片作為條件,並將違約風險與成人平台變現機制綁定,被不少網友形容為「加密版裸貸」。
該專案甚至以「如果你覺得這不會有人用,代表你還沒走到絕境」作為宣傳語,明確鎖定高風險、資金壓力極大的用戶族群。不過在曝光不久後,有網友表示發了影片沒收到錢,KOL 也回應說這個專案疑似跑路了。
不過說真的,私密影片只值 60 塊也太慘了吧。
「英雄貸」鎖定走投無路的人
根據官方網站資訊,該產品運行於 BNB Chain,主打為「走投無路的
鏈新聞abmedia6小時前