OpenZeppelin kiểm toán EVMbench phát hiện ô nhiễm dữ liệu

OpenZeppelin審計EVMbench發現資料污染

Công ty kiểm toán an ninh blockchain OpenZeppelin đã thực hiện kiểm toán độc lập đối với tiêu chuẩn kiểm tra AI an ninh hợp đồng thông minh EVMbench do OpenAI và Paradigm hợp tác ra mắt, và phát hiện hai vấn đề nghiêm trọng: ô nhiễm dữ liệu huấn luyện và ít nhất 4 phân loại “lỗ hổng nguy hiểm cao” thực chất là giả mạo không hợp lệ.

Vấn đề ô nhiễm dữ liệu của EVMbench: Lỗ hổng quan trọng về hạn chế thời hạn huấn luyện AI

EVMbench được phát hành vào giữa tháng 2 năm 2026, nhằm đánh giá khả năng của các mô hình AI khác nhau trong việc nhận diện, sửa chữa và khai thác lỗ hổng hợp đồng thông minh. Trong quá trình thử nghiệm, quyền truy cập mạng của đại lý AI bị cắt để ngăn chặn việc tìm kiếm câu trả lời qua mạng. Tuy nhiên, kiểm toán của OpenZeppelin tiết lộ một lỗ hổng cấu trúc: tiêu chuẩn này dựa trên 120 lần kiểm tra đã thực hiện từ năm 2024 đến giữa năm 2025, và phần lớn các mô hình AI hàng đầu cũng có hạn chót đào tạo kiến thức vào giữa năm 2025.

Điều này có nghĩa là, đại lý AI có khả năng đã tiếp xúc với các báo cáo lỗ hổng của EVMbench trong giai đoạn huấn luyện trước đó, và có thể đã lưu trữ tất cả các câu trả lời trong bộ nhớ. OpenZeppelin cho biết: “Khả năng quan trọng nhất của AI an ninh là phát hiện các lỗ hổng mới trong mã mà mô hình chưa từng thấy trước đó.” Quy mô dữ liệu hạn chế càng làm tăng ảnh hưởng của ô nhiễm dữ liệu đối với toàn bộ đánh giá.

Các vấn đề chính được phát hiện trong kiểm toán EVMbench

Ô nhiễm dữ liệu huấn luyện: Đại lý AI có thể đã được huấn luyện với các báo cáo lỗ hổng của EVMbench, khiến các thử nghiệm “phát hiện không kiến thức” mất ý nghĩa

Phân loại lỗ hổng nguy hiểm cao giả mạo: Ít nhất 4 lỗ hổng được đánh dấu là nguy hiểm cao thực chất không thể khai thác

Hạn chế của hệ thống đánh giá: Trước đây, EVMbench đã tính điểm dựa trên hành vi AI phát hiện các lỗ hổng giả này, nhưng cơ sở đánh giá có vấn đề

Quy mô dữ liệu hạn chế: Tăng thêm tác động của ô nhiễm dữ liệu đối với kết quả đánh giá tổng thể

Bảng xếp hạng hiện tại: Claude 4.6 của Anthropic dẫn đầu, theo sau là OC-GPT-5.2 của OpenAI và Gemini 3 Pro của Google

Nguy cơ lỗ hổng giả: Ít nhất 4 phân loại nguy hiểm cao bị xác nhận là vô hiệu

Ngoài ô nhiễm dữ liệu, OpenZeppelin còn phát hiện các lỗi chính xác hơn. Họ đã đánh giá ít nhất 4 lỗ hổng được EVMbench xếp vào loại nguy hiểm cao, và phát hiện rằng các lỗ hổng này thực tế không tồn tại — quan trọng hơn, cách khai thác các lỗ hổng này trong mô tả hoàn toàn không thể thực hiện được.

“Đây không phải là sự khác biệt về mức độ nghiêm trọng chủ quan; mà là phát hiện ra rằng cách khai thác lỗ hổng mô tả không có hiệu quả,” OpenZeppelin nhấn mạnh. Nếu đại lý AI “phát hiện” các lỗ hổng giả này trong thử nghiệm, điều đó có nghĩa hệ thống đánh giá đang thưởng cho kết quả sai lệch.

OpenZeppelin nhấn mạnh rằng, cuộc kiểm toán này không phủ nhận tiềm năng của AI trong an ninh blockchain: “Vấn đề không phải là AI có thể thay đổi an ninh hợp đồng thông minh — chắc chắn rồi. Vấn đề là dữ liệu và tiêu chuẩn chúng ta dùng để xây dựng và đánh giá các công cụ này có phù hợp với các tiêu chuẩn mà chúng nhằm bảo vệ hay không.”

Các câu hỏi thường gặp

OpenZeppelin đã phát hiện ra vấn đề gì trong kiểm toán EVMbench?

OpenZeppelin phát hiện hai vấn đề cốt lõi: thứ nhất là ô nhiễm dữ liệu huấn luyện, vì các báo cáo lỗ hổng của EVMbench đến từ các cuộc kiểm tra trong năm 2024-2025, trùng với hạn chót huấn luyện của mô hình AI, khiến chúng có thể đã “nhìn thấy” câu trả lời trong quá trình huấn luyện; thứ hai là ít nhất 4 lỗ hổng nguy hiểm cao bị phân loại là giả mạo, mô tả cách khai thác không thể thực thi.

Tại sao ô nhiễm dữ liệu lại nguy hiểm đối với đánh giá an ninh AI như vậy?

Nếu mô hình AI đã tiếp xúc với các báo cáo lỗ hổng trong quá trình huấn luyện, nó có thể “trả lời” câu hỏi dựa trên bộ nhớ chứ không phải khả năng phát hiện lỗ hổng thực sự. Điều này làm mất ý nghĩa của thử nghiệm “không kiến thức”, không thể phản ánh chính xác khả năng kiểm tra an ninh của AI khi đối mặt với các hợp đồng thông minh mới, chưa từng thấy.

OpenZeppelin nghĩ gì về triển vọng của AI trong lĩnh vực an ninh blockchain?

OpenZeppelin rõ ràng cho biết, AI sẽ có ảnh hưởng lớn đến an ninh hợp đồng thông minh, nhưng nhấn mạnh rằng ảnh hưởng này phải dựa trên phương pháp luận đáng tin cậy và tiêu chuẩn đánh giá chính xác. Họ coi các vấn đề của EVMbench không phải là phủ nhận tiềm năng của AI, mà là một cảnh báo quan trọng đối với ngành.

Xem bản gốc
Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.

Bài viết liên quan

TRM Labs Báo cáo $35B Mất tiền do lừa đảo tiền điện tử trên toàn thế giới năm 2025

TRM Labs báo cáo sự gia tăng của các vụ lừa đảo tiền điện tử toàn cầu, đạt $35 tỷ đô la vào năm 2025, có khả năng đánh giá thấp thiệt hại thực tế. Đào tạo nâng cao và các công cụ blockchain là điều cần thiết để lực lượng thực thi pháp luật có thể chống lại các thủ đoạn lừa đảo tinh vi một cách hiệu quả.

TheNewsCrypto1giờ trước

Iran, Bắc Triều Tiên đều đang sử dụng! Stablecoin trở thành tài sản ảo ưa thích cho giao dịch bất hợp pháp, số tiền liên quan lên tới 51 tỷ USD

Theo báo cáo của FATF, stablecoin đã trở thành tài sản ưa thích cho các giao dịch bất hợp pháp, đặc biệt được sử dụng rộng rãi tại Iran và Bắc Triều Tiên. Tổ chức này kêu gọi tăng cường quản lý các nhà phát hành stablecoin và chỉ ra rằng vào năm 2025, stablecoin sẽ chiếm phần lớn các giao dịch tài sản ảo bất hợp pháp. Để đối phó với các thách thức liên quan, FATF đề xuất các nhà phát hành nên nâng cao năng lực kỹ thuật để tăng hiệu quả quản lý.

区块客1giờ trước

Lừa đảo đầu độc địa chỉ: Cá mập TON mất 220.000 USD, kẻ lừa đảo hoàn trả phần lớn

Một cá mập trên blockchain TON vô tình gửi $220K cho một kẻ lừa đảo. Kẻ lừa đảo giữ $17K và trả lại phần còn lại kèm theo lời xin lỗi. Gần đây, một cá mập trên blockchain TON đã trở thành nạn nhân của một vụ lừa đảo làm nhiễu địa chỉ. Sự cố này đã khiến anh ta mất 220.000 đô la giá trị token TON. Anh ta đã gửi số tiền này đến sai ví bằng cách

LiveBTCNews1giờ trước

OpenClaw xuất hiện lỗ hổng「tấn công tự thân」: Thực thi nhầm lệnh Bash dẫn đến rò rỉ khóa bí mật

GoPlus báo cáo rằng, công cụ AI OpenClaw đã xảy ra sự cố an ninh tự tấn công, do lệnh Bash sai dẫn đến rò rỉ biến môi trường nhạy cảm. Đề xuất sử dụng API trong phát triển AI, tuân thủ nguyên tắc tối thiểu quyền hạn, hạn chế các thao tác rủi ro cao và đưa vào kiểm duyệt thủ công.

GateNews2giờ trước

Tập đoàn Thái Tử rửa tiền tại Đài Loan 107 tỷ! Tự phát triển "OJBK Ví" kết nối với các dịch vụ đổi tiền ngầm

Vụ án rửa tiền của "Tài Tử Nhóm" tại Campuchia do Viện Kiểm sát Taipei điều tra, liên quan đến số tiền rửa tiền bất hợp pháp lên đến 10.7 tỷ đô la Đài Loan, đã truy tố 62 người bao gồm Chen Zhi và những người khác, đồng thời phát hiện nhóm này sử dụng USDT và ví "OJBK" tự phát triển để thực hiện rửa tiền xuyên quốc gia. Chen Zhi chỉ huy thành lập các công ty tại nhiều quốc gia, thông qua các hợp đồng giao dịch giả mạo để che giấu thu nhập phạm pháp, đồng thời mua nhà sang và xe hơi đắt tiền, Viện Kiểm sát đề nghị mức án tối đa 13 năm tù.

区块客4giờ trước

Bộ Công Cụ Khai Thác iOS New Coruna Tăng Rủi Ro An Ninh cho Người Dùng Crypto

Bộ công cụ khai thác "Coruna" mới được phát hiện gây ra mối đe dọa nghiêm trọng đối với các thiết bị của Apple, chứa 23 lỗ hổng tinh vi có thể xâm phạm iPhone trên nhiều phiên bản iOS. Các nhà nghiên cứu cảnh báo rằng các công cụ này đang lưu hành trên thị trường tội phạm mạng, nhấn mạnh sự cần thiết của việc cập nhật phần mềm định kỳ để tăng cường bảo mật.

TodayqNews4giờ trước
Bình luận
0/400
Không có bình luận