OpenAI Đặt Các Trình AI Đấu Với Nhau Để Thử Thách Các Hợp Đồng Thông Minh

CryptoBreaking

OpenAI đã giới thiệu một khuôn khổ đánh giá nhằm đo lường hiệu quả của các tác nhân AI trong việc phát hiện, giảm thiểu và thậm chí khai thác các lỗ hổng bảo mật trong hợp đồng thông minh tiền mã hóa. Dự án, có tên gọi “EVMbench: Đánh giá các tác nhân AI về An ninh hợp đồng thông minh,” được phát hành hợp tác cùng Paradigm và OtterSec, hai tổ chức có nhiều kinh nghiệm về bảo mật blockchain và đầu tư. Nghiên cứu đánh giá các tác nhân AI dựa trên một bộ dữ liệu gồm 120 điểm yếu tiềm năng được rút ra từ 40 cuộc kiểm tra hợp đồng thông minh, nhằm mục đích không chỉ đo lường khả năng phát hiện và vá lỗi mà còn đánh giá tiềm năng khai thác lý thuyết của các tác nhân này trong môi trường kiểm soát.

Những điểm chính

EVMbench thử nghiệm các tác nhân AI với 120 lỗ hổng được chọn lọc từ 40 cuộc kiểm tra hợp đồng thông minh, nhấn mạnh các lỗ hổng xuất phát từ các cuộc thi kiểm tra mã nguồn mở.

Trong số các mô hình được thử nghiệm, Claude Opus 4.6 của Anthropic dẫn đầu với trung bình giải thưởng phát hiện là 37.824 USD, theo sau là OC-GPT-5.2 của OpenAI với 31.623 USD và Gemini 3 Pro của Google với 25.112 USD.

OpenAI định hình khuôn khổ này như một bước tiến trong việc đo lường hiệu suất AI trong “môi trường có ý nghĩa kinh tế,” không chỉ đơn thuần là các nhiệm vụ chơi chơi, nhấn mạnh các tác động thực tế đối với các tấn công và phòng thủ trong lĩnh vực bảo mật tiền mã hóa.

Các nhà nghiên cứu lưu ý rằng các hợp đồng thông minh đang bảo vệ hàng tỷ đô la tài sản, làm nổi bật giá trị chiến lược của các công cụ hỗ trợ AI cho cả hoạt động tấn công lẫn phòng thủ.

Các nhà quan sát trong ngành đã liên kết các phát triển này với các cuộc thảo luận rộng hơn về thanh toán dựa trên AI và vai trò của stablecoin trong các giao dịch hàng ngày, với các giám đốc điều hành dự đoán việc sử dụng tác nhân AI sẽ ngày càng tăng trong những năm tới.

Bối cảnh cho công việc này được nhấn mạnh bởi dữ liệu về các sự cố bảo mật tiền mã hóa năm 2025, cho thấy dòng chảy liên tục của các khoản tiền qua các lỗ hổng và các cuộc tấn công, làm nổi bật nhu cầu về các công cụ kiểm tra và vá lỗi mạnh mẽ, nhanh chóng và đáng tin cậy hơn. Khung EVMbench được định hướng một phần như một cách để đo lường xem các tác nhân AI có thể đóng góp có ý nghĩa vào khả năng phòng thủ quy mô lớn hay không, giảm thiểu các cơ hội khai thác và thúc đẩy quá trình giảm thiểu mối đe dọa.

Để xây dựng bộ đánh giá, các nhà nghiên cứu đã dựa trên 120 lỗ hổng được chọn lọc từ 40 cuộc kiểm tra hợp đồng thông minh, nhiều trong số đó bắt nguồn từ các thử thách kiểm tra mã nguồn mở. OpenAI cho rằng khuôn khổ này sẽ giúp theo dõi tiến trình của AI trong việc nhận diện và giảm thiểu các điểm yếu ở cấp độ hợp đồng theo quy mô, cung cấp một phương pháp chuẩn hóa để so sánh các mô hình AI trong tương lai khi chúng phát triển. Nghiên cứu cũng cung cấp một góc nhìn về cách AI có thể được áp dụng để chuẩn hóa đánh giá rủi ro trên nhiều kiến trúc hợp đồng thông minh khác nhau, thay vì chỉ tập trung vào các trường hợp riêng lẻ.

Hợp đồng thông minh không dành cho con người: Dragonfly

Trong một chủ đề cùng thời trên X, Haseeb Qureshi, đối tác tại Dragonfly, lập luận rằng lời hứa của tiền mã hóa về việc thay thế quyền sở hữu và các hợp đồng truyền thống chưa bao giờ thành hiện thực không phải vì công nghệ thất bại, mà vì nó chưa bao giờ được thiết kế dựa trên trực giác của con người. Ông nhấn mạnh nỗi sợ dai dẳng liên quan đến việc ký các giao dịch lớn trong môi trường vẫn còn nhiều rủi ro như ví rút tiền và các phương thức tấn công khác, trái ngược hoàn toàn với trải nghiệm chuyển khoản ngân hàng truyền thống mượt mà hơn.

Qureshi cho rằng giai đoạn tiếp theo của các giao dịch tiền mã hóa có thể được kích hoạt bởi các ví tự lái, trung gian bởi AI. Những ví này sẽ theo dõi rủi ro, quản lý các hoạt động phức tạp và tự động phản ứng với các mối đe dọa thay mặt người dùng, giảm thiểu sự ma sát và nỗi sợ hãi hiện tại khi thực hiện các giao dịch lớn.

“Một công nghệ thường chỉ vào đúng thời điểm khi phần bổ sung của nó xuất hiện. GPS phải chờ điện thoại thông minh, TCP/IP phải chờ trình duyệt. Đối với tiền mã hóa, có thể chúng ta đã tìm thấy nó trong các tác nhân AI.”

Thông điệp chính từ chủ đề này là các tác nhân AI có thể đóng vai trò then chốt trong việc chuyển đổi cách mọi người tương tác với tiền mã hóa—chuyển từ các giao dịch thủ công, dễ mắc lỗi sang các quy trình tự động, nhận thức rủi ro và có khả năng mở rộng theo mức độ chấp nhận. Khi các tác nhân AI bắt đầu thể hiện năng lực xử lý các vấn đề về bảo mật ngày càng tốt hơn, người dùng có thể thấy độ tin cậy và khả năng chống chịu của các quy trình tài chính phi tập trung được cải thiện, ngay cả khi các công nghệ nền tảng vẫn tiếp tục phát triển.

Những điều cần chú ý tiếp theo

Phát hành và xác thực độc lập toàn bộ dữ liệu EVMbench trên các mô hình và kiến trúc AI mới.

Việc áp dụng rộng rãi các quy trình kiểm tra dựa trên AI trong các tổ chức kiểm toán, sàn giao dịch và dự án DeFi nhằm nâng cao khả năng bảo mật.

Nghiên cứu về ví tác nhân và các luồng thanh toán tự động, bao gồm các vấn đề về quy định và tuân thủ đối với tài sản do AI quản lý.

Các đánh giá so sánh các hệ thống AI mới khi các phiên bản mới ra mắt, theo dõi sự tiến bộ về độ chính xác phát hiện và tốc độ vá lỗi.

Nguồn & xác thực

OpenAI: EVMbench: Đánh giá các tác nhân AI về An ninh hợp đồng thông minh — PDF: https://cdn.openai.com/evmbench/evmbench.pdf

OpenAI: Giới thiệu EVMbench — https://openai.com/index/introducing-evmbench/

Thiệt hại bảo mật tiền mã hóa năm 2025 (báo cáo): https://cointelegraph.com/news/crypto-3-4-billion-losses-2025-wallet-hacks

Dragonfly: Haseeb Qureshi về AI và trải nghiệm người dùng crypto (bài đăng X): https://x.com/hosseeb/status/2024136762424185208

Ảnh hưởng của AI Trung Quốc và các vấn đề liên quan đến crypto (phân tích): https://cointelegraph.com/news/china-ai-lead-future

AI Eye — Phát triển IronClaw và bot AI trong phạm vi bài viết của Polymarket: https://cointelegraph.com/magazine/ironclaw-secure-private-sounds-cooler-openclaw-ai-eye/

Các số liệu chính và bước tiếp theo

Nghiên cứu EVMbench cho thấy các mô hình ngôn ngữ lớn và các tác nhân AI liên quan bắt đầu thực hiện các công việc bảo mật có ý nghĩa trong lĩnh vực hợp đồng thông minh, với sự khác biệt rõ ràng giữa các mô hình. Claude Opus 4.6 dẫn đầu về trung bình giải thưởng phát hiện cho thấy một số kiến trúc có thể nhạy bén hơn trong việc phát hiện và giảm thiểu các lỗ hổng trong logic hợp đồng phức tạp, trong khi các mô hình khác còn lại, tạo thành một phổ các khả năng mà các nhà nghiên cứu có thể muốn hoàn thiện hơn nữa. Việc hợp tác với nhiều đối tác trong ngành thể hiện sự đồng thuận ngày càng tăng rằng bảo mật dựa trên AI và quản lý rủi ro tự động có thể trở thành yếu tố then chốt để mở rộng trong môi trường phi tập trung.

Khi lĩnh vực này phát triển, các nhà quan sát sẽ theo dõi xem các tác nhân AI có thể chuyển đổi từ phát hiện sang khắc phục nhanh chóng như thế nào, và liệu các tác nhân này có thể vận hành một cách đáng tin cậy trong hệ thống thực mà không tạo ra rủi ro mới hay không. Cuộc thảo luận về ví AI và thanh toán tự động còn liên quan đến các vấn đề về quản trị bảo mật, sự đồng thuận của người dùng và phù hợp quy định. Nếu xu hướng do OpenAI và các đối tác đề xuất tiếp tục, các công cụ hỗ trợ AI có thể trở thành thành phần cốt lõi của hạ tầng crypto tương lai, thay đổi cả cách đánh giá rủi ro lẫn trải nghiệm người dùng một cách có ý nghĩa. Các đợt đánh giá tiếp theo, cùng với các triển khai thực tế, sẽ giúp xác định tốc độ hiện thực hóa tầm nhìn này và các biện pháp phòng ngừa cần thiết đi kèm.

Xem bản gốc
Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.
Bình luận
0/400
Không có bình luận
Giao dịch tiền điện tử mọi lúc mọi nơi
qrCode
Quét để tải xuống ứng dụng Gate
Cộng đồng
Tiếng Việt
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)