OpenAI bekerja sama dengan Paradigm meluncurkan EVMbench, pengujian nyata kemampuan serangan dan pertahanan AI proxy pada kontrak pintar EVM, mengungkap kekhawatiran tentang kekuatan serangan yang kuat dan pertahanan yang lemah.
Pemimpin kecerdasan buatan OpenAI mengumumkan kolaborasi dengan perusahaan investasi risiko kripto terkenal Paradigm dan perusahaan keamanan OtterSec untuk meluncurkan alat pengujian standar EVMbench, yang dirancang khusus untuk menilai kinerja keamanan AI proxy (AI Agents) pada kontrak pintar Ethereum Virtual Machine (EVM).
Seiring dengan kedalaman integrasi AI dan teknologi kripto, kontrak pintar telah menjadi infrastruktur inti dalam mengelola aset kripto sumber terbuka lebih dari 100 miliar dolar. Peluncuran alat ini menandai bahwa industri mulai menyadari kemampuan praktis AI dalam lingkungan yang memiliki makna ekonomi.
Tim OpenAI menunjukkan bahwa, seiring lonjakan kemampuan AI proxy dalam penulisan dan perencanaan kode, model-model ini akan memainkan peran transformasional dalam serangan dan pertahanan di blockchain di masa depan. Oleh karena itu, membangun kerangka evaluasi standar sangat penting untuk memantau perkembangan AI.
Desain inti EVMbench berfokus pada 120 kerentanan berisiko tinggi yang diambil dari 40 laporan audit profesional, dengan sumber data termasuk kompetisi audit terbuka terkenal seperti Code4rena, memastikan skenario pengujian mendekati kompleksitas dunia nyata. Standar pengujian ini menempatkan AI proxy dalam tiga mode kerja berbeda untuk dievaluasi:
Gambar sumber: Desain inti EVMbench dari OpenAI menempatkan AI proxy dalam tiga mode kerja berbeda untuk evaluasi
Untuk memastikan ketelitian dan keberulangan pengujian, tim mengembangkan kerangka pengujian berbasis bahasa Rust, menggunakan teknik replay transaksi deterministik untuk memverifikasi keberhasilan serangan atau perbaikan AI.
Dalam hasil pengujian awal yang dirilis, AI menunjukkan perbedaan kemampuan yang jelas antar tugas. Generasi terbaru GPT-5.3-Codex tampil sangat baik dalam mode eksploitasi, dengan skor mencapai 72,2%, jauh lebih tinggi dibandingkan model GPT-5 yang dirilis enam bulan lalu dengan skor 31,9%, menunjukkan pertumbuhan kemampuan yang sangat mengesankan.
Gambar sumber: Ikhtisar skor berbagai model AI OpenAI dalam tiga mode
Ini menunjukkan bahwa ketika targetnya jelas untuk “mengosongkan dana”, AI memiliki kemampuan perencanaan dan eksekusi iteratif yang kuat. Namun, dalam hal pertahanan, performa AI relatif lemah, sering berhenti mencari setelah menemukan satu kesalahan dalam mode deteksi, dan kesulitan memperbaiki kerentanan logika kompleks tanpa mengganggu operasi kontrak secara normal. Para ahli keamanan menyatakan kekhawatiran bahwa AI dapat secara signifikan mempercepat waktu dari penemuan kerentanan hingga pengembangan metode serangan, yang menuntut kecepatan pertahanan yang lebih tinggi dari proyek DeFi.
Selain pengembangan alat, OpenAI juga aktif dalam rekrutmen talenta dan penguatan ekosistem pertahanan. Baru-baru ini, mereka merekrut pendiri proyek AI proxy open-source OpenClaw, Peter Steinberger, untuk memimpin pengembangan proxy personalisasi generasi berikutnya, dan mengubah proyek tersebut menjadi model yayasan yang didukung OpenAI.
Untuk mengatasi risiko keamanan siber yang mungkin timbul dari AI, OpenAI berjanji akan mengalokasikan dana sebesar 10 juta dolar melalui program subsidi keamanan siber mereka, untuk mendukung pengembangan alat pertahanan sumber terbuka dan penelitian infrastruktur penting. Langkah ini menjadi sangat relevan setelah insiden protokol Moonwell baru-baru ini, di mana kesalahan perhitungan harga dalam kode bersama AI menyebabkan kerugian sekitar 1,78 juta dolar.
Baca juga
Menolak tawaran miliaran dari Meta, pencipta OpenClaw bergabung dengan OpenAI memicu perebutan talenta, semuanya salah Vibe Coding? Ramalan Moonwell gagal, siapa yang akan menanggung kerugian 1,78 juta?
Ke depan, dengan semakin banyaknya proxy pembayaran stablecoin berbantuan AI dan dompet otomatis yang bergabung ke ekosistem, penggunaan alat seperti EVMbench untuk membedakan model yang hanya mampu mendeskripsikan kerentanan dari model yang dapat memberikan solusi pertahanan yang andal akan menjadi titik balik penting dalam industri keamanan blockchain.
Artikel Terkait
Deloitte memberikan penjaminan cadangan pertama untuk stablecoin USAT milik Tether
Pump.fun Memperluas Kemampuan Perdagangan Dengan Pembaruan Aplikasi Baru
Selamat tinggal EVM? Vitalik akan melakukan "operasi jantung" untuk Ethereum
Northern Trust Masuk ke Pasar Sekuritas Tokenized Bersama BNY
Yayasan Citrea Diluncurkan untuk Menguatkan Lapisan Pemrograman Bitcoin