Bisakah Agen AI Meningkatkan Keamanan Ethereum? OpenAI dan Paradigm Membuat Tempat Pengujian

ETH-2,44%

Singkatnya

  • EVMbench menguji agen AI terhadap 120 kerentanan kontrak pintar Ethereum dunia nyata.
  • Alat ini mengevaluasi deteksi, perbaikan, dan eksploitasi dalam tiga mode berbeda.
  • GPT-5.3-Codex mencapai tingkat keberhasilan 72,2% dalam pengujian mode eksploitasi.

Pembuat ChatGPT, OpenAI, dan perusahaan investasi yang berfokus pada kripto, Paradigm, telah memperkenalkan EVMbench, sebuah alat untuk membantu meningkatkan keamanan kontrak pintar Ethereum Virtual Machine. EVMbench dirancang untuk mengevaluasi kemampuan agen AI dalam mendeteksi, memperbaiki, dan mengeksploitasi kerentanan tingkat tinggi dalam kontrak pintar Ethereum Virtual Machine (EVM). Kontrak pintar adalah inti dari jaringan Ethereum, menyimpan kode yang menjalankan segala sesuatu mulai dari protokol keuangan terdesentralisasi hingga peluncuran token. Jumlah kontrak pintar yang dideploy setiap minggu di Ethereum mencapai rekor tertinggi 1,7 juta pada November 2025, dengan 669.500 dideploy minggu lalu saja, menurut Token Terminal. 

EVMbench mengacu pada 120 kerentanan yang dikurasi dari 40 audit, sebagian besar berasal dari kompetisi audit terbuka seperti Code4rena, menurut posting blog OpenAI. Alat ini juga mencakup skenario dari proses audit keamanan untuk Tempo, blockchain layer-1 yang dibangun khusus oleh Stripe yang fokus pada pembayaran stablecoin berkecepatan tinggi dan biaya rendah. Raksasa pembayaran Stripe meluncurkan testnet publik untuk Tempo pada Desember, dengan menyatakan bahwa pengembangan alat ini melibatkan masukan dari Visa, Shopify, dan OpenAI, di antara lainnya. Tujuannya adalah untuk mendasarkan pengujian pada kode dunia nyata yang bermakna secara ekonomi—terutama saat pembayaran stablecoin berbasis AI berkembang, tambah perusahaan tersebut.

Memperkenalkan EVMbench—benchmark baru yang mengukur seberapa baik agen AI dapat mendeteksi, mengeksploitasi, dan memperbaiki kerentanan kontrak pintar tingkat tinggi. https://t.co/op5zufgAGH

— OpenAI (@OpenAI) 18 Februari 2026

EVMbench dirancang untuk mengevaluasi model AI dalam tiga mode: Deteksi, perbaikan, dan eksploitasi. Dalam mode “deteksi,” agen mengaudit repositori dan dinilai berdasarkan kemampuan mereka mengingat kerentanan yang sebenarnya. Dalam mode “perbaikan,” agen harus menghilangkan kerentanan tanpa merusak fungsi yang dimaksudkan. Akhirnya, dalam fase “eksploitasi,” agen mencoba serangan pengurasan dana secara end-to-end di lingkungan blockchain yang dikarantina, dengan penilaian dilakukan melalui replay transaksi deterministik. Dalam mode eksploitasi, GPT-5.3-Codex yang dijalankan melalui OpenAI’s Codex CLI meraih skor 72,2%, dibandingkan 31,9% untuk GPT-5, yang dirilis enam bulan sebelumnya. Performa dalam tugas deteksi dan perbaikan lebih lemah, di mana agen kadang gagal melakukan audit secara menyeluruh atau kesulitan menjaga fungsi kontrak secara penuh. Para peneliti dari pembuat ChatGPT memperingatkan bahwa EVMbench tidak sepenuhnya menangkap kompleksitas keamanan dunia nyata. Meski begitu, mereka menambahkan bahwa mengukur kinerja AI dalam lingkungan yang relevan secara ekonomi sangat penting karena model menjadi alat yang kuat bagi penyerang maupun pembela. Sam Altman dari OpenAI dan co-founder Ethereum, Vitalik Buterin, sebelumnya pernah berselisih mengenai kecepatan pengembangan AI. Pada Januari 2025, Altman mengatakan bahwa perusahaannya “percaya bahwa kami tahu cara membangun AGI seperti yang kami pahami secara tradisional.” Namun, Buterin berpendapat bahwa sistem AI harus menyertakan kemampuan “penundaan lunak” yang dapat secara sementara membatasi operasi AI skala industri jika tanda-tanda peringatan muncul.

Lihat Asli
Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke Penafian.

Artikel Terkait

Data: Dalam 24 jam terakhir, total likuidasi di seluruh jaringan mencapai 252 juta dolar AS, likuidasi posisi long sebesar 170 juta dolar AS, dan likuidasi posisi short sebesar 81,774,1 juta dolar AS

Pesan ChainCatcher, menurut data Coinglass, dalam 24 jam terakhir seluruh jaringan mengalami likuidasi sebesar 2,52 miliar dolar AS, likuidasi posisi long sebesar 1,7 miliar dolar AS, dan likuidasi posisi short sebesar 81,774,1 ribu dolar AS. Di antaranya, likuidasi posisi long Bitcoin sebesar 69,2463 ribu dolar AS, likuidasi posisi short Bitcoin sebesar 27,4732 ribu dolar AS, likuidasi posisi long Ethereum sebesar 36,4551 ribu dolar AS, dan likuidasi posisi short Ethereum sebesar 22,6325 ribu dolar AS.

GateNews9menit yang lalu

Bitcoin turun ke $70,600, Ethereum bertahan di 2,055, analis: skor pasar bullish hanya 10, jangan terlalu percaya pada rebound ini

Bitcoin baru-baru ini terus mengalami penurunan, saat ini diperdagangkan di $70,923, dan CryptoQuant memperingatkan bahwa rebound saat ini hanyalah kenaikan jangka pendek dalam pasar bearish, dengan skor pasar bullish hanya 10 poin. Pasar saham AS semuanya turun, pasar kripto juga mengalami tekanan, dan arah ke depan tergantung pada apakah permintaan spot akan kembali positif. Ada berbagai skenario di pasar, termasuk kemungkinan konsolidasi horizontal atau penurunan ke wilayah dukungan $56,000-$60,000. Ethereum menunjukkan kekuatan relatif dalam tren ini, tetapi jika Bitcoin terus menurun, dukungannya masih perlu diamati.

動區BlockTempo24menit yang lalu

Mengapa Jalan Ethereum Menuju $2.5K Bisa Lebih Sulit—Inilah Alasannya

Ether menghadapi tekanan jual yang kembali saat pasar global melemah dan para trader memperhitungkan risiko geopolitik ke dalam aset berisiko. Setelah naik singkat ke $2.200, ETH turun sekitar 6% dalam sesi tersebut, karena saham AS menurun dan pengiriman minyak dan gas di Timur Tengah mengganggu jalur pasokan. Makro

CryptoBreaking34menit yang lalu

Culper Research mengumumkan short ETH dan sekuritas terkait, menyatakan bahwa model ekonomi token setelah upgrade Fusaka mengalami kerusakan

Lembaga short selling Culper Research mengumumkan posisi short terhadap Ethereum dan sekuritas terkait, dengan anggapan bahwa peningkatan Fusaka pada tahun 2025 akan merugikan model ekonomi token ETH. Setelah peningkatan, biaya Gas turun lebih dari yang diperkirakan, sementara data on-chain menunjukkan bahwa pertumbuhan alamat aktif dan volume transaksi berasal dari transaksi bernilai rendah. Culper percaya bahwa Vitalik menyadari hal ini dan akan terus menjual ETH, diperkirakan harga ETH akan semakin turun.

GateNews36menit yang lalu

Vitalik:Di bidang lapisan aplikasi dan antarmuka eksternal Ethereum, harus berani untuk melakukan rekonstruksi total berbagai konsep

Vitalik Buterin di Farcaster menyatakan bahwa Ethereum membutuhkan pemikiran yang lebih terbuka dan berani, terutama di lapisan aplikasi, menekankan bahwa fitur inti tidak boleh dikompromikan. Dia menekankan pentingnya merekonstruksi konsep dan arah teknologi, serta mengusulkan untuk merancang aplikasi dari sudut pandang baru guna mendorong perkembangan dan pertumbuhan Ethereum.

GateNews56menit yang lalu
Komentar
0/400
Tidak ada komentar