قامت OpenAI و Paradigm ببناء EVMbench استنادًا إلى 120 ثغرة أمنية حقيقية تم اكتشافها خلال عمليات التدقيق.
تختبر أدوات الذكاء الاصطناعي في وضع الكشف والتصحيح والاستغلال باستخدام بيئات EVM معزولة.
حقق GPT-5.3-Codex نسبة 72.2% في وضع الاستغلال، متفوقًا على نتائج GPT-5 السابقة.
كشفت OpenAI، بالتعاون مع Paradigm، عن معيار جديد لاختبار أداء الذكاء الاصطناعي في أمان العقود الذكية على شبكة إيثريوم. تم الإعلان عن الإصدار هذا الأسبوع، والذي قدم EVMbench كوسيلة لقياس مدى قدرة الوكلاء الذكاء الاصطناعي على اكتشاف وتصحيح واستغلال عيوب العقود. ويهدف هذا الجهد إلى مواجهة المخاطر المتزايدة، حيث تؤمن العقود الذكية أكثر من 100 مليار دولار من الأصول الرقمية عبر شبكات EVM.
وفقًا لـ OpenAI، يستمد EVMbench من 120 ثغرة عالية الخطورة تم تحديدها عبر 40 عملية تدقيق احترافية للعقود الذكية. ومن الجدير بالذكر أن العديد من هذه المشكلات نشأت من مسابقات التدقيق المفتوحة، بما في ذلك Code4rena. يركز المعيار على الأخطاء الحقيقية بدلاً من الأمثلة الاصطناعية.
بالإضافة إلى ذلك، ذكرت OpenAI أن مجموعة البيانات تتضمن سيناريوهات مرتبطة بأعمال أمنية على شبكة Tempo. تعمل Tempo كشبكة من الطبقة الأولى تركز على المدفوعات، مصممة لنقل العملات المستقرة. لذلك، تقدم هذه الحالات مخاطر منطق الدفع ضمن بيئة الاختبار.
لدعم الاختبارات الواقعية، أعاد المهندسون استخدام نصوص إثبات المفهوم للاستغلال حيثما كانت متاحة. ومع ذلك، قاموا ببناء المكونات المفقودة يدويًا عندما كانت الوثائق غير مكتملة. وقالت OpenAI إنها حافظت على قابلية الاستغلال مع ضمان أن التصحيحات يمكن تجميعها بشكل صحيح.
يقيم EVMbench الوكلاء في وضع الكشف والتصحيح والاستغلال. في وضع الكشف، يقوم الوكلاء بمسح المستودعات وتقييمهم بناءً على مدى استرجاع الثغرات المؤكدة. في وضع التصحيح، يجب على الوكلاء إصلاح العيوب مع الحفاظ على سلوك العقد الأصلي.
أما وضع الاستغلال، فيحاكي هجمات كاملة لتفريغ الأموال داخل بيئة بلوكشين معزولة. ذكرت OpenAI أن المقيمين يؤكدون النتائج من خلال إعادة تشغيل المعاملات وفحوصات الحالة على السلسلة. لضمان الاتساق، أنشأت الشركة أداة تعتمد على Rust لنشر عمليات استنساخ حتمية.
تُجرى اختبارات الاستغلال في بيئة Anvil المحلية، وليس على الشبكات الحية. وأشارت OpenAI إلى أن جميع الثغرات تاريخية ومعلنة علنًا. بالإضافة إلى ذلك، تقيّد الأداة استدعاءات RPC غير الآمنة لتقليل سوء الاستخدام.
في النتائج المعلنة، حقق GPT-5.3-Codex نسبة 72.2% في وضع الاستغلال. بالمقارنة، وصل GPT-5 إلى 31.9%، على الرغم من إطلاقه قبل عدة أشهر. ومع ذلك، ذكرت OpenAI أن تغطية الكشف والتصحيح لا تزال غير مكتملة.
إلى جانب EVMbench، أكدت OpenAI تعيين موظف رئيسي جديد. انضم بيتر ستاينبرغر، مؤسس OpenClaw، إلى الشركة للعمل على تطوير الوكلاء. وأكد سام ألتمان الخبر عبر منصة X، مشيرًا إلى أن ستاينبرغر سيتولى قيادة مشاريع الوكلاء الشخصيين من الجيل التالي.
مقالات ذات صلة
اللجوء إلى العملات المشفرة كملاذ آمن في حالات الطوارئ؟ خلال دقائق قليلة من وقوع غارة جوية إسرائيلية أمريكية، ارتفعت كمية التدفقات الخارجة من بورصة إيران بنسبة 700%
أخبار اليوم عن إيثيريوم: BitMine ترفع المخزون لدفع ETH إلى العودة إلى 2000 دولار
فيتاليك بوتيرين يسرع مرة أخرى $ETH بيع-على-الانطلاق — ما الذي يقف وراء هذه الخطوة؟
BitMine تشتري 50,000 وحدة من ETH مرة أخرى، توم لي يقول إن سوق مارس على وشك الانعكاس
نظرة عامة على العملات المشهورة في 03 مارس 2026، والأكثر شعبية هي: Bitcoin، Ethereum، XRP