
บริษัทตรวจสอบความปลอดภัยบล็อกเชน OpenZeppelin ได้ดําเนินการตรวจสอบอิสระของ EVMbench ซึ่งเป็นเกณฑ์มาตรฐาน AI ด้านความปลอดภัยของสัญญาอัจฉริยะที่เปิดตัวโดย OpenAI ร่วมกับ Paradigm และพบปัญหาร้ายแรงสองประการ: การปนเปื้อนของข้อมูลการฝึกอบรมและการจําแนกประเภทอย่างน้อย 4 ประเภทที่ทําเครื่องหมายว่า “ช่องโหว่ที่มีความเสี่ยงสูง” เป็นการปลอมแปลงที่ไม่ถูกต้อง
EVMbench เปิดตัวในช่วงกลางเดือนกุมภาพันธ์ พ.ศ. 2026 มีจุดมุ่งหมายเพื่อประเมินความสามารถของโมเดล AI ต่างๆ ในการระบุ แก้ไข และใช้ประโยชน์จากช่องโหว่ของสัญญาอัจฉริยะ โดยตัดการเข้าถึงอินเทอร์เน็ตของตัวแทน AI ระหว่างการทดสอบ ป้องกันไม่ให้พวกเขาค้นหาคําตอบจากอินเทอร์เน็ต อย่างไรก็ตาม การตรวจสอบของ OpenZeppelin เผยให้เห็นช่องโหว่เชิงโครงสร้าง: เกณฑ์มาตรฐานอิงตามช่องโหว่ที่คัดกรองในการตรวจสอบ 120 ครั้งที่ดําเนินการระหว่างปี 2024 ถึงกลางปี 2025 และกําหนดเส้นตายการฝึกอบรมความรู้สําหรับโมเดล AI ชั้นนําส่วนใหญ่ก็กําหนดไว้ที่กลางปี 2025 เช่นกัน
ซึ่งหมายความว่าตัวแทน AI มีแนวโน้มที่จะได้รับรายงานช่องโหว่ของ EVMbench ในระหว่างการฝึกอบรมล่วงหน้า และอาจมีคําตอบสําหรับคําถามทั้งหมดที่เก็บไว้ในหน่วยความจํา OpenZeppelin กล่าวว่า: “ความสามารถที่สําคัญที่สุดของการรักษาความปลอดภัย AI คือการค้นหาช่องโหว่ใหม่ในโค้ดที่โมเดลไม่เคยเห็นมาก่อน” ขนาดที่จํากัดของชุดข้อมูลช่วยเพิ่มผลกระทบของการปนเปื้อนต่อการประเมินโดยรวม
การปนเปื้อนของข้อมูลการฝึกอบรม: การฝึกอบรมล่วงหน้าของตัวแทน AI อาจรวมถึงรายงานช่องโหว่จาก EVMbench ทําให้การทดสอบ “การค้นพบความรู้เป็นศูนย์” ไร้ความหมาย
การจําแนกประเภทช่องโหว่ที่มีความเสี่ยงสูงไม่ถูกต้อง: ช่องโหว่อย่างน้อย 4 ช่องโหว่ที่ทําเครื่องหมายว่ามีความเสี่ยงสูงไม่สามารถใช้ประโยชน์ได้จริง
ข้อบกพร่องของระบบการให้คะแนน: ก่อนหน้านี้ EVMbench ให้คะแนนกับพฤติกรรมของ AI ในการค้นพบช่องโหว่หลอกเหล่านี้ และมีปัญหากับพื้นฐานการให้คะแนน
ชุดข้อมูลมีขนาดจํากัด: ขยายผลกระทบของมลพิษต่อผลการประเมินโดยรวม
กระดานผู้นําปัจจุบัน: Claude 4.6 จาก Anthropic นํา ตามด้วย OC-GPT-5.2 ของ OpenAI และ Gemini 3 Pro ของ Google
นอกจากการปนเปื้อนของข้อมูลแล้ว OpenZeppelin ยังพบข้อผิดพลาดข้อเท็จจริงที่เฉพาะเจาะจงมากขึ้น พวกเขาประเมินช่องโหว่อย่างน้อย 4 ช่องโหว่ที่จัดอยู่ในประเภทที่มีความเสี่ยงสูงโดย EVMbench และพบว่าไม่มีอยู่จริง และที่สําคัญกว่านั้น ช่องโหว่ที่อธิบายไว้นั้นไม่ได้ผล
“สิ่งเหล่านี้ไม่ใช่ความแตกต่างของความรุนแรงตามอัตวิสัย แต่พบว่าช่องโหว่ที่อธิบายไว้ไม่ได้ผล” OpenZeppelin กล่าว หากตัวแทน AI “พบ” ช่องโหว่หลอกเหล่านี้ในการทดสอบ แสดงว่าระบบการให้คะแนนให้รางวัลแก่ผลลัพธ์ที่ไม่ถูกต้อง
OpenZeppelin เน้นย้ําว่าการตรวจสอบนี้ไม่ได้เป็นการปฏิเสธศักยภาพของ AI ในความปลอดภัยของบล็อกเชน: “คําถามไม่ใช่ว่า AI จะเปลี่ยนความปลอดภัยของสัญญาอัจฉริยะหรือไม่ แต่จะเป็นอย่างแน่นอน คําถามคือข้อมูลและเกณฑ์มาตรฐานที่เราใช้ในการสร้างและประเมินเครื่องมือเหล่านี้เป็นไปตามมาตรฐานเดียวกับสัญญาที่ออกแบบมาเพื่อปกป้องหรือไม่”
OpenZeppelin พบปัญหาหลักสองประการ: ประการแรก มลพิษของข้อมูลการฝึกอบรม ช่องโหว่ในการทดสอบ EVMbench จากรายงานการตรวจสอบตั้งแต่กลางปี 2024 ถึง 2025 ทับซ้อนกับกําหนดเวลาการฝึกอบรมโมเดล AI โมเดลเหล่านี้อาจ “เห็น” คําตอบในการฝึกอบรมล่วงหน้า ประการที่สอง การจําแนกประเภทช่องโหว่ที่มีความเสี่ยงสูงอย่างน้อย 4 ประเภทเป็นการปลอมแปลงที่ไม่ถูกต้อง และวิธีการโจมตีที่อธิบายไว้นั้นไม่สามารถทําได้จริง
หากโมเดล AI ได้รับรายงานช่องโหว่ที่เปรียบเทียบในการฝึกอบรมล่วงหน้า โมเดล AI อาจ “ตอบ” คําถามในหน่วยความจํามากกว่าความสามารถในการค้นพบช่องโหว่ที่แท้จริง สิ่งนี้ทําให้การประเมินทั้งหมดสูญเสียความหมายของ “การทดสอบความรู้เป็นศูนย์” และไม่สามารถสะท้อนถึงความสามารถในการตรวจสอบความปลอดภัยที่แท้จริงของ AI ได้อย่างแท้จริงเมื่อต้องเผชิญกับสัญญาอัจฉริยะใหม่และไม่รู้จัก
OpenZeppelin ชี้แจงอย่างชัดเจนว่า AI จะส่งผลกระทบอย่างมากต่อความปลอดภัยของสัญญาอัจฉริยะ แต่เน้นย้ําว่าผลกระทบนี้ต้องขึ้นอยู่กับวิธีการที่น่าเชื่อถือและการประเมินที่ถูกต้อง พวกเขาเชื่อว่าปัญหาของ EVMbench ไม่ใช่สัญญาณให้ปฏิเสธ AI แต่เป็นคําเตือนที่สําคัญต่อมาตรฐานอุตสาหกรรม
btc.bar.articles
SANAE TOKEN ล่ม! โยชนา โทโมเอะปฏิเสธการสนับสนุนเหรียญการเมือง ผู้สร้างเหรียญถูกวิพากษ์วิจารณ์อย่างหนักในญี่ปุ่น
Curve:กำลังตรวจสอบเหตุการณ์โจมตีในตลาด sDOLA LlamaLend ผู้ให้กู้ไม่ได้รับผลกระทบ
Neutron เปิดเผยว่าพบช่องโหว่และได้ระงับฟังก์ชันต่าง ๆ เช่น สมุดคำสั่งซื้อ คาดว่าจะเปิดใช้งานอีกครั้งในวันที่ 9 มีนาคม
AIXBT(aixbt)24ชั่วโมงเพิ่มขึ้น 16.20%
การหลอกลวงด้วยสกุลเงินดิจิทัลหันไปใช้แอปพลิเคชันหาคู่ 32.7 ล้านดอลลาร์สหรัฐ USDT ถูกยึดทรัพย์