สาระสำคัญ
OpenAI ได้เปิดตัว EVMbench ระบบทดสอบมาตรฐานใหม่ที่พัฒนาร่วมกับ Paradigm เพื่อทดสอบว่าโมเดล AI ขั้นสูงสามารถตรวจจับ แก้ไข และใช้ช่องโหว่ในสมาร์ทคอนแทรกต์ของ Ethereum ได้อย่างไร
ผลลัพธ์เบื้องต้นเผยให้เห็น “ช่องว่างการโจมตี” ซึ่งโมเดลชั้นนำในปัจจุบันทำได้ดีกว่าการตรวจสอบและแก้ไขข้อผิดพลาดอย่างครอบคลุม — เน้นให้เห็นความก้าวหน้าของ AI อย่างรวดเร็วและความเสี่ยงที่กำลังเกิดขึ้น
EVMbench อาจเปลี่ยนแนวมาตรฐานด้านความปลอดภัยในคริปโตเคอเรนซี ช่วยให้สามารถทำการตรวจสอบด้วย AI อย่างต่อเนื่องสำหรับทีม DeFi และให้ความมั่นใจระดับสถาบันในขณะที่ทรัพย์สินมูลค่าหลายพันล้านเคลื่อนเข้าสู่บนเครือข่าย
ในความร่วมมือครั้งสำคัญระหว่างปัญญาประดิษฐ์และเทคโนโลยีบล็อกเชน OpenAI ได้เปิดตัวอย่างเป็นทางการ EVMbench ซึ่งพัฒนาขึ้นในความร่วมมือเชิงกลยุทธ์กับยักษ์ใหญ่ด้านการลงทุนคริปโต Paradigm ระบบนี้ออกแบบมาเพื่อทดสอบอย่างเข้มงวดว่าเอเจนต์ AI สามารถระบุ ใช้ประโยชน์ และแก้ไขช่องโหว่ในระบบนิเวศ Ethereum Virtual Machine (EVM) ได้อย่างไร
ด้วยมูลค่าทรัพย์สินคริปโตเปิดเผยในระบบสมาร์ทคอนแทรกต์มากกว่า 100 พันล้านดอลลาร์ ความเสี่ยงจึงไม่เคยสูงเท่านี้ EVMbench เป็นการเปลี่ยนแปลงเชิงรุกในการใช้ “โมเดลแนวหน้า” เพื่อป้องกัน DeFi จากภัยคุกคามทางไซเบอร์ที่ซับซ้อนขึ้นเรื่อยๆ
แหล่งข้อมูล: openai
EVMbench ก้าวข้ามการวิเคราะห์โค้ดแบบคงที่โดยประเมินเอเจนต์ AI ในสามโหมดการทำงานที่มีความเสี่ยงสูงสุด กระบวนการ “ตรวจจับ-แก้ไข-ใช้ประโยชน์” นี้เลียนแบบเวิร์กโฟลว์ของนักวิจัยด้านความปลอดภัยชั้นนำในโลกจริง
1. โหมดตรวจจับ (The Auditor): เอเจนต์สแกนรีโพซิทอรีโค้ดซับซ้อนเพื่อค้นหาข้อผิดพลาดที่ซ่อนอยู่ ความสำเร็จวัดจาก “การนึกถึง” — ความสามารถในการค้นหาปัญหา “ความจริงพื้นฐาน” — และรางวัลจากบั๊กบอนนี่ในสถานการณ์จำลอง
2. โหมดแก้ไข (The Engineer): เมื่อพบบั๊กแล้ว เอเจนต์ต้องเขียนโค้ดใหม่ ระบบจะใช้ชุดทดสอบอัตโนมัติเพื่อให้แน่ใจว่าการแก้ไขนั้นสามารถปิดช่องโหว่โดยไม่ทำลายฟังก์ชันเดิมของสัญญา
3. โหมดใช้ประโยชน์ (The Adversary): ใน sandbox ที่ปลอดภัยและแยกออกจากกัน Anvil เอเจนต์พยายามดำเนินการโจมตีแบบ end-to-end เพื่อระบายเงินทุน ซึ่งวัดความสามารถในการวางแผนโจมตีและ “เชื่อมโยง” ข้อผิดพลาดเล็กน้อยเป็นการละเมิดที่รุนแรง
แหล่งข้อมูล: openai
EVMbench ไม่ได้อิงกับปริศนาทางทฤษฎี แต่สร้างจากคลังข้อมูลที่คัดสรรมาแล้วของ 120 ช่องโหว่รุนแรงสูง ที่รวบรวมจาก 40 การตรวจสอบเชิงมือระดับมืออาชีพ ข้อมูลส่วนใหญ่มาจากการแข่งขันตรวจสอบโค้ดในโลกจริง (เช่น Code4rena) และกระบวนการด้านความปลอดภัยภายในของ Paradigm’s Tempo blockchain
โดยเน้นไปที่ “สมาร์ทคอนแทรกต์ที่เน้นการชำระเงิน” ระบบนี้จึงมั่นใจว่าโมเดล AI ได้รับการทดสอบในด้านโค้ดที่จัดการกับเงินทุนหมุนเวียนหลายพันล้าน
การทดสอบภายในของ OpenAI เผยให้เห็นความสามารถของ AI ที่เร่งตัวขึ้นอย่างน่าตกใจ ในเวลาเพียงไม่กี่เดือน โมเดลชั้นนำพัฒนาจากการลำบากกับตรรกะพื้นฐาน ไปสู่การดำเนินการโจมตีซับซ้อนหลายขั้นตอน
“ช่องว่างการโจมตี”: ที่น่าสนใจคือ เอเจนต์ในปัจจุบันทำได้ดีกว่ามากในการ ใช้ประโยชน์ (72.2%) มากกว่าการ ตรวจจับ หรือ แก้ไข นักวิจัยของ OpenAI สังเกตว่า เอเจนต์เก่งเมื่อได้รับเป้าหมายชัดเจน เช่น “ระบายเงิน” แต่ต้องการการวิเคราะห์ที่ละเอียดขึ้นเพื่อจัดการกับงานที่ซับซ้อนและมีรายละเอียดสูง เช่น การตรวจสอบอย่างละเอียดถี่ถ้วน
แหล่งข้อมูล: Openai
สำหรับระบบนิเวศคริปโตโดยรวม EVMbench ไม่ใช่แค่คะแนนวัดผล แต่เป็นตัวเร่งให้เกิด “ความปลอดภัยแบบซ้าย” — การบูรณาการการตรวจสอบระดับสูงเข้าไปในกระบวนการเขียนโค้ดโดยไม่รอให้เกิดการตรวจสอบหลังการใช้งาน
ความปลอดภัยแบบเสรี: ทีม DeFi ขนาดเล็กที่ไม่สามารถจ้างตรวจสอบด้วยตนเองมูลค่า 200,000 ดอลลาร์ สามารถใช้เอเจนต์ AI ที่ได้รับการรับรองจาก EVMbench สำหรับการตรวจสอบโค้ดอย่างต่อเนื่องและแม่นยำสูง
ความพร้อมของสถาบัน: ขณะที่ยักษ์ใหญ่อย่าง Goldman Sachs และ Franklin Templeton ย้ายเข้าสู่บนเครือข่าย พวกเขาต้องการ “มาตรฐานทองคำ” ของการบริหารจัดการ AI ที่สามารถวัดผลได้ตามมาตรฐาน
ความท้าทายแบบสองด้าน: ด้วยการเปิดซอร์สมาตรฐานนี้ OpenAI และ Paradigm กำลังให้เครื่องมือแก่ “คนดี” เพื่อวัดและแซงหน้า “คนร้าย” พร้อมทั้งสร้างกรอบ “การเข้าถึงที่เชื่อถือได้สำหรับ Cyber” เพื่อเฝ้าระวังความเสี่ยงที่เกิดขึ้นใหม่
แม้ว่า EVMbench จะเป็นก้าวสำคัญที่ปฏิวัติวงการ แต่ในปัจจุบันยังจำกัดอยู่ในสภาพแวดล้อมแบบ deterministic และ sandbox คาดว่าเวอร์ชันในอนาคตจะรวม ความขึ้นต่อกันหลายเชน และ MEV (Maximal Extractable Value) เพื่อจำลอง “Dark Forest” ของ mainnet Ethereum อย่างสมจริงมากขึ้น
เมื่อเอเจนต์ AI เปลี่ยนจาก “เขียนโค้ด” เป็น “รักษาเศรษฐกิจ” EVMbench จึงเป็นเกณฑ์วัดผลที่ชัดเจนสำหรับอนาคตของการเงินแบบไร้ความเชื่อถือ
คำเตือน: มุมมองและการวิเคราะห์ในบทความนี้เป็นข้อมูลเพื่อการให้ข้อมูลเท่านั้น ไม่ใช่คำแนะนำด้านการเงิน รูปแบบทางเทคนิคและตัวชี้วัดที่กล่าวถึงอาจมีความผันผวนของตลาดและอาจไม่ได้ผลตามคาด นักลงทุนควรระมัดระวัง ทำการวิจัยด้วยตนเอง และตัดสินใจตามความเสี่ยงที่ยอมรับได้
เกี่ยวกับผู้เขียน: Nilesh Hembade เป็นผู้ก่อตั้งและหัวหน้าบรรณาธิการของ Coinsprobe ด้วยประสบการณ์มากกว่า 5 ปีในอุตสาหกรรมคริปโตและบล็อกเชน ตั้งแต่เปิดตัว Coinsprobe ในปี 2023 เขาให้ข้อมูลเชิงลึกรายวันผ่านการวิเคราะห์ตลาดเชิงลึก ข้อมูลบนเชน และการวิจัยเชิงเทคนิค