LLMการแข่งขันหมากรุกเสร็จสิ้น: OpenAI o3 คว้าชัยชนะ, xAI Grok 4 ไม่ชนะเลยแม้แต่เกมเดียวถูกปิดเกม

動區BlockTempo
XAI7.53%
GROK6.64%

Kaggle AI การแข่งขันหมากรุกนานาชาติสิ้นสุดลง โดย o3 ที่ไม่ได้รับการฝึกฝนเป็นพิเศษชนะ Grok 4 ด้วยคะแนน 4-0 แสดงให้เห็นถึงความสามารถในการอนุมานที่แข็งแกร่งมาก (ข้อมูลเบื้องต้น: มัสก์ประกาศว่าจะฟ้องแอปเปิล: การจัดอันดับใน App Store มีพฤติกรรมผูกขาดและกดดัน Grok อย่างชัดเจน) (ข้อมูลเพิ่มเติม: Grok 4 เปิดให้ใช้งานฟรีในวันนี้ มัสก์ xAI และ GPT-5 สู้กันตรง ๆ) เมื่อเร็ว ๆ นี้ Google ภายใต้ Kaggle ได้จัดการแข่งขัน “การแสดงหมากรุกด้วยปัญญาประดิษฐ์” โดยประกาศผลในวันที่ 14 สิงหาคม OpenAI โมเดลภาษาขนาดใหญ่ทั่วไป o3 เอาชนะ xAI ของ Grok 4 ด้วยคะแนน 4:0 คว้าแชมป์และกลายเป็น LLM ตัวแรกที่เคลียร์คู่ต่อสู้ได้โดยไม่ต้องฝึกฝนเป็นพิเศษ การแข่งขันมี AI ทั้งหมด 8 ทีม เข้าร่วมเป็นเวลา 3 วัน โดยใช้ระบบการคัดเลือกแบบแพ้คัดออก จุดเด่นของการแข่งขันโมเดลภาษา ตามรายงานจาก OpenTools.ai o3 ในระหว่างการเข้าสู่รอบได้แสดงผลการคว้า 4:0 ติดต่อกันสามนัด ในรอบรองชนะเลิศยังเอาชนะ o4 mini รุ่นเบาของตนเองอีกด้วย ขณะที่ Grok 4 มักจะนำในรอบแรก แต่ในช่วงท้ายของการแข่งขันได้ “เสียหลัง” หลายครั้ง (สละ Queen ซึ่งมีพลังการเคลื่อนไหวสูงสุด) ผู้เล่นหมากรุกระดับแกรนด์มาสเตอร์ Hikaru Nakamura ได้ประเมิน o3 ว่า “ผิดพลาดน้อยมาก” และชี้ว่า Grok 4 มักจะเกิดการระเบิดทางยุทธศาสตร์ ก่อนหน้านี้แชมป์โลก Magnus Carlsen ได้บรรยายถึงสไตล์การเล่นของ Grok ว่า เหมือนกับการดูเด็กเล่นหมากรุก เขาประเมินว่า Elo ของ Grok อยู่ที่ประมาณ 800 และ o3 ประมาณ 1200 ซึ่งต่ำกว่ามนุษย์ระดับสูงสุดหรือ AI ที่เชี่ยวชาญด้านหมากรุกมาก Elo: เป็นระบบจัดอันดับระดับมืออาชีพ (ภาษาอังกฤษ: Elo rating system) ที่สร้างขึ้นโดยนักฟิสิกส์อเมริกันเชื้อสายฮังการี Arpad Elo ซึ่งเป็นวิธีการประเมินระดับกิจกรรมการแข่งประเภทต่าง ๆ ที่ได้รับการยอมรับว่าเป็นมาตรฐานที่มีอำนาจในปัจจุบัน และถูกนำไปใช้กันอย่างแพร่หลายในการเล่นหมากรุก, หมากล้อม, ฟุตบอล, บาสเกตบอล และกีฬาอื่น ๆ คะแนนสูงสุดในหมากรุก Elo ถูกทำลายโดย Magnus Carlsen ที่ 2882 คะแนน AI ทั่วไปและ AI ที่เชี่ยวชาญต่อสู้กัน ระบบที่เชี่ยวชาญอย่าง Stockfish ขึ้นอยู่กับการค้นหาลึกและการให้คะแนนในด้านต่าง ๆ โดยมี Elo ประมาณ 3644 ในระยะยาว ขณะที่ LLM ทั่วไปเรียนรู้จากข้อมูลข้ามสาขาขนาดใหญ่ การเล่นหมากรุกเป็นเพียงการขยายความสามารถในการอนุมาน แม้ว่า o3 จะสามารถเอาชนะ Grok 4 ได้ แต่เมื่อต้นปีนี้ก็ยังแพ้ Stockfish แสดงให้เห็นว่าโมเดลทั่วไปยังมีช่องว่างในด้านความเสถียรและการคำนวณเชิงลึกในเกมหมากรุก รายงานที่เกี่ยวข้อง การเดิมพันของ OpenAI, ซุนเจิ้งอี้ “กลับมาอีกครั้ง” นักพัฒนาที่ใช้ Ethereum ติดตั้ง “ปลั๊กอิน AI ที่เป็นอันตราย” ถูกแฮ็ก กระเป๋าเงินเข้ารหัสถูกเคลียร์ภายในสามวัน แม้จะมีประสบการณ์ด้านความปลอดภัยมากว่า 10 ปี a16z การวิเคราะห์ล่าสุด: อีคอมเมิร์ซแบบดั้งเดิมตายแล้ว? แพลตฟอร์มที่เป็นพื้นฐานของ AI กำลังนิยาม “การช็อปปิ้ง” ใหม่ 〈การแข่งขันหมากรุก LLM สิ้นสุดลง: OpenAI o3 คว้าแชมป์, xAI Grok 4 ไม่ชนะเลยถูกเคลียร์〉บทความนี้เผยแพร่ครั้งแรกใน BlockTempo “บล็อกเชนข่าวสารที่มีอิทธิพลที่สุด”

ดูต้นฉบับ
news.article.disclaimer
แสดงความคิดเห็น
0/400
ไม่มีความคิดเห็น