Turnamen Catur LLM selesai: OpenAI o3 meraih juara, xAI Grok 4 tidak memenangkan satu pun papan dan kalah total.

動區BlockTempo
XAI4,39%
GROK6,58%

Turnamen Catur Internasional Kaggle AI berakhir, dan o3 yang tidak terlatih mengalahkan Grok 4 4-0, menunjukkan kemampuan penalaran yang kuat. (Sinopsis: Musk mengancam akan menuntut Apple: Peringkat App Store memiliki perilaku monopoli, dengan jahat menekan Ggrok) (Suplemen latar belakang: Grok 4 dibuka untuk penggunaan gratis hari ini, Musk xAI dan GPT-5 saling berhadapan) Baru-baru ini, Kaggle Google mengadakan “Pertandingan Pameran Catur Kecerdasan Buatan” mengumumkan hasilnya pada 14 Agustus, model bahasa besar serba guna OpenAI o3 menyapu Grok 4 xAI dengan 4:0 untuk memenangkan kejuaraan, dan menjadi LLM pertama yang menyelesaikan lawan tanpa pelatihan khusus. Sebanyak 8 tim AI berpartisipasi dalam acara tersebut selama tiga hari, dan sistem gugur diputuskan. Sorotan Kompetisi Model Bahasa Menurut laporan OpenTools.ai, O3 menyerahkan finis 4:0 dalam tiga game berturut-turut dalam proses maju sepenuhnya, dan menyingkirkan O4 mini ringannya sendiri di semifinal. Sebaliknya, Grok 4 sering memimpin pada satu titik di set awal, tetapi “kalah” berkali-kali di akhir acara (mengorbankan Ratu yang paling dapat ditindaklanjuti). Grandmaster catur Hikaru Nakamura berkomentar bahwa o3 memiliki “sangat sedikit kesalahan” dan menunjukkan bahwa Grok 4 sering mengalami peledakan diri taktis. Mantan juara dunia Magnus Carlsen menggambarkan gaya catur Grok seperti menonton seorang anak bermain catur. Dia memperkirakan bahwa Elo Grok adalah sekitar 800 dan O3 adalah sekitar 1200, jauh di bawah AI catur manusia atau khusus teratas. Elo: Sistem penilaian profesional (bahasa Inggris: Elo rating system) mengacu pada metode evaluasi yang dibuat oleh fisikawan Hungaria-Amerika Arpad Elo untuk mengukur tingkat berbagai aktivitas permainan, yang merupakan standar otoritatif yang diakui untuk evaluasi tingkat permainan saat ini, dan banyak digunakan dalam catur, Go, sepak bola, bola basket, dan olahraga lainnya. Skor tertinggi untuk Chess Elo ditetapkan oleh Magnus Carlsen dengan 2882 poin. AI tujuan umum bergulat dengan AI khusus Sistem khusus seperti Stockfish telah lama memegang sekitar 3644 Elo berdasarkan pencarian mendalam dan penilaian domain. LLM tujuan umum belajar melalui korpus lintas domain skala besar, dan bermain catur hanyalah perpanjangan dari kemampuan penalaran. Meskipun o3 mampu mengalahkan Grok 4, masih kalah dari Stockfish awal tahun ini, menunjukkan bahwa model umum masih memiliki celah dalam stabilitas dan kedalaman inferensi dalam permainan catur. Laporan terkait Berjudi di OpenAI, Son Masayoshi “berbalik” lagi Pengembang Ethereum menginstal “plugin AI berbahaya” diretas, dompet terenkripsi dikosongkan dalam tiga hari, dan sepuluh tahun pengalaman keamanan informasi tidak berguna a16z Wawasan terbaru: e-commerce tradisional sudah mati? Platform asli AI mendefinisikan ulang masalah “berbelanja” “Turnamen catur LLM berakhir: OpenAI o3 menang, xAI Grok 4 ditutup tanpa menang” Artikel ini pertama kali diterbitkan di “Tren Dinamis - Media Berita Blockchain Paling Berpengaruh” dari BlockTempo.

Lihat Asli
Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke Penafian.
Komentar
0/400
Tidak ada komentar
Perdagangkan Kripto Di Mana Saja Kapan Saja
qrCode
Pindai untuk mengunduh aplikasi Gate
Komunitas
Bahasa Indonesia
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)