Anthropic mengungkapkan generasi terbaru model AI-nya pada konferensi pengembang di pertengahan Mei 2025, memperkenalkan Claude Opus 4 dan Claude Sonnet 4 sebagai tambahan yang kuat untuk rangkaian modelnya. Di antara rilis ini, Sonnet 4 dengan cepat menarik perhatian karena hasil benchmark yang mengesankan dan kemampuan praktisnya, memperkuat posisi Anthropic di lanskap AI yang kompetitif.
Benchmark Kinerja: Sonnet 4 Mencapai Hasil Terobosan
Model Sonnet 4 yang baru mencapai skor 72,7% pada set validasi SWE-bench, sebuah pencapaian signifikan yang melampaui model o3 dan Codex-1 dari OpenAI. Dalam mode komputasi tinggi, flagship Opus 4 mencapai tingkat kinerja yang lebih tinggi lagi di angka 79,4%, menetapkannya sebagai solusi pemrograman otomatis terdepan di dunia. Metode ini menunjukkan komitmen Anthropic dalam mengembangkan kemampuan generasi kode otomatis. Yang menarik, performa kompetitif Sonnet 4 menempatkannya di antara model-model top-tier dalam kategori ini, menjadikannya pilihan yang tangguh bagi pengembang yang mencari bantuan pemrograman yang kuat.
Kapabilitas Operasional Ekstensi dan Rekor Industri
Pengujian independen dari Rakuten mengungkapkan bahwa Opus 4 dapat menjalankan tugas pemrograman selama hingga 7 jam secara terus-menerus sambil mempertahankan stabilitas dan menangani tantangan yang semakin kompleks. Kemampuan runtime yang diperpanjang ini memecahkan benchmark industri yang ada dan membuka kemungkinan baru untuk alur kerja pengembangan sesi panjang. Generasi model terbaru ini memperkenalkan penggunaan alat paralel dan mekanisme memori yang ditingkatkan, memungkinkan operasi yang lebih canggih dan terkoordinasi dibandingkan iterasi sebelumnya.
Akses yang Diperluas dan Integrasi Pengembang
Anthropic telah menjadikan Claude Code sepenuhnya tersedia bagi komunitas pengembang, mendemokratisasi akses ke alat pemrograman AI tingkat lanjut. Ekspansi ini memungkinkan pengembang memanfaatkan kemampuan Sonnet 4 dalam alur kerja pengembangan terintegrasi mereka, mendorong adopsi solusi otomatisasi pemrograman yang lebih luas di seluruh industri.
Peluncuran Sonnet 4 dan model sejenisnya menandai momen penting dalam pengembangan berbantuan AI, dengan Sonnet 4 memainkan peran sentral dalam menunjukkan bagaimana model bahasa modern dapat mengatasi tantangan pemrograman yang kompleks dalam skala yang belum pernah terjadi sebelumnya.
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
Claude Sonnet 4 Menetapkan Standar Kinerja Baru dalam Pemrograman AI Tingkat Lanjut
Anthropic mengungkapkan generasi terbaru model AI-nya pada konferensi pengembang di pertengahan Mei 2025, memperkenalkan Claude Opus 4 dan Claude Sonnet 4 sebagai tambahan yang kuat untuk rangkaian modelnya. Di antara rilis ini, Sonnet 4 dengan cepat menarik perhatian karena hasil benchmark yang mengesankan dan kemampuan praktisnya, memperkuat posisi Anthropic di lanskap AI yang kompetitif.
Benchmark Kinerja: Sonnet 4 Mencapai Hasil Terobosan
Model Sonnet 4 yang baru mencapai skor 72,7% pada set validasi SWE-bench, sebuah pencapaian signifikan yang melampaui model o3 dan Codex-1 dari OpenAI. Dalam mode komputasi tinggi, flagship Opus 4 mencapai tingkat kinerja yang lebih tinggi lagi di angka 79,4%, menetapkannya sebagai solusi pemrograman otomatis terdepan di dunia. Metode ini menunjukkan komitmen Anthropic dalam mengembangkan kemampuan generasi kode otomatis. Yang menarik, performa kompetitif Sonnet 4 menempatkannya di antara model-model top-tier dalam kategori ini, menjadikannya pilihan yang tangguh bagi pengembang yang mencari bantuan pemrograman yang kuat.
Kapabilitas Operasional Ekstensi dan Rekor Industri
Pengujian independen dari Rakuten mengungkapkan bahwa Opus 4 dapat menjalankan tugas pemrograman selama hingga 7 jam secara terus-menerus sambil mempertahankan stabilitas dan menangani tantangan yang semakin kompleks. Kemampuan runtime yang diperpanjang ini memecahkan benchmark industri yang ada dan membuka kemungkinan baru untuk alur kerja pengembangan sesi panjang. Generasi model terbaru ini memperkenalkan penggunaan alat paralel dan mekanisme memori yang ditingkatkan, memungkinkan operasi yang lebih canggih dan terkoordinasi dibandingkan iterasi sebelumnya.
Akses yang Diperluas dan Integrasi Pengembang
Anthropic telah menjadikan Claude Code sepenuhnya tersedia bagi komunitas pengembang, mendemokratisasi akses ke alat pemrograman AI tingkat lanjut. Ekspansi ini memungkinkan pengembang memanfaatkan kemampuan Sonnet 4 dalam alur kerja pengembangan terintegrasi mereka, mendorong adopsi solusi otomatisasi pemrograman yang lebih luas di seluruh industri.
Peluncuran Sonnet 4 dan model sejenisnya menandai momen penting dalam pengembangan berbantuan AI, dengan Sonnet 4 memainkan peran sentral dalam menunjukkan bagaimana model bahasa modern dapat mengatasi tantangan pemrograman yang kompleks dalam skala yang belum pernah terjadi sebelumnya.