Arsitektur DeepSeek V4 Terverifikasi: 3 dari 4 Prediksi Tepat, Modul Engram Tidak Ada

Pesan Berita Gate, 24 April — DeepSeek merilis kartu model V4 hari ini, memvalidasi prediksi arsitektur sebelumnya yang dibuat melalui analisis pustaka kernel TileKernels yang dirilis kemarin (April 23). Menurut pemantauan oleh Beating, tiga komponen inti telah dikonfirmasi: mHC (Manifold-Constrained Hyper-Connections) menggantikan HyperConnection asli ByteDance, arsitektur MoE dengan routing pakar Top-k, dan penyimpanan bobot mixed-precision FP4+FP8. Modul memori kondisional Engram yang diprediksi tidak muncul di kartu model.

Kartu model mengungkapkan komponen baru yang tidak tercakup dalam TileKernels: mekanisme perhatian hibrida (CSA + HCA) mendorong peningkatan efisiensi konteks panjang V4, mengurangi FLOPs inferensi menjadi hanya 27% dari level V3.2 pada jendela konteks 1M, dan KV cache menjadi 10%. Pelatihan kini menggunakan pengoptimal Muon.

Verifikasi ini menunjukkan bagaimana implementasi kernel tingkat produksi dapat mengungkap arsitektur model yang mendasari sebelum spesifikasi resmi diterbitkan.

Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke Penafian.

Artikel Terkait

AI apa yang paling menonjol untuk menunjukkan status dan kedudukan? Riset mengungkap pendapatan pengguna Claude jauh lebih tinggi daripada pesaing, Meta AI ada di posisi terbawah

Survei oleh Epoch AI menunjukkan bahwa pengguna Claude sebagian besar berasal dari kelompok berpendapatan tinggi, dengan 80% berpenghasilan tahunan di atas 100.000 dolar AS; distribusi pendapatan Meta AI paling luas, dengan 36,5% di atas 100.000, sementara proporsi berpendapatan rendah adalah yang tertinggi; harga Claude naik dan menerapkan penagihan bertingkat, sehingga biaya mungkin meningkat, sedangkan Meta lebih mudah untuk masuk. AI mana yang mungkin menjadi label identitas terselubung di masa depan.

ChainNewsAbmedia1menit yang lalu

V4-Pro Mencapai Tingkat Lolos Kode 67% dalam Uji Dogfooding Internal, Mendekati Performa Opus 4.5

Pesan Berita Gate, 24 April — V4 telah mengungkapkan secara publik data internal dogfooding untuk model V4-Pro-nya. Perusahaan mengumpulkan sekitar 200 tugas rekayasa dunia nyata dari lebih dari 50 insinyur, mencakup pengembangan fitur, perbaikan bug, refactoring, dan diagnostik di berbagai tumpukan teknologi termasuk

GateNews15menit yang lalu

UK Menyoroti AI Anthropic untuk Memperkuat Keamanan Siber Perbankan

Inggris Raya sedang menjajaki langkah besar dalam keamanan siber keuangan dengan bekerja sama dengan perusahaan AI Anthropic. Pembahasan awal menunjukkan bahwa pemerintah mungkin akan menerapkan model Claude Mythos canggih dari Anthropic di seluruh bank dan institusi keuangan. Langkah ini bertujuan untuk meningkatkan pertahanan karena ancaman siber

CryptometerIo20menit yang lalu

Kantor Kekayaan Intelektual Tiongkok Menambahkan AI, Semikonduktor, dan Antarmuka Otak-Komputer ke Program Perlindungan Jalur Cepat

Pesan Berita Gate, 24 April — Administrasi Kekayaan Intelektual Nasional Tiongkok mengumumkan pada 24 April bahwa pihaknya akan membangun perlindungan kekayaan intelektual yang komprehensif untuk teknologi yang berkembang melalui reformasi institusional, layanan yang ditingkatkan, dan perluasan penerapan. Administrasi tersebut wi

GateNews27menit yang lalu

Pemerintah AS Mengoperasikan Node Bitcoin Tanpa Penambangan, Indikasi Admiral

Seorang laksamana senior telah mengindikasikan bahwa Pemerintah AS secara aktif mengoperasikan sebuah node di jaringan Bitcoin sambil dengan sengaja menghindari partisipasi dalam aktivitas penambangan. Pengungkapan tersebut menunjukkan bahwa otoritas mengambil peran yang lebih terlibat dalam infrastruktur blockchain untuk pengawasan dan

CryptoFrontier43menit yang lalu

Pendapatan Tesla Kuartal I Naik 16% menjadi $22,4B; Robot Humanoid Rencananya Debut pada Pertengahan 2026

Berita Pintu Gerbang, 24 April — Tesla melaporkan pendapatan kuartal pertama sebesar US$22,4 miliar pada 23 April, yang mencerminkan kenaikan 16% dari tahun ke tahun. Pengiriman kendaraan global perusahaan melebihi 358.000 unit, sementara produksinya mencapai lebih dari 408.000 unit. Pabrik Gigafactory Shanghai Tesla mengirimkan 213.000 vehicl

GateNews43menit yang lalu
Komentar
0/400
Tidak ada komentar