Makalah terbaru dari DeepSeek mengusulkan sistem inferensi DualPath, meningkatkan throughput beban agen hampir dua kali lipat

PANews melaporkan pada 27 Februari bahwa dalam keinginan industri untuk generasi baru model unggulan DeepSeek V4, tim DeepSeek diam-diam merilis makalah akademis baru. Makalah baru ini memperkenalkan sistem inferensi inovatif yang disebut DualPath, yang secara khusus dioptimalkan untuk kinerja inferensi model besar (LLM) di bawah beban kerja agen. Dengan memperkenalkan mekanisme “KV-Cache baca jalur ganda (mirip dengan cache memori)” untuk mendistribusikan kembali beban jaringan penyimpanan, throughput inferensi offline meningkat hingga 1,87 kali, dan jumlah agen yang menjalankan layanan online per detik meningkat rata-rata 1,96 kali. Makalah ini menyebutkan dalam pendahuluan bahwa model besar berkembang pesat dari robot percakapan putaran tunggal dan model penalaran independen menjadi sistem agen yang dapat secara mandiri merencanakan, memanggil alat, dan menyelesaikan tugas-tugas praktis melalui beberapa putaran interaksi. Pergeseran paradigma aplikasi ini telah mendorong perubahan besar dalam beban kerja inferensi model besar: dari interaksi model manusia-besar tradisional ke interaksi model-lingkungan manusia-besar, putaran interaksi dapat mencapai puluhan atau bahkan ratusan putaran.

Lihat Asli
Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke Penafian.
Komentar
0/400
Tidak ada komentar
Perdagangkan Kripto Di Mana Saja Kapan Saja
qrCode
Pindai untuk mengunduh aplikasi Gate
Komunitas
Bahasa Indonesia
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)