تقدم الورقة الجديدة لـ DeepSeek نظام استنتاج DualPath، حيث يقترب حجم تحميل الوكيل من الضعف

ذكرت صحيفة PANews في 27 فبراير أنه في حماس الصناعة للجيل الجديد من الطرازات الرائدة DeepSeek V4، أصدرت فريق DeepSeek بهدوء ورقة أكاديمية جديدة. تقدم الورقة الجديدة نظام استدلال مبتكر يسمى DualPath، وهو محسن خصيصا لأداء الاستدلال الكبير (LLM) تحت أعباء عمل الوكلاء. من خلال إدخال آلية “KV-Cache للقراءة ذات المسار المزدوج (مشابهة لذاكرة التخزين المؤقت)” لإعادة توزيع حمل شبكة التخزين، يزداد معدل الاستدلال غير المتصلة بالإنترنت بنسبة تصل إلى 1.87 مرة، ويزداد عدد الوكلاء العاملين في الثانية من الخدمات عبر الإنترنت بمعدل 1.96 مرة في المتوسط. تذكر الورقة في المقدمة أن النماذج الكبيرة تتطور بسرعة من روبوتات حوارية ذات جولة واحدة ونماذج التفكير المستقل إلى أنظمة وكلاء يمكنها التخطيط بشكل مستقل، واستدعاء الأدوات، وحل المهام العملية من خلال جولات تفاعل متعددة. هذا التحول في نموذج التطبيق أدى إلى تغيير كبير في أعباء عمل الاستدلال النموذجي الكبير: من التفاعل التقليدي بين الإنسان والنموذج الكبير إلى تفاعل الإنسان والنموذج الكبير في البيئة، يمكن أن تصل جولة التفاعل إلى عشرات أو حتى مئات الجولات.

شاهد النسخة الأصلية
إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة من مصادر خارجية ولا تمثل آراء أو مواقف Gate. المحتوى المعروض في هذه الصفحة هو لأغراض مرجعية فقط ولا يشكّل أي نصيحة مالية أو استثمارية أو قانونية. لا تضمن Gate دقة أو اكتمال المعلومات، ولا تتحمّل أي مسؤولية عن أي خسائر ناتجة عن استخدام هذه المعلومات. تنطوي الاستثمارات في الأصول الافتراضية على مخاطر عالية وتخضع لتقلبات سعرية كبيرة. قد تخسر كامل رأس المال المستثمر. يرجى فهم المخاطر ذات الصلة فهمًا كاملًا واتخاذ قرارات مدروسة بناءً على وضعك المالي وقدرتك على تحمّل المخاطر. للتفاصيل، يرجى الرجوع إلى إخلاء المسؤولية.
تعليق
0/400
لا توجد تعليقات