أطلقت DeepSeek رسميًا سلسلة المعاينة V4 في 24 أبريل، مع طرح أوزان النموذج مفتوحة المصدر بموجب ترخيص MIT، وقد تم رفع أوزان النماذج إلى كلٍّ من Hugging Face وModelScope. وفقًا للتقرير التقني الخاص بـ DeepSeek V4، حقق V4-Pro-Max (أقصى وضع قوة استدلال) 3206 نقطة في معيار Codeforces، متفوقًا على GPT-5.4.

مواصفات معماريتي MoE لنموذجين

وفقًا للتقرير التقني الخاص بـ DeepSeek V4، تتضمن سلسلة V4 نموذجين من نماذج الخبراء الهجين (MoE):

V4-Pro: إجمالي المعلمات 1.6T، تنشيط كل توكن 49B، يدعم سياقًا حتى 1M توكن

V4-Flash: إجمالي المعلمات 284B، تنشيط كل توكن 13B، يدعم كذلك سياقًا حتى 1M توكن

وفقًا للتقرير التقني، فإن استدلال FLOPs لكل توكن في سياق 1M لـ V4-Pro تبلغ 27% فقط من V3.2، كما انخفض مخبأ KV إلى 10% من V3.2. ويعود ذلك بشكل أساسي إلى ترقية معمارية آلية الانتباه الهجينة (CSA انتباه متناثر مضغوط + HCA انتباه مضغوط مكثّف). يتجاوز حجم بيانات ما قبل التدريب 32T توكن؛ وقد تم تحديث المُحسِّن التدريبي إلى Muon.

منهجية ما بعد التدريب: التقطير عبر الاستراتيجية المباشرة يحل محل التعلم المعزز الهجين

وفقًا للتقرير التقني الخاص بـ DeepSeek V4، تتمثل التحديثات الأساسية في ما بعد تدريب V4 في استبدال مرحلة التعلم المعزز الهجين (mixed RL) في V3.2 بالكامل بتقطير الاستراتيجية المباشرة (On-Policy Distillation، OPD). يتم تقسيم العملية الجديدة إلى خطوتين: أولاً، يتم تدريب خبراء مجال منفصلين (SFT + GRPO تعزيز تعلّمي) على مجالات مثل الرياضيات والبرمجة وAgent واتباع التعليمات؛ وبعد ذلك، يتم تقطير قدرات أكثر من عشرة خبراء إلى نموذج موحّد باستخدام مُقطِّر OPD متعدد المعلمين، مع محاذاة logit لتجنب تعارض القدرات الشائع في الطرق التقليدية.

كما يقدّم التقرير نموذج مكافأة توليدي (Generative Reward Model، GRM)، وذلك للمهام التي يصعب التحقق منها باستخدام القواعد؛ إذ يتم تدريب النموذج باستخدام كمية صغيرة ومتنوعة من بيانات التعليمات/الوسوم البشرية، ليقوم النموذج في الوقت نفسه بدور التوليد والتقييم.

نتائج الاختبار المعياري: التشفير يتقدم، لكن الاستدلال المعرفي لا يزال بفارق

وفقًا للتقرير التقني الخاص بـ DeepSeek V4، تأتي نتائج المقارنة بين V4-Pro-Max وOpus 4.6 Max وGPT-5.4 xHigh وGemini 3.1 Pro High (مع استبعاد GPT-5.5 وOpus 4.7 اللذين صدرَا مؤخرًا):

Codeforces: 3206 (GPT-5.4: 3168 / Gemini 3.1 Pro: 3052) → أعلى نتيجة في كامل المنافسة

LiveCodeBench: 93.5 → أعلى نتيجة في كامل المنافسة

SWE Verified: 80.6، متأخر عن Opus 4.6 البالغ 80.8 بفارق 0.2 نقطة مئوية

GPQA Diamond: 90.1، متأخر عن Gemini 3.1 Pro البالغ 94.3

SimpleQA-Verified: 57.9، متأخر عن Gemini 3.1 Pro البالغ 75.6

HLE: 37.7، متأخر عن Gemini 3.1 Pro البالغ 44.4

كما يشير التقرير التقني إلى أن المقارنات المذكورة أعلاه لا تتضمن GPT-5.5 وOpus 4.7 المنشورين مؤخرًا، وأن الفجوة بين V4 والنموذج المغلق من الجيل الأحدث بحاجة إلى تحقق من خلال تقييم طرف ثالث.

الأسئلة الشائعة

ما هي شروط ترخيص Open Source لنسخة معاينة DeepSeek V4، وأين يمكن الحصول عليها؟

وفقًا للإعلان الرسمي لـ DeepSeek في 24 أبريل، تُطرح سلسلة V4 كمصدر مفتوح بموجب ترخيص MIT، وتم رفع أوزان النموذج إلى Hugging Face وModelScope، وتُستخدم للأغراض التجارية والأكاديمية.

ما الاختلاف بين حجم معلمات DeepSeek V4-Pro وV4-Flash؟

وفقًا للتقرير التقني الخاص بـ DeepSeek V4، فإن إجمالي معلمات V4-Pro يبلغ 1.6T، وتنشيط كل توكن 49B؛ بينما إجمالي معلمات V4-Flash يبلغ 284B، وتنشيط كل توكن 13B. ويُشغّل كلا النموذجين سياقًا يصل إلى 1M توكن.

ما نتائج المقارنة المعيارية لـ DeepSeek V4-Pro-Max مع GPT-5.4 وGemini 3.1 Pro؟

وفقًا للتقرير التقني الخاص بـ DeepSeek V4، يتفوق V4-Pro-Max في معيار Codeforces (3206 نقطة) وLiveCodeBench (93.5) على GPT-5.4 وGemini 3.1 Pro، لكنه لا يزال متأخرًا عن Gemini 3.1 Pro في المعايير عالية الكثافة المعرفية (GPQA Diamond وSimpleQA-Verified وHLE)؛ كما أن مجموعة المقارنة لا تشمل GPT-5.5 وOpus 4.7.

إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة من مصادر خارجية ولا تمثل آراء أو مواقف Gate. المحتوى المعروض في هذه الصفحة هو لأغراض مرجعية فقط ولا يشكّل أي نصيحة مالية أو استثمارية أو قانونية. لا تضمن Gate دقة أو اكتمال المعلومات، ولا تتحمّل أي مسؤولية عن أي خسائر ناتجة عن استخدام هذه المعلومات. تنطوي الاستثمارات في الأصول الافتراضية على مخاطر عالية وتخضع لتقلبات سعرية كبيرة. قد تخسر كامل رأس المال المستثمر. يرجى فهم المخاطر ذات الصلة فهمًا كاملًا واتخاذ قرارات مدروسة بناءً على وضعك المالي وقدرتك على تحمّل المخاطر. للتفاصيل، يرجى الرجوع إلى إخلاء المسؤولية.

مقالات ذات صلة

前字节跳动 Seed 工程师：字节跳动 AI 迭代需要六个月，而谷歌是三个月

أخبار صناعة AI

Gate News 消息，4 月 24 日——字节跳动 Seed 团队的前工程师、现任北京大学助理教授张驰在播客“Into Asia”中透露，字节跳动完成一次完整的大型语言模型训练周期大约需要六个月 (预训练

GateNewsمنذ 14 د

OpenAI 工程师 Clive Chan 挑战 V4 硬件建议，称其相较 V3 存在错误与模糊之处

أخبار صناعة AI

Gate News 消息，4 月 24 日——OpenAI 工程师 Clive Chan 就 V4 技术报告中的硬件建议章节提出了详细反对意见，称其相较备受赞誉的 V3 版本“出人意料地平庸且容易出错”。V3 的硬件指导包含 Q&A 会议

GateNewsمنذ 46 د

نَافيـر تطلق النسخة التجريبية لميزة AI Tab بعد دخول Google Gemini إلى سوق البحث في كوريا الجنوبية

أخبار صناعة AI

رسالة أخبار جيت، 24 أبريل — أعلنت شركة نافيـر بدء النسخة التجريبية المغلقة لميزة AI Tab الجديدة، وهي ميزة بحث محادثي، وذلك بعد إطلاق جوجل لـ Gemini في كروم داخل كوريا الجنوبية. ستظهر AI Tab إلى جانب تبويبات البحث الحالية لدى نافيـر، لتوفير مساحة مخصصة للمستخدمين لاستعلامات محادثية

GateNewsمنذ 58 د

توظيف هندسة الذكاء الاصطناعي في الهند يقفز بنسبة 59.5%، ويتوسع خارج مراكز التكنولوجيا

أخبار صناعة AI

تقرير LinkedIn عن سوق العمل بالذكاء الاصطناعي لعام 2026، الذي صدر في 24 أبريل، وجد أن التوظيف في مجال هندسة الذكاء الاصطناعي في الهند ارتفع بنسبة 59.5% على أساس سنوي، ما يمثل أسرع وتيرة بين الأسواق التي درستها المنصة. وكان هذا النمو مدفوعًا بتوسع الطلب خارج المراكز التقنية الراسخة. مدن تشمل

CryptoFrontierمنذ 1 س

بنك الكومنولث يخفض 120 وظيفة مع توسع الذكاء الاصطناعي

أخبار صناعة AI

أعلنت مجموعة كومنويلث بنك أستراليا أنها ستُخفض ما يقارب 120 وظيفة، حيث يقوم أكبر بنك في البلاد بمراجعة أدواره وتوسيع استخدامه للذكاء الاصطناعي، وفقًا لوكالة بلومبرغ. تشمل عمليات التخفيض 43 دورًا في بنك ويست باينست في أستراليا الغربية، مع تأثر ست وظائف بالأتمتة. هذا أ

CryptoFrontierمنذ 1 س

كورسور يكشف سبب تدريب XAI: القدرة الحاسوبية كانت عالقة، وSpaceX تمتلك خيارات شراء بقيمة 60 مليار دولار أمريكي

أخبار صناعة AI

أعلنت Anysphere أن Cursor سيتعاون مع xAI لتدريب نماذج جديدة باستخدام البنية التحتية Colossus من أجل تجاوز عنق الزجاجة في القدرة الحاسوبية؛ كما قدمت SpaceX خيار استحواذ بقيمة 60 مليار دولار (يمكن استحواذها بالكامل خلال عام 2026)، وإذا لم يحدث ذلك فستدفع حوالي 10 مليارات دولار كتعويض تعاوني. تتم المعاملتان في الوقت نفسه، مما يعيد تشكيل من يمكنه تدريب Cursor ومن يمكنه الاستحواذ عليه. ما يزال Cursor يسمح بخلفيات نماذج متعددة، لكن المسار على المدى الطويل يتوقف على ما إذا كانت SpaceX ستُمارس حق الاستحواذ.

ChainNewsAbmediaمنذ 1 س

تعليق

0/400

لا توجد تعليقات