Gate News 消息,4 月 24 日——DeepSeek 已在 MIT 许可下发布 V4 系列开源模型,权重现已在 Hugging Face 和 ModelScope 上提供。该系列包含两个专家混合 (MoE) 模型:V4-Pro 总参数 1.6 万亿,按每个 token 激活 49 亿;以及 V4-Flash 总参数 2840 亿,按每个 token 激活 130 亿。两者都支持 100 万 token 的上下文窗口。
该架构包含三项关键升级:一种混合注意力机制,结合压缩稀疏注意力 (CSA) 和高度压缩注意力 (HCA),从而显著降低长上下文开销——V4-Pro 在 1M 上下文下的推理 FLOPs 仅为 V3.2 的 27%,用于在推理过程中存储历史信息的 KV 缓存 (VRAM) 仅为 V3.2 的 10%;用流形约束超连接 (mHC) 替代传统残差连接,以增强跨层信号传播稳定性;以及 Muon 优化器以实现更快的训练收敛。预训练使用了超过 32 万亿 tokens 的数据。
后训练采用两阶段方法:首先通过监督微调 (SFT) 和 GRPO 强化学习训练领域特定专家,然后通过在线蒸馏将它们合并为单一模型。V4-Pro-Max (最高推理模式) 声称是最强的开源模型,拥有顶级代码基准,并在推理和智能体任务上显著缩小了与闭源前沿模型的差距。V4-Flash-Max 在算力充足的情况下实现了 Pro 级推理性能,但在纯知识和复杂智能体任务上受限于参数规模。权重以混合 FP4+FP8 精度存储。
إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة من مصادر خارجية ولا تمثل آراء أو مواقف Gate. المحتوى المعروض في هذه الصفحة هو لأغراض مرجعية فقط ولا يشكّل أي نصيحة مالية أو استثمارية أو قانونية. لا تضمن Gate دقة أو اكتمال المعلومات، ولا تتحمّل أي مسؤولية عن أي خسائر ناتجة عن استخدام هذه المعلومات. تنطوي الاستثمارات في الأصول الافتراضية على مخاطر عالية وتخضع لتقلبات سعرية كبيرة. قد تخسر كامل رأس المال المستثمر. يرجى فهم المخاطر ذات الصلة فهمًا كاملًا واتخاذ قرارات مدروسة بناءً على وضعك المالي وقدرتك على تحمّل المخاطر. للتفاصيل، يرجى الرجوع إلى
إخلاء المسؤولية.
مقالات ذات صلة
تراقب المملكة المتحدة شركة أنثروبيك للذكاء الاصطناعي لتعزيز أمن سيبراني القطاع المصرفي
تستكشف المملكة المتحدة خطوة كبيرة في الأمن السيبراني المالي من خلال العمل مع شركة الذكاء الاصطناعي Anthropic. تشير المناقشات المبكرة إلى أن الحكومة قد تنشر نموذج Claude Mythos المتقدم من Anthropic عبر البنوك والمؤسسات المالية. تهدف هذه الخطوة إلى تحسين الدفاعات في مواجهة التهديدات السيبرانية
CryptometerIoمنذ 1 د
中国知识产权办公室将AI、半导体和脑机接口纳入加速保护计划
Gate 新闻消息,4月24日——中国国家知识产权局在4月24日宣布,将通过制度改革、优化服务以及扩大应用,针对新兴技术建立全面的知识产权保护体系。该局将优化专利审查政策
GateNewsمنذ 8 د
الأدميرال يشير إلى أن الحكومة الأمريكية تعمل عقدة بيتكوين دون تعدين
أشار أميرال كبير إلى أن حكومة الولايات المتحدة تقوم بنشاط بتشغيل عقدة على شبكة بيتكوين مع تجنب المشاركة عمداً في أنشطة التعدين. تشير هذه الإفصاحات إلى أن السلطات تتولى دوراً أكثر انخراطاً في البنية التحتية لسلسلة الكتل من أجل الإشراف و
CryptoFrontierمنذ 24 د
إيرادات تسلا في الربع الأول ترتفع 16% إلى 22.4 مليار دولار؛ التخطيط لإطلاق الروبوت البشري الشكل في منتصف 2026
بوابة الأخبار، 24 أبريل — أعلنت تسلا عن إيرادات للربع الأول بلغت 22.4 مليار دولار أمريكي في 23 أبريل، ما يمثل زيادة بنسبة 16% على أساس سنوي. تجاوزت عمليات تسليم المركبات العالمية للشركة 358,000 وحدة، بينما تجاوز الإنتاج 408,000 وحدة.
قدمت شركة تسلا العملاقة للبطاريات في شنغهاي 213,000 مرك
GateNewsمنذ 24 د
تربح SK Hynix في الربع الأول تقفز خمس مرات إلى مستوى قياسي مع طفرة الذكاء الاصطناعي، ما يعزز مكافآت الموظفين إلى 878 ألف دولار
رسالة بوابة الأخبار، 24 أبريل — أفادت شركة SK Hynix بتضاعف خمس مرات في أرباح التشغيل الفصلية إلى رقم قياسي بلغ 37.61 تريليون وون ($32.4 مليار) في 23 أبريل، مدفوعةً بارتفاع الطلب من الذكاء الاصطناعي ومراكز البيانات. تستغل هذه المكاسب العوائد غير المسبوقة لمكافآت الموظفين، ويتوقع محللون أن يمكن أن تصل إلى ما يصل إلى $878,000 لكل موظف في 2027 إذا ظلت توقعات الأرباح الحالية ثابتة. لدى المحللين
GateNewsمنذ 1 س
DeepSeek V4 架构已验证:4 个预测中命中 3 个,Engram 模块缺失
Gate News 消息,4 月 24 日——DeepSeek 今天发布了 V4 模型卡,通过对昨日发布的 TileKernels 内核库进行分析,对先前的架构预测进行了验证 (4 月 23 日)。根据 Beating 的监测,确认了三个核心组件:mHC
GateNewsمنذ 1 س