DeepSeek V4 以 1M 上下文窗口发布;华为 Ascend 与燧原芯片实现完全兼容

Gate News 消息,4 月 24 日——DeepSeek V4-Pro 和 DeepSeek V4-Flash 于 4 月 24 日正式发布,并开源发布;上下文处理长度从 128K 显著扩展至 1M,容量提升接近 10 倍。华为计算宣布,其 Ascend 超级节点产品通过芯片与模型技术的紧密协作,已全面支持 DeepSeek V4 系列模型。

华为 Ascend 950 通过融合内核与多流并行技术,实现高吞吐、低延迟的 DeepSeek V4 模型推理部署,以降低 Attention 计算与内存访问开销。对于输入为 8K 的 DeepSeek V4-Pro,Ascend 950 实现约 20ms TPOT,单卡 Decode 吞吐量为 4,700 TPS;对于输入在 8K 以下的 DeepSeek V4-Flash,它的 TPOT 约为 10ms,吞吐量为 1,600 TPS。Ascend A3 超级节点系列也实现完全兼容,并提供训练参考实现以便快速微调。基于搭载大 EP 模式的 64 卡 Ascend A3 超级节点,DeepSeek V4-Flash 在 8K/1K 输入输出场景下,使用 vLLM 推理引擎实现单卡 Decode 吞吐量超过 2,000 TPS。华为全线 Ascend A2、A3 和 950 产品均支持 DeepSeek V4-Flash 和 V4-Pro。

华为云宣布与 DeepSeek V4 的率先兼容,通过其 MaaS 平台为开发者提供一键式 API 令牌服务。华为云优化了系统层、算子层和集群层能力,以确保模型快速适配与高性能部署。金山 WPS 和 360 等企业已通过华为云集成了 DeepSeek 的新模型。

燧原(Cambricon)也宣布基于 vLLM 推理框架实现与 DeepSeek V4-Flash 和 V4-Pro 的 Day 0 兼容,并将适配代码开源至 GitHub 社区。燧原此前在去年 DeepSeek V3.2 发布时就已实现率先适配;其已对 DeepSeek 系列模型开展了深度的软件-硬件协同性能优化。

إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة من مصادر خارجية ولا تمثل آراء أو مواقف Gate. المحتوى المعروض في هذه الصفحة هو لأغراض مرجعية فقط ولا يشكّل أي نصيحة مالية أو استثمارية أو قانونية. لا تضمن Gate دقة أو اكتمال المعلومات، ولا تتحمّل أي مسؤولية عن أي خسائر ناتجة عن استخدام هذه المعلومات. تنطوي الاستثمارات في الأصول الافتراضية على مخاطر عالية وتخضع لتقلبات سعرية كبيرة. قد تخسر كامل رأس المال المستثمر. يرجى فهم المخاطر ذات الصلة فهمًا كاملًا واتخاذ قرارات مدروسة بناءً على وضعك المالي وقدرتك على تحمّل المخاطر. للتفاصيل، يرجى الرجوع إلى إخلاء المسؤولية.

مقالات ذات صلة

تخطط Google للاستثمار بما يصل إلى $40 billion في Anthropic، وتتعهد بتوفير 5+ غيغاواطات من القدرة الحاسوبية

رسالة أخبار غيت، 24 أبريل — وفقًا لمصادر السوق، تخطط Google للاستثمار بما يصل إلى $40 billion في Anthropic. سيبدأ الاستثمار بمبلغ مبدئي قدره $10 billion نقدًا، تليه زيادة إضافية قد تصل إلى $30 billion بشرط تحقيق معالم محددة. ستوفر Google أيضًا لـ Anthropic ما لا يقل عن 5 غيغاواط من القدرة الحاسوبية ضمن إطار الشراكة.

GateNewsمنذ 16 د

المنظّم السويسري FINMA يحذّر من أن أداة الذكاء الاصطناعي Mythos من Anthropic تشكّل مخاطر مالية

رسالة بوابة الأخبار، 24 أبريل — هيئة الإشراف على الأسواق المالية في سويسرا (FINMA) قد ذكرت أن السماح للبنوك بتبنّي أداة الذكاء الاصطناعي من شركة Anthropic Mythos بسرعة وبسهولة من شأنه أن يطرح مخاطر جسيمة على

GateNewsمنذ 39 د

Fere AI تكمل جولة تمويل بقيمة 1.3 مليون دولار بقيادة Ethereal Ventures

بوابة الأخبار، 24 أبريل — أعلنت شركة Fere AI، وهي منصة لوكلاء تداول للأصول الرقمية مدعومة بالذكاء الاصطناعي، عن إتمام جولة تمويل بقيمة 1.3 مليون دولار بقيادة Ethereal Ventures، بمشاركة Galaxy Vision Hill وKosmos Ventures. تدعم المنصة شبكات عبر السلاسل بما في ذلك Ethereum,

GateNewsمنذ 1 س

أنثروبيك تعيد التراجع عن تغييرات Claude Code بعد تراجع الجودة؛ تم إكمال جميع الإصلاحات

بوابة الأخبار: رسالة، 24 أبريل — اعترفت أنثروبيك بحدوث تراجع حديث في جودة Claude Code وأكدت أنه تم حل جميع المشكلات ذات الصلة من خلال عمليات الاستعادة للخلف (rollbacks) والإصلاحات. نشأت المشكلة عن ثلاثة تعديلات على المنتج والمطالبات (prompts) تم إجراؤها بين أوائل وأواسط أبريل. في 4 مارس،

GateNewsمنذ 3 س

المؤسس المشارك لـ NeoSoul، كايلان: ينبغي أن تسمح صناعة الذكاء الاصطناعي بوجود الألعاب، وغالبًا ما تبدأ الابتكارات كمنتجات تجريبية

بوابة الأخبار رسالة، 24 أبريل — في منتدى حديث في هونغ كونغ حول التمويل الذكي المشفر، شارك المؤسس المشارك لـ NeoSoul، كايلان، رؤى حول كيفية تقييم مشاريع الذكاء الاصطناعي في المرحلة المبكرة، داخل صناعة ذكاء اصطناعي تتطور بسرعة. وبالإضافة إلى تقييم المنتجات الحالية، يجب على الفرق إظهار القدرة على مواكبة قدرات النموذج الأساسية، كما قال. Beyond assessing current products, teams must demonstrate the ability to keep pace with underlying model capabilities, he stated. كايلان أكد أن ريادة أعمال الذكاء الاصطناعي تتطلب كلاً من الإتزان والرؤية: الإتزان يعني امتلاك قدرات التنفيذ الهندسي وتصميم المنتج وفهم السوق لتقديم منتجات ملموسة؛ أما الرؤية فتعني البناء بما يتماشى مع اتجاهات تطور النماذج اللغوية الكبيرة. جادل كايلان بأنه في حين قد تبدو بعض منتجات الذكاء الاصطناعي في المرحلة المبكرة أقرب إلى الألعاب، ينبغي السماح بمثل هذه الأشكال في الصناعات الناشئة. فالكثير من paradigms الجديدة حقًا لا تظهر أولاً إلا على هيئة منتجات تجريبية قبل أن تصل إلى النضج.

GateNewsمنذ 3 س

Meta将在多年的数十亿美元交易中部署数千万颗AWS Graviton5芯片

Gate 新闻消息,4月24日——Meta已与亚马逊网络服务(Amazon Web Services)签署一项多年协议,将为其AI基础设施部署数千万颗Graviton5处理器,使Meta成为全球AWS最大的Graviton客户之一。该交易涵盖三到五年,价值数十亿美元,据AWS副总裁Nafea Bshara称。

GateNewsمنذ 4 س
تعليق
0/400
لا توجد تعليقات