DeepSeek V4 est lancé avec une fenêtre de contexte de 1M ; les puces Huawei Ascend et Cambricon atteignent une compatibilité totale

Message de Gate News, 24 avril — DeepSeek V4-Pro et DeepSeek V4-Flash ont été officiellement publiés et open-sourcés le 24 avril, avec une longueur de traitement du contexte considérablement étendue de 128K à 1M, soit une augmentation de capacité d’environ 10 fois. Huawei Computing a annoncé que ses produits de supernœud Ascend prennent entièrement en charge les modèles de la série DeepSeek V4 grâce à une étroite collaboration entre les technologies de puce et de modèle.

Ascend 950 atteint un déploiement d’inférence des modèles DeepSeek V4 à haut débit et faible latence grâce à des techniques de noyaux fusionnés et de parallélisme multi-stream permettant de réduire la surcharge liée aux calculs d’Attention et aux accès mémoire. Pour DeepSeek V4-Pro avec une entrée de 8K, Ascend 950 atteint environ 20ms TPOT avec un débit Decode de 4,700 TPS sur une seule carte ; pour DeepSeek V4-Flash avec une entrée <8K>, il atteint environ 10ms TPOT avec un débit de 1,600 TPS. La série de supernœuds Ascend A3 atteint également une compatibilité totale, avec des implémentations de référence d’entraînement fournies pour un fine-tuning rapide. Sur un supernœud Ascend A3 à 64 cartes avec un grand mode EP, DeepSeek V4-Flash atteint plus de 2,000 TPS en Decode monocarte sur des scénarios entrée/sortie 8K/1K en utilisant le moteur d’inférence vLLM. Les lignes de produits complètes Huawei Ascend A2, A3 et 950 prennent en charge à la fois DeepSeek V4-Flash et V4-Pro.

Huawei Cloud a annoncé une compatibilité en avance avec DeepSeek V4, offrant aux développeurs des services d’API token en un clic via sa plateforme MaaS. Huawei Cloud a optimisé les capacités au niveau système, au niveau opérateur et au niveau cluster pour garantir une adaptation rapide des modèles et un déploiement performant. Des entreprises, dont Kingsoft WPS et 360, ont déjà intégré le nouveau modèle de DeepSeek via Huawei Cloud.

Cambricon a également annoncé une compatibilité Day 0 avec DeepSeek V4-Flash et V4-Pro basée sur le framework d’inférence vLLM, avec un code d’adaptation open-sourcé à la communauté GitHub. Cambricon avait déjà atteint une adaptation en avance lorsque DeepSeek V3.2 a été publié l’an dernier, ayant mené une optimisation approfondie des performances en collaboration logiciel-hardware sur les modèles de la série DeepSeek.

Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'avertissement.

Articles similaires

Google prévoit d’investir jusqu’à $40 milliards dans Anthropic et s’engage à fournir plus de 5 gigawatts de puissance de calcul

Message de Gate News, 24 avril — Selon des sources du marché, Google prévoit d’investir jusqu’à $40 milliards dans Anthropic. L’investissement commencera par un versement initial de $10 milliards en espèces, puis pourra aller jusqu’à un montant supplémentaire de $30 milliards, sous réserve d’atteindre des jalons définis. Google fournira également à Anthropic au moins 5 gigawatts de puissance de calcul dans le cadre du partenariat.

GateNewsIl y a 16m

Le régulateur suisse FINMA met en garde : l’outil d’IA Mythos d’Anthropic présente un risque financier

Message de Gate News, 24 avril — L’Autorité fédérale de surveillance des marchés financiers (FINMA) de Suisse a indiqué que le fait d’autoriser les banques à adopter rapidement et facilement l’outil d’intelligence artificielle Mythos d’Anthropic ferait peser de sérieux risques sur le

GateNewsIl y a 39m

Fere AI clôture un tour de financement de 1,3 M$ mené par Ethereal Ventures

Message de Gate News, 24 avril — Fere AI, une plateforme d’agent de trading d’actifs numériques propulsée par l’IA, a annoncé la clôture d’un tour de financement de 1,3 million de dollars mené par Ethereal Ventures, avec la participation de Galaxy Vision Hill et de Kosmos Ventures. La plateforme prend en charge des réseaux inter-chaînes, notamment Ethereum,

GateNewsIl y a 1h

Anthropic annule les changements de Claude Code après une baisse de qualité ; tous les correctifs sont terminés

Message des Gate News, le 24 avril — Anthropic a reconnu une récente baisse de la qualité de Claude Code et a confirmé que tous les problèmes liés ont été résolus grâce à des retours en arrière et à des correctifs. Les problèmes provenaient de trois ajustements de produit et d’invites effectués entre début et mi-avril. Le 4 mars, la

GateNewsIl y a 3h

Kaelan, cofondateur de NeoSoul : l’industrie de l’IA devrait permettre l’existence de jouets, l’innovation commence souvent comme des produits expérimentaux

Message de Gate News, 24 avril — Lors d’un récent forum à Hong Kong sur la finance intelligente chiffrée, Kaelan, cofondateur de NeoSoul, a partagé des informations sur l’évaluation de projets d’IA dans une industrie de l’IA en début de stade et en évolution rapide. Au-delà de l’évaluation des produits actuels, les équipes doivent démontrer leur capacité à suivre l’évolution des capacités du modèle sous-jacent, a-t-il déclaré. Kaelan a souligné que l’entrepreneuriat en IA exige à la fois de l’ancrage et de la vision : l’ancrage signifie disposer de compétences en mise en œuvre d’ingénierie, en conception de produit et en compréhension du marché pour livrer des produits tangibles ; la vision signifie construire en alignement avec les tendances d’évolution des grands modèles de langage.

GateNewsIl y a 3h

Meta déploiera des dizaines de millions de puces AWS Graviton5 dans le cadre d’un accord pluriannuel d’un milliard de dollars

Message de Gate News, 24 avril — Meta a signé un accord pluriannuel avec Amazon Web Services pour déployer des dizaines de millions de processeurs Graviton5 pour son infrastructure d’IA, faisant de Meta l’un des plus importants clients Graviton d’AWS à l’échelle mondiale. Le contrat, sur une durée de trois à cinq ans, est évalué à plusieurs milliards de d

GateNewsIl y a 4h
Commentaire
0/400
Aucun commentaire