Alibaba ouvre en open-source le module d’interprétabilité Qwen-Scope, couvrant 7 modèles, le 30 avril

D’après PANews, le 30 avril, Qwen d’Alibaba a annoncé la mise en open source de Qwen-Scope, un module d’interprétabilité entraîné sur les modèles des séries Qwen3 et Qwen3.5. La sortie couvre 7 modèles de langage de grande taille dans des variantes denses et mixture-of-experts, avec 14 jeux de poids d’autoencodeurs parcimonieux.

Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'avertissement.

Articles similaires

DeepSeek Introduit une méthode de primitives visuelles pour améliorer le raisonnement multimodal le 30 avril

D’après le rapport technique de DeepSeek, le 30 avril, l’entreprise a introduit Visual Primitives, une méthode qui intègre des unités visuelles de base telles que des points et des boîtes englobantes dans des chaînes de raisonnement afin de résoudre le problème de l’écart de référence dans les tâches multimodales. La méthode réduit la consommation de jetons d’images

GateNewsIl y a 3m

NVIDIA publie les poids du modèle phare Cosmos-Reason2-32B et étend la fenêtre de contexte à 256 000 jetons

D’après Beating, NVIDIA a publié les poids de Cosmos-Reason2-32B, la version phare de son modèle de vision-langage (VLM) de raisonnement par IA physique, conçu pour aider les robots et les systèmes de conduite autonome à comprendre les principes spatiaux, temporels et physiques. Le modèle de 32 milliards de paramètres,

GateNewsIl y a 5m

OpenAI révèle pourquoi Codex interdit de parler de « gobelins » : la récompense de personnalité « nerd » a dérapé

OpenAI explique dans son blog officiel que Codex interdit de parler de gobelins et autres créatures, à cause d’un signal de récompense favorisant des métaphores de créatures lors de l’entraînement des traits « nerd », ce qui a entraîné une contamination entre personnalités et une dérive du RLHF. L’incident a été révélé par Barron Roth après la fuite des instructions système, et OpenAI a alors adopté deux stratégies : un codage dur à court terme et une suppression à long terme des signaux de récompense. Cela met en garde contre la fragilité de la conception des récompenses, et souligne que les audits post-entraînement doivent être plus précis.

ChainNewsAbmediaIl y a 49m

Les serveurs d’IA Nvidia B300 atteignent 1 million de dollars en Chine dans un contexte de pénurie d’approvisionnement

D’après Reuters, les serveurs d’IA B300 de Nvidia se vendent désormais pour environ 7 millions de yuans (1 million de dollars US) en Chine, sous l’effet d’une répression des réseaux de contrebande et de la demande persistante des entreprises technologiques locales. Le prix a fortement augmenté par rapport à environ 4 millions de yuans (585 000 dollars US) à la fin de 2025, de manière significative

GateNewsIl y a 1h

Le résultat opérationnel de LG CNS augmente de 19 % au T1 grâce à la croissance de l’IA et du cloud

D’après Chosun Daily, LG CNS a indiqué le 30 avril que son bénéfice opérationnel du premier trimestre a augmenté de 19,4% d’une année sur l’autre pour atteindre 94,2 milliards de won (64,1 millions de dollars), porté par la demande en IA et en cloud. Le chiffre d’affaires a progressé de 8,6% pour s’établir à 1,3 trillion de won (894 millions de dollars). L’unité IA et cloud de l’entreprise a généré 765,4 billions de

GateNewsIl y a 2h

OpenAI lance GPT-5.5-Cyber : confrontation avec Anthropic Mythos

OpenAI a annoncé le lancement de GPT-5.5-Cyber, conçu spécifiquement pour la cybersécurité, qui sera déployé « dans les prochains jours » auprès des unités de défense critiques via un mécanisme d’accès de confiance en coopération avec les autorités, sans vente ouverte. En contraste avec la voie ouverte d’Anthropic Mythos, la Maison-Blanche s’y oppose et vise l’extension jusqu’à 70 entités. Le Preparedness Framework l’évalue comme High (sans atteindre le niveau critical), tout en renforçant la protection de la cybersécurité. Ensuite, il faudra surveiller la liste de déploiement, la possible inclusion de la CISA, et les différences entre les normes de sécurité des deux parties.

ChainNewsAbmediaIl y a 3h
Commentaire
0/400
Aucun commentaire