Anthropic identifie trois changements au niveau de la couche produit à l’origine de la baisse de qualité de Claude Code, et non un problème de modèle

Message de Gate News, 23 avril — L’équipe d’ingénierie d’Anthropic a confirmé que la dégradation de la qualité de Claude Code signalée par les utilisateurs au cours du mois écoulé provenait de trois changements indépendants au niveau de la couche produit, et non de problèmes liés à l’API ou au modèle sous-jacent. Les trois problèmes ont été corrigés respectivement les 7 avril, 10 avril et 20 avril, avec désormais une version finale en v2.1.116.

Le premier changement est intervenu le 4 mars, lorsque l’équipe a abaissé le niveau d’effort de raisonnement par défaut pour Claude Code de “high” à “medium” afin de traiter des pics de latence extrêmes occasionnels dans Opus 4.6 lorsque l’intensité de raisonnement est élevée. Après de nombreuses plaintes d’utilisateurs concernant une baisse des performances, l’équipe a annulé le changement le 7 avril. Le paramètre par défaut actuel est désormais “xhigh” pour Opus 4.7 et “high” pour les autres modèles.

Le second problème était un bug introduit le 26 mars. Le système était conçu pour effacer d’anciens enregistrements de raisonnement après que l’inactivité de la conversation dépassait une heure afin de réduire les coûts de récupération de session. Toutefois, une erreur dans l’implémentation a fait que l’effacement s’exécutait à répétition à chaque tour ultérieur, au lieu de s’exécuter une seule fois, ce qui a entraîné une perte progressive du contexte de raisonnement antérieur. Cela s’est manifesté par une augmentation de l’oubli, des opérations répétées et des invocations d’outils anormales. Le bug a également entraîné des ratés de cache à chaque requête, accélérant la consommation des quotas des utilisateurs. Deux expériences internes sans lien ont masqué les conditions de reproduction, prolongeant le processus de débogage à plus d’une semaine. Après la correction intervenue le 10 avril, l’équipe a examiné le code problématique à l’aide d’Opus 4.7 et a constaté qu’Opus 4.7 pouvait identifier le bug, contrairement à Opus 4.6.

Le troisième changement a été lancé le 16 avril en même temps que Opus 4.7. L’équipe a ajouté des instructions au prompt système pour réduire la sortie redondante. Les tests internes menés sur plusieurs semaines n’ont montré aucune régression, mais après le lancement, les interactions avec d’autres prompts ont dégradé la qualité du codage. Une évaluation prolongée a révélé une baisse de 3 % des performances pour Opus 4.6 et 4.7, entraînant un rollback le 20 avril.

Ces trois changements ont touché différents groupes d’utilisateurs à des moments différents, et leur effet combiné a entraîné une baisse de qualité généralisée et incohérente, compliquant le diagnostic. Anthropic a indiqué qu’elle exigera désormais que davantage d’employés internes utilisent la même version de build publique que les utilisateurs, qu’ils exécutent des suites complètes d’évaluation du modèle pour chaque modification de prompt système et qu’ils mettent en œuvre des périodes de déploiement progressif. En guise de compensation, Anthropic a réinitialisé les quotas d’utilisation pour tous les utilisateurs disposant d’un abonnement.

Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'avertissement.

Articles similaires

Cognition AI lève des fonds à une valorisation de $25B lors de négociations en phase précoce

Message « Gate News », 24 avril — Cognition AI, une startup de codage par IA, mène des négociations en phase précoce pour un nouveau tour de financement qui doublerait plus que sa valorisation pour $25 milliards, selon des sources au fait du dossier. L’entreprise vise à lever des centaines de millions de dollars ou plus, alors que

GateNewsIl y a 48m

NEC Corporation devient le premier partenaire mondial d’Anthropic au Japon

NEC annonce devenir le premier partenaire mondial d’Anthropic au Japon, et les deux parties vont développer, pour des secteurs hautement réglementés tels que la finance, l’industrie et les administrations locales, des solutions d’IA sûres et dotées d’une expertise sectorielle, tout en intégrant la série Claude à NEC BluStellar, avec un focus sur la transformation de la gestion pilotée par les données et de l’expérience client. Parallèlement, NEC introduira Claude Cowork et l’intégration SOC afin d’améliorer la protection en cybersécurité. Afin de valider les résultats, NEC lance le programme des clients « Zero » pour tester en interne, de manière exhaustive, des agents IA, et prévoit de déployer Claude à l’échelle mondiale, en établissant le plus grand CoE (Centre of Excellence) d’ingénierie natif en IA au Japon.

ChainNewsAbmediaIl y a 3h

Brèche de sécurité chez Vercel : s’étend à des centaines d’utilisateurs ; les développeurs IA à plus haut risque

Message de Gate News, 23 avril — Vercel a révélé le 19 avril que son incident de sécurité, initialement décrit comme touchant un « sous-ensemble limité de clients », s’est étendu à une communauté de développeurs bien plus large, en particulier ceux qui construisent des flux de travail d’agents IA. L’attaque peut toucher des centaines d’utilisateurs

GateNewsIl y a 4h

OpenAI lance GPT-5.5 : 12M de contexte, l’indice AA atteint le sommet, Terminal-Bench 82,7 % reconfigure la référence des agents

OpenAI publie GPT-5.5, axé sur le travail basé sur des agents et le traitement des connaissances en entreprise, et le lance simultanément dans ChatGPT et Codex. Les points clés incluent une fenêtre contextuelle de 12 millions de tokens, l’AA Intelligence Index 60, en avance sur Claude Opus 4.7 et Gemini 3.1 Pro ; le prix est de 5 dollars pour l’entrée de 1 million de tokens et de 30 dollars pour la sortie de 1 million de tokens, la sortie de tokens diminuant d’environ 40 %, tandis que le coût réel augmente d’environ 20 %.

ChainNewsAbmediaIl y a 5h

Cluster Protocol lève $5M pour accélérer CodeXero, un IDE d’IA natif du navigateur pour EVM

Message de Gate News, 23 avril — Cluster Protocol, une société de deeptech IA et d’infrastructure Web3, a annoncé avoir levé $5 millions lors d’un nouveau tour de financement mené par DAO5, avec la participation de Paper Ventures, JPEG Trading et Mapleblock Capital, portant le financement total à 7,75 millions $. Le capital wi

GateNewsIl y a 5h

Nvidia élargit ses partenariats en matière d’IA au Royaume-Uni, en Chine et dans le secteur automobile malgré les défis de la chaîne d’approvisionnement

Message de Gate News, 23 avril — Malgré la concurrence de Google et les perturbations de la chaîne d’approvisionnement, Nvidia reste le principal acteur sur le marché du matériel pour l’IA. TD Cowen a réaffirmé sa recommandation « achat » sur Nvidia jeudi, citant le leadership de l’entreprise en matière de performances et l’étendue de son écosystème logiciel. L’aval

GateNewsIl y a 5h
Commentaire
0/400
Aucun commentaire