Anthropic Identifica Três Alterações na Camada de Produto por Detrás da Queda da Qualidade do Claude Code, e Não um Problema do Modelo

Mensagem do Gate News, 23 de abril — A equipa de engenharia da Anthropic confirmou que a degradação da qualidade do Claude Code reportada pelos utilizadores ao longo do último mês resultou de três alterações independentes na camada de produto, e não de problemas na API ou no modelo subjacente. Os três problemas foram corrigidos a 7 de abril, 10 de abril e 20 de abril, respetivamente, com a versão final agora na v2.1.116.

A primeira alteração ocorreu a 4 de março, quando a equipa reduziu o nível de esforço de raciocínio predefinido do Claude Code de “high” para “medium” para abordar picos ocasionais e extremos de latência no Opus 4.6 sob elevada intensidade de raciocínio. Após reclamações generalizadas de utilizadores sobre desempenho reduzido, a equipa reverteu a alteração em 7 de abril. O valor predefinido atual é agora “xhigh” para o Opus 4.7 e “high” para outros modelos.

O segundo problema foi um bug introduzido a 26 de março. O sistema foi concebido para limpar registos antigos de raciocínio após a inatividade na conversa exceder uma hora, de modo a reduzir os custos de recuperação da sessão. No entanto, uma falha na implementação fez com que a limpeza fosse executada repetidamente em cada turno subsequente em vez de uma única vez, levando o modelo a perder progressivamente o contexto de raciocínio anterior. Isso manifestou-se como aumento de esquecimento, operações repetidas e invocações anormais de ferramentas. O bug também resultou em faltas de cache em cada pedido, acelerando o consumo das quotas dos utilizadores. Dois testes internos não relacionados mascararam as condições de reprodução, alargando o processo de depuração para mais de uma semana. Após a correção em 10 de abril, a equipa analisou código problemático usando o Opus 4.7 e verificou que o Opus 4.7 conseguia identificar o bug, enquanto o Opus 4.6 não conseguia.

A terceira alteração foi lançada a 16 de abril em conjunto com o Opus 4.7. A equipa adicionou instruções ao prompt do sistema para reduzir a saída redundante. Testes internos ao longo de várias semanas não mostraram regressão, mas após o lançamento, a interação com outros prompts degradou a qualidade da codificação. Uma avaliação alargada revelou uma queda de 3% no desempenho tanto no Opus 4.6 como no 4.7, levando a uma reversão a 20 de abril.

Estas três alterações afetaram grupos de utilizadores diferentes em momentos diferentes, e o efeito combinado criou uma queda de qualidade generalizada e inconsistente, dificultando o diagnóstico. A Anthropic afirmou que agora será necessário envolver mais funcionários internos para utilizarem a mesma versão pública de compilação que os utilizadores, executarem conjuntos completos de avaliação do modelo para cada modificação de prompt do sistema e implementarem períodos de rollout faseado. Como compensação, a Anthropic repôs as quotas de utilização de todos os utilizadores com subscrição.

Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.

Related Articles

O Project Prometheus de Jeff Bezos angaria $10B ao $38B a uma Valorização

Mensagem da Gate News, 24 de abril — O Project Prometheus, um laboratório de IA fundado pelo fundador da Amazon Jeff Bezos e pelo antigo executivo da Google Vik Bajaj, encerrou uma ronda de financiamento de $10 biliões com uma avaliação de $38 biliões. JPMorgan Chase e BlackRock são

GateNews12m atrás

Ações Relacionadas com IA Agora Correspondem a 45% da Capitalização do S&P 500; Mercados de Crédito Enfrentam Pressão

Mensagem de notícias da Gate, 24 de abril — De acordo com The Kobeissi Letter, as ações relacionadas com IA representam agora 45% da capitalização bolsista total do índice de ações de referência dos EUA do S&P 500 (, atingindo um máximo histórico e um aumento de 20 pontos percentuais desde o lançamento do ChatGPT em novembro de 2022. Em simultâneo, a dívida de investimento em grau de qualidade relacionada com IA subiu para 15,4% do mercado de crédito dos EUA, tornando-se o maior setor. Isto representa um aumento de 3,5 pontos percentuais face a 2020, com a dívida em dívida correspondente a quase duplicar para 1,4 biliões de dólares, um pico de todos os tempos.

GateNews12m atrás

A OpenAI Lança o GPT-5.5, Concebido para Tarefas de Agentes e Fluxos de Trabalho Complexos

Mensagem de Notícias da Gate, 24 de abril — A OpenAI lançou oficialmente o GPT-5.5, um modelo de IA de nova geração concebido para lidar com objectivos complexos, integração de ferramentas, auto-verificação e conclusão de tarefas em múltiplas etapas. O modelo destaca-se na escrita e depuração de código, investigação online, análise de dados, criação de documentos

GateNews27m atrás

As previsões financeiras da Intel superaram as expectativas; a procura por IA impulsiona a recuperação das CPUs; após a tomada de posse de Chen Liwu, o INTC já subiu 3 vezes

A receita de um trimestre da Intel foi de 13,6 mil milhões de dólares, com EPS de 0,29; nas previsões para o segundo trimestre o valor mediano é de 14,3 mil milhões, muito acima das expectativas, com uma margem bruta de 41%. A procura de centros de dados de IA impulsiona a recuperação da procura de CPU, com servidores como Xeon a serem muito procurados. Liderado por Chen Liwu, a transformação: a IFS no primeiro trimestre foi de 5,4 mil milhões de dólares, crescimento de 16%, com clientes externos como a Tesla a acompanhar a utilização das tecnologias da Intel pela Terafab. Após o fecho do mercado, o preço das acções subiu cerca de 20%, atingindo um máximo histórico, tendo já subido quase 3 vezes desde o ano passado.

ChainNewsAbmedia39m atrás

Cognition AI Angaria Financiamento a $25B Avaliação em Negociações Iniciais

Mensagem de Gate News, 24 de Abril — A Cognition AI, uma startup de programação com IA, está em negociações iniciais para uma nova ronda de financiamento que, segundo fontes familiarizadas com o assunto, mais do que duplicaria a sua avaliação para $25 bilião. A empresa pretende angariar centenas de milhões de dólares ou mais, na medida em que

GateNews1h atrás

A NEC Corporation tornar-se-á o primeiro parceiro global da Anthropic no Japão

A NEC anunciou que se tornará o primeiro parceiro global da Anthropic no Japão, com ambas as partes a desenvolver soluções de IA seguras e com conhecimento específico do setor para indústrias altamente reguladas, como as finanças, a indústria transformadora e os governos locais, e a integrar a série Claude na NEC BluStellar, com foco na transformação da gestão orientada por dados e da experiência do cliente. Em simultâneo, será introduzido o Claude Cowork e a integração com o SOC para melhorar a proteção de cibersegurança. Para validar a eficácia, a NEC lançou o Programa do Cliente Zero para testes internos e abrangentes de agentes de IA, e planeia promover a implementação do Claude a nível global, criando o maior CoE (Centro de Excelência) de Engenheiros de IA native no Japão.

ChainNewsAbmedia4h atrás
Comentar
0/400
Nenhum comentário