O Post-Mortem da Degradação do Claude Code
Análise do Postmortem da Anthropic: Fatores de Degradação do Modelo Claude
A recente percepção de queda de desempenho no Claude motivou a Anthropic a publicar um postmortem detalhado, confirmando que a degradação na qualidade das respostas não foi uma impressão subjetiva da base de usuários, mas o resultado de falhas técnicas reais. Este documento estratégico tem o objetivo de detalhar como decisões de engenharia e bugs de infraestrutura comprometeram a performance do modelo, transformando o comportamento errático em um conjunto de incidentes diagnosticáveis. A transparência institucional adotada pela empresa busca restabelecer a confiança dos desenvolvedores ao admitir que otimizações internas prejudicaram a experiência prática. A seguir, detalhamos os mecanismos técnicos que causaram essa degradação.
A degradação observada não decorreu de um erro centralizado, mas da sobreposição de três falhas distintas com cronogramas independentes. Essa combinação gerou um efeito cumulativo que prejudicou a continuidade das tarefas e a precisão do sistema.
- Redução de Esforço de Raciocínio (Início: 4 de março / Reversão: 7 de abril): A Anthropic alterou o padrão de raciocínio do Claude Code de "alto" para "médio" com o intuito de reduzir a latência das respostas. A mudança foi percebida imediatamente pelos usuários como uma queda na capacidade analítica, resultando na reversão para os parâmetros originais após a constatação de que a economia de tempo não compensava a perda de precisão.
- Falha Crítica de Cache (Início: 26 de março / Reversão: 20 de abril): Uma tentativa de otimizar a memória para sessões inativas introduziu um erro no sistema de cache. O bug causava a exclusão do histórico de raciocínio do Claude em cada turno durante todo o restante da sessão de conversa, impedindo que o modelo mantivesse a continuidade lógica de suas decisões. Tecnicamente, cada requisição passava a ser tratada como um "cache miss", o que também acelerou o consumo dos limites de uso dos assinantes devido ao processamento repetitivo de dados que deveriam estar armazenados.
- Restrições de Verbosidade no Prompt de Sistema (Início: 16 de abril / Reversão: 20 de abril): Foi implementada uma instrução no prompt de sistema que limitava o texto entre chamadas de ferramentas (tool calls) a apenas 25 palavras, estabelecendo um teto de 100 palavras para as respostas finais. Essa restrição causou uma queda mensurável na qualidade do código gerado pelos modelos Opus 4.6 e 4.7, impossibilitando que a inteligência artificial processasse explicações estruturadas ou lógicas complexas durante a execução de tarefas.
A sobreposição desses três eventos dificultou o diagnóstico inicial pelas equipes de engenharia, uma vez que as falhas operavam simultaneamente em determinados períodos.
Identificar a origem dos problemas foi um desafio logístico, pois as falhas afetavam diferentes fatias de tráfego em horários e condições distintas. Para a comunidade de desenvolvedores, a degradação parecia aleatória ou inconsistente, o que dificultava a reprodução dos erros em ambientes de teste controlados pela própria empresa. Enquanto alguns usuários enfrentavam limitações de palavras, outros sofriam com a perda de memória da sessão ou com a redução do esforço analítico. Essa fragmentação explica o motivo de a experiência ter sido tão diversa, variando de falhas lógicas graves a respostas curtas e insatisfatórias.
O estado atual do sistema foi normalizado após o dia 20 de abril com o lançamento da versão 2.1.116, que corrigiu as vulnerabilidades de cache e as restrições de prompt. Como medida de compensação, a Anthropic realizou o reset dos limites de uso para todos os assinantes, mitigando o prejuízo causado pelo consumo excessivo de processamento durante as falhas de cache. A reação da comunidade destacou a importância da transparência técnica, embora persista a percepção de que houve uma tentativa inicial de priorizar métricas de eficiência interna sobre as necessidades reais dos usuários. Essa postura foi interpretada como um erro de julgamento corporativo ao tentar sobrepor uma visão de otimização à utilidade prática da ferramenta no dia a dia.
A análise técnica demonstra que o sistema Claude passou por um período de instabilidade causado por otimizações agressivas e erros de execução em infraestrutura. Com a reversão das políticas de limite de palavras e o ajuste nos padrões de raciocínio e cache, o serviço foi restabelecido integralmente. A empresa confirmou que o modelo opera agora em sua capacidade plena, encerrando o ciclo de degradação identificado entre março e abril.