O Post-Mortem da Degradação do Claude Code · shuantsu

Análise do Postmortem da Anthropic: Fatores de Degradação do Modelo Claude

A recente percepção de queda de desempenho no Claude motivou a Anthropic a publicar um postmortem detalhado, confirmando que a degradação na qualidade das respostas não foi uma impressão subjetiva da base de usuários, mas o resultado de falhas técnicas reais. Este documento estratégico tem o objetivo de detalhar como decisões de engenharia e bugs de infraestrutura comprometeram a performance do modelo, transformando o comportamento errático em um conjunto de incidentes diagnosticáveis. A transparência institucional adotada pela empresa busca restabelecer a confiança dos desenvolvedores ao admitir que otimizações internas prejudicaram a experiência prática. A seguir, detalhamos os mecanismos técnicos que causaram essa degradação.

A degradação observada não decorreu de um erro centralizado, mas da sobreposição de três falhas distintas com cronogramas independentes. Essa combinação gerou um efeito cumulativo que prejudicou a continuidade das tarefas e a precisão do sistema.

Redução de Esforço de Raciocínio (Início: 4 de março / Reversão: 7 de abril): A Anthropic alterou o padrão de raciocínio do Claude Code de "alto" para "médio" com o intuito de reduzir a latência das respostas. A mudança foi percebida imediatamente pelos usuários como uma queda na capacidade analítica, resultando na reversão para os parâmetros originais após a constatação de que a economia de tempo não compensava a perda de precisão.
Falha Crítica de Cache (Início: 26 de março / Reversão: 20 de abril): Uma tentativa de otimizar a memória para sessões inativas introduziu um erro no sistema de cache. O bug causava a exclusão do histórico de raciocínio do Claude em cada turno durante todo o restante da sessão de conversa, impedindo que o modelo mantivesse a continuidade lógica de suas decisões. Tecnicamente, cada requisição passava a ser tratada como um "cache miss", o que também acelerou o consumo dos limites de uso dos assinantes devido ao processamento repetitivo de dados que deveriam estar armazenados.
Restrições de Verbosidade no Prompt de Sistema (Início: 16 de abril / Reversão: 20 de abril): Foi implementada uma instrução no prompt de sistema que limitava o texto entre chamadas de ferramentas (tool calls) a apenas 25 palavras, estabelecendo um teto de 100 palavras para as respostas finais. Essa restrição causou uma queda mensurável na qualidade do código gerado pelos modelos Opus 4.6 e 4.7, impossibilitando que a inteligência artificial processasse explicações estruturadas ou lógicas complexas durante a execução de tarefas.

A sobreposição desses três eventos dificultou o diagnóstico inicial pelas equipes de engenharia, uma vez que as falhas operavam simultaneamente em determinados períodos.

Identificar a origem dos problemas foi um desafio logístico, pois as falhas afetavam diferentes fatias de tráfego em horários e condições distintas. Para a comunidade de desenvolvedores, a degradação parecia aleatória ou inconsistente, o que dificultava a reprodução dos erros em ambientes de teste controlados pela própria empresa. Enquanto alguns usuários enfrentavam limitações de palavras, outros sofriam com a perda de memória da sessão ou com a redução do esforço analítico. Essa fragmentação explica o motivo de a experiência ter sido tão diversa, variando de falhas lógicas graves a respostas curtas e insatisfatórias.

O estado atual do sistema foi normalizado após o dia 20 de abril com o lançamento da versão 2.1.116, que corrigiu as vulnerabilidades de cache e as restrições de prompt. Como medida de compensação, a Anthropic realizou o reset dos limites de uso para todos os assinantes, mitigando o prejuízo causado pelo consumo excessivo de processamento durante as falhas de cache. A reação da comunidade destacou a importância da transparência técnica, embora persista a percepção de que houve uma tentativa inicial de priorizar métricas de eficiência interna sobre as necessidades reais dos usuários. Essa postura foi interpretada como um erro de julgamento corporativo ao tentar sobrepor uma visão de otimização à utilidade prática da ferramenta no dia a dia.

A análise técnica demonstra que o sistema Claude passou por um período de instabilidade causado por otimizações agressivas e erros de execução em infraestrutura. Com a reversão das políticas de limite de palavras e o ajuste nos padrões de raciocínio e cache, o serviço foi restabelecido integralmente. A empresa confirmou que o modelo opera agora em sua capacidade plena, encerrando o ciclo de degradação identificado entre março e abril.

A reação da comunidade às revelações da Anthropic sobre a degradação do Claude Code foi mista, variando entre o elogio à transparência da empresa e uma profunda frustração por problemas acumulados durante semanas.

Os principais pontos da reação dos usuários incluem:

Vindicação sobre o "Erro de Prompt": Muitos usuários sentiram-se aliviados e validados, pois durante semanas foram informados por outros membros da comunidade (ou "defensores" da empresa) que a queda na qualidade era um "erro de habilidade" (skill issue) ou que eles não sabiam escrever prompts corretamente,,,. Um usuário chegou a exigir desculpas daqueles que insistiram que nada estava errado.
Transparência vs. "Gaslighting": Embora alguns tenham elogiado a transparência raramente vista em empresas de tecnologia ao detalhar falhas técnicas,,, outros criticaram o que chamaram de semanas de gaslighting,,. Houve quem apontasse que a empresa só admitiu os erros após perder assinantes, reputação ou devido ao lançamento de modelos concorrentes,,.
Frustração com as Compensações: A decisão de resetar os limites de uso foi recebida com ceticismo. Muitos usuários reclamaram que o reset ocorreu no mesmo dia em que suas contas já seriam resetadas naturalmente, tornando o benefício inútil,,,,. Além disso, houve cobranças por reembolsos financeiros ou créditos extras, já que usuários pagantes sentiram que desperdiçaram tokens e tempo tentando corrigir saídas ruins do modelo,,,,.
Críticas ao Processo Interno: Causou espanto na comunidade o fato de que os engenheiros da Anthropic não utilizavam a mesma versão pública do Claude Code que os clientes (falha no processo de dogfooding), o que explicaria por que bugs tão óbvios demoraram a ser detectados,,,. Os usuários sentiram que foram usados como QA (analistas de qualidade) não remunerados,.
Migração para Concorrentes: Devido à instabilidade e à perda de confiança, diversos usuários relataram ter cancelado suas assinaturas,, ou migrado para ferramentas alternativas, como o Codex,,,.
Ceticismo Técnico: Alguns membros da comunidade questionaram se o post-mortem contou a história completa, suspeitando que a API também tenha sido afetada (apesar das negativas da empresa) ou que a redução no "esforço de raciocínio" foi uma decisão intencional de corte de custos mascarada como bug,,.

Em resumo, embora a atitude de admitir os erros tenha sido respeitada por uma parte, a sensação predominante é de que a confiança foi abalada pela demora na comunicação e pela percepção de que o serviço foi degradado silenciosamente enquanto os clientes continuavam pagando o preço integral,,.