1

Claude code e seus "grep" desnecessários

O Claude Code tem um hábito irritante: quando você pergunta como algo funciona no seu projeto, ele sai rodando uma sequência de greps antes de te responder.

Você pergunta "como esse fluxo de autenticação funciona?", aí ele começa: grep por aqui, grep por ali, lê três arquivos, grep de novo, mais um arquivo... você fica olhando ele trabalhar por uns 30 segundos até ele finalmente te responder.

O que me fez perceber que isso é desnecessário foi um teste simples. Interrompi ele no meio dos GREPs e perguntei diretamente: "o que você ainda precisa encontrar pra me responder?". Ele me respondeu: "já tenho tudo o que preciso" e foi lá e me explicou exatamente o que eu tinha pedido.

Ou seja, ele já tinha a resposta antes de terminar os GREPs. Continuou rodando comandos por inércia, comendo token à toa.

Não sei se é um comportamento de "parecer mais confiante na resposta" ou se é só como o modelo foi treinado pra agir em contexto de código, mas na prática é desperdício. Especialmente quando você está num plano com limite de uso ou pagando por token.

O que eu faço agora: quando ele começa uma sequência longa de buscas pra responder algo conceitual, eu interrompo e pergunto diretamente o que quero saber. Na maioria das vezes ele responde na hora, sem precisar de mais nenhum comando.

Como vocês resolveram esse "problema"? Colocando nos arquivos de instruções pra ele não rodar "grep"? Ou rodar de alguma forma específica?


Ando escrevendo sobre utilização de IA pra estudar/programar. Se interessar:

Utilização de IA para estudo: https://hdfreitas.github.io/ia-como-professor/

Utilização de IA para revisão de código: https://hdfreitas.github.io/ia-como-revisor/

Carregando publicação patrocinada...
1

Mesmo com um projeto bem documentado, o agente tende a pesquisar para entender o todo e não apenas responder a uma pergunta isolada. Isso acontece porque ele foi treinado para escrever código e parte desse trabalho começa justamente pela investigação do contexto.

Por isso, não vejo como produtivo tentar economizar tokens nessa etapa. As pesquisas feitas continuam na janela de contexto (e no cache) e podem alimentar a inteligência do agente durante toda a sessão.

Em sessões longas, constumo ver o Claude, por exemplo, reduzir a pesquisa e ser mais assetivo nas respostas. Em sessões curtas, para pesquisa pontual, vale a pena chamar um modelo menor que use menos raciocínio ou esforço para responder.

1

pessoalmente a IA que eu mais utilizo na verdade é a extensão da Junie nas IDEs da jetbrains, no caso dela, faz sentido ela parar para verificar outros arquivos e fazer passos adicionais, na verdade eu gosto disso, porque ela consegue entender melhor meu projeto, acho que é a única que realmente consegue ENTENDER meu projeto e o que eu estou de fato pedindo.

é triste saber que uma extensão tão boa esteja sendo descontinuado pela própria jetbrains a favor da sua versão em cli.

eu também consigo ver os pensamentos dela, tipo ela abre um arquivo: ela diz em qual linha abriu o arquivo, ela para para ler, dps ela fala o que entendeu o que tal função faz, depois vai em outro arquivo que também faz referência ao principal e vai analisando e entendendo, eu sempre paro para ver os pensamentos dela em cada passo para caso ela entenda algo errado eu pare o pensamento dela e corrija.