Fiquei com uma dúvida sobre o fluxo. Você está montando esse pacote de arquivos manualmente e concatenando tudo para passar ao modelo?
Porque os modelos atuais já são bons demais em tool calling para isso precisar ser manual. O ideal, pra mim, não é “calcular o blast radius e colar os 7 arquivos no prompt”. É dar ao modelo um harness local e deixar ele perguntar (e receber respostas deterministicas)
- “quais arquivos foram impactados por esse diff?”
- “quem chama essa função?”
- “onde está a definição desse símbolo?”
- “quais testes cobrem esse módulo?”
O modelo não deveria receber o repositório inteiro, nem um pacote montado na mão. Ele deve operar sobre uma camada consultável e verificável do código.
A IA não deveria ler lixo. Mas também não deveria depender de um humano separando o lixo antes. Ela já é boa o suficiente para chamar as ferramentas certas.