Post extremamente relevante, eu mesmo ja caí no errado de gerar suíte de testes depois da implementação pronta.
O que rolou foi que o agente gerou testes de cobertura que passavam, porém uma regra de negócio do código base estava errada e o teste dessa regra foi feito para aceitar um comportamento que eu NÃO queria e que na verdade era um bug.