Tdd (de verdade), e alguns md, skills ou qq coisa do genero para dar as orientações de estilo, arquitetura etc resolvem o problema.
Para manter controle da IA, ela precisa seguir regras e TDD é o contrato que ela precisava. Crie ou gere testes reais e uteis, validados antes que a ia saia implementando o código final e impeça que ela altere os testes. Mantenha o controle, essas pessoas que se gabam de rodar 5 agentes em paralelo, mas não dão conta de revisar e garantir o trabalho de 1, estão contando apenas com a sorte.