Você relata o uso da ferramenta como um teste, e obviamente não iria confiar nela cegamente em um projeto em produção.
Eu uso o opencode direto, e abuso do modo Plan, quando você pede algo e ele traça um projeto de implementação, que você pode aprimorar antes de mandar executar. Isso não te isenta de criar (ou pedir pra IA criar) testes automatizados e ler as alterações antes de aceitar, pois sempre pode ser gerado um código no estilo "go horse"; a IA vai tentar apresentar um resultado - seja qual for!
O fato é que essas ferramentas de IA - opencode, cursor, claudecode, openclaude... - vieram para ficar. Depois que você aprende a domar a fera, fica difícil voltar a codar no braço. A questão é que essas ferramentas não devem substituir o programador, e sim promover agilidade ao processo de geração de código. O próprio autocomplete do Vscode já é uma etapa desse processo. Ajuda bastante, mas você não pode simplesmente aceitar tudo. É preciso usar com sabedoria.
PS: No meu caso, criei SKILLS que orientam o modelo a criar testes automatizados, criar branches para features e hotfixes, rodar testes e só aceitar uma alteração se passar em alguns critérios, entre eles passar 100% nos testes automatizados, seguir padrões de código e verificar erros de compilação; enquanto não passa, a própria ferramenta continua fazendo as correções necessárias, até atingir todos os critérios. Depois de finalizada a tarefa, ela gera os commits correspondentes, aí eu ainda dou uma olhada no resultado antes de fazer o merge. Assim, de programador, eu acabei me tornando PO, SM e QA, e meu time de desnvolvimento é o opencode.