Boa iniciativa, mikatronico, parabén!
Vou dar uma olhada assim que passar o aperreio.
Estou procurando/fazendo/tentando uma coisa parecida, mas ainda não me dei por satisfeito com o que eu já vi, inclusive Spec-Driven Development. Não por achar que são ruins, mas só porque acho que a abordagem que prefiro é outra, mas também não estou certo se é tão melhor assim.
Em vez de ter arquivos md, json e yaml como fonte de verdade, eu, como desenvolvedor, prefiro muito mais escrever as classes de domínio(e cabeçalho dos testes) na linguagem de programação que estiver usando e jogar o restante pra IA resolver. Por exemplo, estou tentando aplicar agora em sisteminha em Django, eu simplesmente escrevo os models e o OpenCode vai fazendo o restante.
Na verdade, o meu sonho é criar apenas o diagrama de classes em MermaidJS, PlantUML ou algo parecido e os agentes geraram o código completo, dessa forma ficaria até independente da linguagem de programação. Aí até usaria os arquivos md, json ou yaml, mas só como suporte ao verdadeiro núcleo, que seriam as classes.
Pelas minhas contas daria pra economizar uma ruma de token, já que muitas das tarefas poderiam ser feitas só com if/else ou até um pouco que de IA simbólica que é bem mais barata e determinística. O Django do Python já faz algo bem parecido, mas ainda acho que tá faltando alguma coisa.