Esse fluxo de brainstorm para gerar specs funciona bem. Fiz algo parecido no BloodLink: conversas onde a IA captura requisitos e já formata em documentos estruturados, sem eu precisar sair para escrever spec do zero. O caveman que você mencionou eu não conheço ainda, mas parece interessante. O ponto que mais me mudou foi perceber que a qualidade da spec gerada depende diretamente de quanto contexto você alimenta no início da conversa: quanto mais você explica o problema, melhor o resultado. Como você está organizando as specs depois: um arquivo por feature ou tudo centralizado?
Estou testando em um produto menor, então consigo gerenciar bem o projeto. Faço uma feature por vez, especifico em brainstorm, ele gera a spec no folder .specs e depois segue o SDD. O dump é feito em um único arquivo de requisitos, um por feature e uma feature por vez (/change), mas tem hora que gera outros arquivos como modelo de dados, arquitetura, etc. Uso o OpenSpec com superpowers, então esses skills tem os próprios arquivos que eles geram e usam. Adicionei aquela skill "multica-ai/andrej-karpathy-skills" e to testando isso agora.
Uma feature por vez com spec própria é exatamente o ritmo que funciona. Contexto menor, foco maior, e você consegue revisar o que a IA gerou antes de avançar. O OpenSpec eu não conheço ainda, vou pesquisar. A skill do Karpathy também é nova pra mim, você notou diferença real no output comparado ao fluxo padrão, ou ainda está testando para ver? Curioso especialmente no lado de modelagem de dados, que é onde mais sinto variação de qualidade entre abordagens.
Ainda testando, nenhuma conclusão...