Hoje trabalho desenvolvendo agentes IA na empresa que trabalho, coisa que me levou a começar desenvolver meu próprio framework de geração baseado em prompt e algumas tools pre configuradas, que os agentes usam.
Se existe algo que aprendi nesse caminho, é que o modelo influencia na qualidade da resposta até um "certo ponto", mas se você quer aumentar a qualidade da resposta, você deve melhorar a qualidade do input, adicionar uma camada de reasoning e com certeza uma função busca com integração a livros/revistas medicas, que informam como cada doença atua.
Só de implementar o sistema de CoT (Chain of Thoughts - Cadeia de pensamento), já deve melhorar bastante o resultado dela, espero ter ajudado.