Obrigada pelo comentário detalhado — concordo plenamente com a ideia central. Também cheguei à conclusão de que a escolha do modelo (Llama / Mistral / Qwen, etc.) influencia a qualidade apenas até certo ponto. A partir daí, o fator limitante passa quase sempre a ser não o próprio modelo, mas a arquitetura que o envolve.
Isto é particularmente evidente na área da saúde. Mesmo com treino ou afinação baseados em fontes médicas validadas, o problema das alucinações não desaparece. Atualmente, estamos a concentrar-nos nos seguintes pontos:
- Estruturação dos dados de entrada
- Tentativa de controlo da camada de raciocínio
- Normalização e padronização dos dados médicos, construindo o nosso próprio RAG