Valeu pelo insight!
Faz sentido testar a busca só com dense para ver o impacto real do sparse no ruído. Vou investir mais no lado denso, enriquecer melhor metadados, experimentar modelos maiores e diferentes funções de similaridade pode ajudar a ter uma recuperação mais estável, sem o viés das keywords.
Agradeço demais pelas sugestões, vou fazer os testes com essas ideias. E obrigado pela boa “ciência” de dados! 😄