Obrigado pelo tempo gasto me ajudando, você explicou exatamente o tipo de nua... · Firmino

Respondendo a "Meus 2 cents, Obrigado por compartilhar - este..." dentro da publicação RAG em Documentos Longos: Desequilíbrio entre Contexto Global e Precisão Local

Firmino

3 meses atrás

Obrigado pelo tempo gasto me ajudando, você explicou exatamente o tipo de nuance que costuma passar despercebida.

No meu caso, o sistema que está em produção já usa uma arquitetura híbrida bem mais profunda do que apenas RRF: o Qdrant faz o prefetch combinando dense + BM25, aplica late interaction (ColBERT) dentro do próprio banco e, depois disso, ainda passo os candidatos por um cross-encoder na aplicação para tentar eliminar falsos positivos. Isso resolve muitos casos práticos, mas ainda não é suficiente quando o problema acontece na fase de prefetch, onde os cabeçalhos com termos recorrentes preenchem todas as vagas antes mesmo do reranker ter chance de ver os chunks relevantes.

Achei interessante a sua sugestão do modelo small-to-big com relação pai/filho. Eu já fiz alguns testes nessa direção, mas seguindo um fluxo um pouco diferente. Do jeito que você descreveu, micro-chunks para buscar, macro-chunks para entregar contexto, faz bastante sentido como estratégia para evitar que headers “fortes” matematicamente coloquem os trechos específicos para fora do top-K inicial.

Agradeço pela explicação detalhada e pela sugestão prática. Vou testar essa lógica de parent-child retrieval de forma mais sistemática nos próximos ciclos. Excelente contribuição, obrigado mesmo!

Oletros

3 meses atrás

Meus 2 cents extendidos,

Fico contente se agregou algo.

Espero que voce consiga achar uma solucao que adequada para tua situacao.

E, se nao for segredo industrial - por favor, nao esqueca de compartilhar o caminho seguido (este tipo de problema eh instigante).

Saude e Sucesso !