Meus 2 cents,
Parabens pelo post !
Notei que o RAG tem duas finalidades distintas: procurar por um documento e extrair informacao para gerar conhecimento - e o pipeline acaba sendo diferente para cada um, onde:
-
Informacao: dados dentro da base
-
Conhecimento: analise ou acao do usuario baseado na informacao obtida
Tenho criado pipelines de RAG usando 3 pilares: busca hibrida (semantica + metadados + resumo/abstract), graphRAG e Elasticsearch/OpenSearch - com uma interface unificada e com um LLM local como roteador direcionando para o pipeline mais adequado dependendo do prompt do usuario (existem opcoes na pesquisa que podem mudar isso, mas de um modo geral eh por ai)
Na ingestao do DOC um LLM barato (local ou openrouter) gera os metadados e abstract.
Alem disso, dependendo do tipo de documento o prompt de resumo muda: p.ex. contratos geram tambem json relativos a questoes muito usadas, livros tem json proprio, sites/posts tem outro formato - isso acaba ajudando a organizar melhor a base de conhecimento.
Mas eh uma disciplina em construcao - no final das contas sempre pergunto para o usuario: "sua questao foi resolvida ?"
Obrigado por compartilhar !
Saude e Sucesso !
Este post foi favoritado via extensão TABNEWS FAVORITOS
Tem curiosidade sobre IA ? Da uma olhada no meu LIVRO: IA PARA ENGENHEIROS