Meus 2 cents,
Obrigado por compartilhar !
Achei o paper interessante - alguns comentarios:
-
Como o proprio paper avisa, um dos grandes limitadores eh a qualidade do sumario: se esta qualidade for boa, a memoria retorna dados mais condizentes - caso contrario fica contaminada.
-
O TTL precisaria ser ajustado pela data do ultima acesso ao assunto geral, e nao somente pela data do acesso ao EU em si. Veja, digamos que pesquisei sobre "meningite" e isso gerou varios EUs e foram para a memoria. Mas fiquei sem acessar o assunto por um tempo superior ao TTL - neste caso, o EU seria retornado e desprezado, mesmo que tenha relevancia, simplesmente porque o TTL expirou.
-
No paper cita o Cassandra - ate entendi o porque (p.ex. pela facilidade de particionar) mas tenho duvidas se vale a pena entrar neste merito sem discutir outros aspectos das tecnologias a serem utilizadas.
-
A busca eh feita apenas pelos embending (semantica) - talvez seja interessante aqui implementar/possibilitar outros tipos de pesquisa (graphRAG/agenticRAG) e/ou reranking para determinar o resultado/EU mais adequado.
Recentemente teve um post sobre o assunto:
https://useskald.com/
O que descobrimos ao tentar fazer nossos agentes de IA entenderem a própria empresa
Excelente iniciativa, parabens pelo trabalho.
Por favor, continue postando sobre o assunto - diversas pessoas (inclusive eu) temos muito interesse neste tipo de artigo.
Saude e Sucesso !