é uma pesquisa semântica, a intenção é substituir as chamadas de grep que llms geralmente fazem.
Interessante. Então, está funcionando da mesma forma que o th0th, haha. O th0th faz justamente isso, indexa todo o projeto e te permite realizar busca semântica, busca híbrida, entre outros.
Instalei aqui e rodei alguns testes. Vou continuar testando nos próximos dias. Achei bem legal mesmo.
Eu vi que existe um mecanismo de indexação.
Uma dúvida: existe algum tipo de mecanismo de auto-indexação?
Pergunto porque para ferramentas RAG de documentos que não são frequentemente alterados, a indexação é realizada basicamente uma única vez.
Agora para código, quando o código é indexado, cria-se uma segunda referência: o código em si e a indexação vetorial.
E conforme o código muda a indexação precisaria mudar também, caso contrário referenciaria código obsoleto. Procede?
Qual seria a melhor forma de automatizar isso? Hooks?
Sua pergunta procede totalmente. Código muda constantemente e a indexação precisa acompanhar, senão vira referência para código fantasma.
O Th0th já resolve isso hoje com detecção automática de staleness: a cada busca, o IndexManager compara os mtimes dos arquivos no disco contra a última indexação. Se detecta mudanças, faz reindexação incremental -- só reprocessa os arquivos alterados, não o projeto inteiro. Índices com mais de 24h também são marcados como stale automaticamente. Após qualquer reindexação, o cache é invalidado e re-aquecido com as queries mais frequentes.
Além disso, adicionei uma atualização recente, que inclui um job de consolidação em background que roda a cada 5 minutos, aplicando decay adaptativo nas memórias (decisões decaem lento, conversas decaem rápido), podando memórias obsoletas e limpando arestas órfãs do Knowledge Graph. O AutoCheckpointer cria snapshots automáticos de tarefas longas a cada N operações, e o Knowledge Graph extrai relações automaticamente sempre que uma nova memória é armazenada.
Estou adicionando melhorias como watch mode com file system watchers e integração com hooks de git para reindexação ainda mais reativa.
Muito legal. Vou testar essa semana. Alguma indicação de instrução para usar no CLAUDE.md? Quero tentar algo como "Em vez de grep, utilize a tool t0th_search para buscas no codebase".
Alguma sugestão para as outras tools?
Boa!! obrigado!