Autoreflex: o servidor de memória que faz agentes de IA aprenderem com o próprio trabalho
Eu resolvi liberar como open source (ISSO MESMO DE GRÁTIS), um projeto que uso em produção há meses. Chama Autoreflex e resolve alguns problemas que qualquer pessoa que trabalha com agentes de IA já enfrentou: O gasto desenfreado de tokens, o agente esquece tudo quando a sessão acaba, ou pior ainda no meu caso o agente precisa de voce pra tudo.
Você passa horas refinando uma solução com o agente, ele finalmente entende o contexto do seu projeto, acerta as decisões, entrega o resultado. No dia seguinte você abre uma sessão nova e precisa explicar tudo de novo. O contexto saturou, os tokens foram embora, e o conhecimento que custou caro para produzir simplesmente desapareceu.
O Autoreflex resolve isso transformando conhecimento em skills. Skills são unidades pequenas de conhecimento em Markdown que ficam indexadas localmente com busca semântica. Quando o agente precisa de algo, ele consulta a skill certa em vez de reprocessar o histórico inteiro. O resultado prático é uma redução de 85% no consumo de tokens em inícios de sessão e um agente que fica mais capaz a cada tarefa que executa, porque cada execução pode gerar novas skills.
O sistema inteiro roda local. Sem cloud, sem SaaS, sem dependência externa. FastAPI como servidor, Qdrant como base vetorial, e um modelo de ia leve de embeddings que roda na sua máquina e faz o trabalho de ser o especialista em skills para devolver ao Agente principal. Sobe em Windows e Linux sem Docker.
Mas o que mudou o jogo pra mim foi usar o Autoreflex com agentes programáticos, acionados por eventos externos.
Na minha operação, quando um ticket de suporte novo chega, um agente é disparado automaticamente. Ele lê o chamado, analisa os prints que o cliente enviou, localiza o bug no código, corrige, roda os testes e responde ao cliente fechando o ticket. Sem intervenção humana. As correções e padrões de bug que ele encontra viram skills indexadas, e chamados parecidos no futuro são resolvidos cada vez mais rápido.
Uso também para provisionar servidores web do zero. O agente recebe o pedido e consulta skills com todos os passos de instalação: Apache ou Nginx, vhosts, SSL, cPanel, WHM, DNS, backup. Cada servidor novo que apresenta alguma particularidade gera uma skill nova, e a próxima instalação já contempla aquele cenário. O que antes levava horas de trabalho manual virou uma sequência automatizada.
A mesma lógica se aplica a qualquer evento que acione um agente. Um monitor detecta requisições anormais em portas inesperadas e o agente é acionado para consultar skills de segurança, analisar logs, bloquear IPs, reforçar regras de rede e documentar o incidente como nova skill. Cada ataque mitigado torna o agente mais preparado para o próximo.
Dá pra ir além. Um pipeline de CI pode acionar o agente para fazer code review automático usando skills com os padrões do projeto. Um cron job pode disparar o agente para gerar relatórios diários consultando skills com a estrutura dos dashboards. Um pull request mergeado pode acionar o agente para atualizar a documentação do projeto automaticamente. Um novo membro do time pode perguntar ao agente sobre setup, padrões e decisões arquiteturais, tudo já indexado em skills, sem interromper ninguém, sem criar novos códigos.
A ideia central é simples. Qualquer evento que acione um agente pode ser enriquecido com conhecimento prévio e gerar conhecimento novo. O Autoreflex é a infraestrutura que viabiliza esse ciclo. O agente não apenas consome conhecimento, ele produz. A base de skills cresce organicamente e vira uma memória institucional que não depende de nenhum indivíduo.
O projeto está no GitHub com licença aberta. Dá pra instalar e testar em minutos.
https://github.com/edilsonmaia/Autoreflex
Se você trabalha com agentes de IA e já perdeu tempo explicando a mesma coisa duas vezes pro mesmo agente, dá uma olhada. E se testar, me conta o que achou.