Exatamente, não é só o Claude que faz isso, na verdade qualquer modelo atual com skill faz isso, por isso mesmo eu criei um sistema próprio de skills ele na verdade é mais pros usuarios estudarem do que para usar em si, pode usar se quiser claro, mas tenho certeza que para seu uso proprio seria interessante desenvolver ele para outros caminhos, mas ele dá a visão de como economizar tokens de forma global com skills ilimitadas, voce pode ver o projeto aqui: https://github.com/edilsonmaia/Autoreflex
O diferencial dele é que bem instruído o modelo le apenas as skills necessárias durante a fase do seu projeto. E não todo banco de skills, além disso para pesquisar milhares de skills ele tem acesso a um indice semantico criado por ia local sem custo que classifica e devolve somente o resumo do resultado relevante para a ia do agente que le esse pequeno resumo identifica a skill correta e carrega somente ela, se é isso que sua instrução manda fazer.
Não é um rag perfeito de skills, funciona muito bem e é uma ideia para partir. Eu mesmo uso isso de forma muito mais desenvolvida em projetos reais, com milhares de skills, que podem ser separadas por projeto, voce pode instruir o agente a salvar skills com prefixo no nome por projeto por exemplo.
O melhor uso dele é como servidor de skills fora do projeto em si, assim a ia não tem caminhos para burlar as tavas em prompt e ir pesquisar tudo sem voce ver. ela fica restrita ao que a ia local classificar para ela.
Eu na minha produção transfomei isso em MCP para integrar fácil com Codex e Opencode
recomendo ler isso: