Não é workspace mal configurado nem uso errado. Meu sistema é openCode com múltiplos MCPs, motor de skills próprio feito pra economizar token, e agentes que controlam servidores inteiros com dezenas de projetos. Só um desses projetos tem 76 mil arquivos de código – código real, não CSV.
Não fico enviando contexto inteiro repetidamente. O que acontece é: meus agentes fazem operações reais em escala industrial – leem arquivos sob demanda, executam skills, interagem com servidores, coordenam mudanças. O consumo de token não vem de desperdício, vem de volume legítimo de trabalho.
O que eu não falei ai e eu uso aqui, é que Cada MCP pode ter um modelo de ia interno fazendo tarefas e tornando o MCP ainda mais inteligente.
Sua migração de 300k linhas em 2 semanas é um pipeline linear. Meu sistema é distribuído, concorrente, com agentes atuando em múltiplos fronts, tem até agentes que conversam entre si porque tem agentes no servidor de backup que agentes em produção precisam conversar e solicitar auditorias. A cota da OpenAI (mesmo o plano mais caro) é ridícula pra esse nível de automação real. Por isso estourei em 1 dia – produção de verdade, não brinquedo. E por isso muitas empresas estão cancelando licenças de IA sacou?
E não, não tem plugin de marketplace nem skill ineficiente. Tudo feito sob medida pra gastar menos token possível. O problema é que "menos" ainda é gigante quando o domínio tem projetos desse tamanho e ainda + servidores, porque os agentes também monitoram segurança. 😉
Eu gero meio milhão de tokens facilmente em um hora ou menos. Minha ultima semana deu Tokens = 739,051,792 (mas essa foi uma semana atipica com alguns lançamentos de clientes.)
Agora o que é realmente interessante, para o meu consumo mensal normal, quando não tem pontos fora da curva como essa semana passada eu costumo gastar 375 dolares para gerar um absurdo de automações, por isso indico a deepseek, sem sombra de duvida vale o custo beneficio, e eu estou usando o modelo v4 pro na maioria das solicitações, que é o mais caro deles.
Eu fiz um post inclusive mostrando como criar um MCP para ia, ele demonstra de forma sutil como funcionam essas camadas de automação.
https://www.tabnews.com.br/macnator/model-context-protocol-mcp-a-nova-camada-de-abstracao-que-todo-desenvolvedor-precisa-entender
O que eu não mostrei ai e que eu faço aqui é que cada MCP voce pode colocar outros modelos de IA dentro dele.