2 min de leitura ·

Achei um jeito interessante de economizar tokens do Claude Code

Todo mundo sabe que o Claude Code é gastão, então, eu, no ápice da minha muquiranice, precisei pensar:

Eu pago o Gemini Pro e o Claude Code, já tentei codar com os dois, e eu constatei o que todo mundo já sabe, o Gemini é bom pra chat enquanto o Claude Code é bom pra código (quem diria?). Só que os tokens do Gemini duram absurdamente mais, e boa parte das interações com esses clientes é chat, iteração e análise de contexto, porém o objetivo final é código, então eu achei que a melhor solução era mesclar os dois, aí que eu tive que testar varias maneiras diferentes.

Primeiro eu testei sem integração, conversando majoritariamente com o Gemini, e quando a ideia estava formulada eu pedia ele para fazer um prompt para delegar para o Claude. Isso até funcionou, mas não é nada prático. É o equivalente a usar o gemini no navegador praticamente.

Depois eu pedi o Gemini pra chamar o Claude Code diretamente no CLI, e isso não funcionou, obviamente. Travava o chat e o Gemini acabava terminando a tarefa sem o Claude. Também testei ao contrário, com o Claude como o cérebro, nesse caso funcionou, mas gastou umas 3x mais tokens, o que inutilizou a ideia.

E por fim, a solução oficial, que é o que eu devia ter feito desde o início: Levantar um servidor MCP do Claude Code e conectar no Gemini. Pronto, ficou perfeito. Eu nem precisei quebrar a cabeça, apenas disse para o Gemini fazer exatamente isso e ele se virou pra subir o Claude e conectar com o MCP dele. E de quebra eu adicionei na memória do Gemini para ele lembrar como faz a conexão, e também que ele poderia/deveria delegar para o Claude Tarefas complexas.

Agora eu uso o modo /plan do Gemini, refino todo o plano no Gemini mesmo, e ele me entrega o plano dizendo quais tarefas serão delegadas. E ao meu ver isso ficou super otimizado.

E como bonus, eu também usei o OpenHands como cliente do LiteLLM conectado ao DeepSeek, só não consegui conectar via MCP com o Gemini da mesma forma, mas funciona bem se o Gemini chamar ele via CLI. Agora o Gemini tem o poder do Claude Code, o preço do DeepSeek e o desenrolo do Gemini sob demanda.

Estou considerando testar outras configurações, mas acho que essa seria melhor teoricamente. O DeepSeek é bom em preço e também em Markdown, documentação e etc, melhor até que o Gemini, porque é mais preciso. Então acho que o Gemini fica bom como orquestrador, porque de todos ele é o melhor com contexto.

teknolista

Tem um projeto interessante chamado caveman, 'tava até testando outro dia, que ajuda a economizar tokens.

Esse outro usa a mesma teoria, mas um pouco mais complexo...

andeerc

E para melhorar ainda mais o teu cenário, configure o RTK no seu ambiente, vai te ajudar a economizar mais uns 40%/50% dos tokens consumidos pelo claude: https://www.rtk-ai.app/

DarthRoberto

Eu uso os 2 também, mas através do OpenCode, ele não tem suporte nativo para as opções de assinaturas da Anthropic e da Google, mas pode ser resolvido facilmente com plugins/extensões

lzocateli

Boa abordagem! A ideia de usar o Gemini como orquestrador via MCP é bem inteligente — separa o "pensar" do "codar" e cada modelo faz o que faz melhor.

Eu tenho feito algo parecido no meu setup de automação: uso o GitHub Copilot (Claude) no VS Code para codificação pesada e o Gemini para planejamento e análise de contexto mais amplo. A diferença é que no meu caso a orquestração é mais manual — seu approach com MCP automatiza isso de forma elegante.

Uma dica que pode complementar: se você usa o /plan do Gemini para gerar planos estruturados, dá pra salvar esses planos como CLAUDE.md ou AGENTS.md no repo. Assim quando o Claude Code pega a tarefa delegada, ele já tem o contexto completo sem precisar gastar tokens re-analisando o codebase. É basicamente um "cache de contexto" entre os dois.

Sobre o DeepSeek como terceira camada — faz sentido para documentação e Markdown, mas cuidado com tasks que envolvem lógica de negócio mais complexa. Nos meus testes ele tende a alucinar mais em edge cases.

germanheller

Boa abordagem. Eu faco parecido, rodo Claude Code e Gemini CLI lado a lado em terminais separados no PATAPIM e vou alternando conforme a tarefa. A ideia do MCP pra conectar os dois e esperta.

maicolOliveras

Yo lo que hago es utilizar claude como cerebro, pero lo que hago es parametrizar lo que primero cree: todas las reglas, haga todo y luego delegue tareas a las demás terminales. Es decir, utilizo los cli, utilizo a Gemini, codex y utilizo Open Code con el modelo de chatGPT 5.4 y estas dos las orquesto directamente con Claude code.

¿Cómo lo hace? Cree unas herramientas donde va y mira mi pantalla y luego detecta cuáles son las terminales que tiene que trabajar, ya saben, con cuáles está trabajando, cuál es la secuencia que tiene que hacer. Uno pone hacer una tarea en un branch aparte, la otra la pone a hacer otra tarea en un branch aparte. Utilizando engram, que es una solución de gentleman, guardó todo ese contexto en memoria y, utilizando después otro Open Code con un modelo de chatgpt 5.4 para verifique todo lo que hicieron las demás terminales y le da un visto bueno y le mandó contexto a la terminal principal usando las misma harramientas que construí, que en este caso es Claude Code.

Con este enfoque, hago que Claude code solo reciba contexto de lo que él debe entender y el trabajo pesado lo hace Open Code, o Gemini o Codex.

macnator

Um consideração, sabe que eu achei o Gemini melhor para código novo, mas apenas o modelo de raciocínio estendido dele, quase zero erros. Ja o claude, mesmo o claude opus extendido falhou miseravelmente com código para coisas novas e mais longas por um custo absurdo.

Dorvo

Desculpa mas que gemini é ruim de código, não é. Ma uso gera output ruim. Nenhum dos top 10 do arena sao ruin em codigo, Claude é mais consistente sim mas no geral da pra intercalar. Outro me desculpe só o fato de você nao ter conseguido fazer uma das llms usar um cli de outra já é um red flag de mau uso.

Silfar

Interessante, ainda estou engatinhando, pode detalhar como efetivamente fazer isso ?
Consegui fazer aqui e acho que ficou muito bom.