Executando verificação de segurança...
15

Achei um jeito interessante de economizar tokens do Claude Code

Todo mundo sabe que o Claude Code é gastão, então, eu, no ápice da minha muquiranice, precisei pensar:

Eu pago o Gemini Pro e o Claude Code, já tentei codar com os dois, e eu constatei o que todo mundo já sabe, o Gemini é bom pra chat enquanto o Claude Code é bom pra código (quem diria?). Só que os tokens do Gemini duram absurdamente mais, e boa parte das interações com esses clientes é chat, iteração e análise de contexto, porém o objetivo final é código, então eu achei que a melhor solução era mesclar os dois, aí que eu tive que testar varias maneiras diferentes.

Primeiro eu testei sem integração, conversando majoritariamente com o Gemini, e quando a ideia estava formulada eu pedia ele para fazer um prompt para delegar para o Claude. Isso até funcionou, mas não é nada prático. É o equivalente a usar o gemini no navegador praticamente.

Depois eu pedi o Gemini pra chamar o Claude Code diretamente no CLI, e isso não funcionou, obviamente. Travava o chat e o Gemini acabava terminando a tarefa sem o Claude. Também testei ao contrário, com o Claude como o cérebro, nesse caso funcionou, mas gastou umas 3x mais tokens, o que inutilizou a ideia.

E por fim, a solução oficial, que é o que eu devia ter feito desde o início: Levantar um servidor MCP do Claude Code e conectar no Gemini. Pronto, ficou perfeito. Eu nem precisei quebrar a cabeça, apenas disse para o Gemini fazer exatamente isso e ele se virou pra subir o Claude e conectar com o MCP dele. E de quebra eu adicionei na memória do Gemini para ele lembrar como faz a conexão, e também que ele poderia/deveria delegar para o Claude Tarefas complexas.

Agora eu uso o modo /plan do Gemini, refino todo o plano no Gemini mesmo, e ele me entrega o plano dizendo quais tarefas serão delegadas. E ao meu ver isso ficou super otimizado.

E como bonus, eu também usei o OpenHands como cliente do LiteLLM conectado ao DeepSeek, só não consegui conectar via MCP com o Gemini da mesma forma, mas funciona bem se o Gemini chamar ele via CLI. Agora o Gemini tem o poder do Claude Code, o preço do DeepSeek e o desenrolo do Gemini sob demanda.

Estou considerando testar outras configurações, mas acho que essa seria melhor teoricamente. O DeepSeek é bom em preço e também em Markdown, documentação e etc, melhor até que o Gemini, porque é mais preciso. Então acho que o Gemini fica bom como orquestrador, porque de todos ele é o melhor com contexto.

Carregando publicação patrocinada...
4
2

Boa abordagem! A ideia de usar o Gemini como orquestrador via MCP é bem inteligente — separa o "pensar" do "codar" e cada modelo faz o que faz melhor.

Eu tenho feito algo parecido no meu setup de automação: uso o GitHub Copilot (Claude) no VS Code para codificação pesada e o Gemini para planejamento e análise de contexto mais amplo. A diferença é que no meu caso a orquestração é mais manual — seu approach com MCP automatiza isso de forma elegante.

Uma dica que pode complementar: se você usa o /plan do Gemini para gerar planos estruturados, dá pra salvar esses planos como CLAUDE.md ou AGENTS.md no repo. Assim quando o Claude Code pega a tarefa delegada, ele já tem o contexto completo sem precisar gastar tokens re-analisando o codebase. É basicamente um "cache de contexto" entre os dois.

Sobre o DeepSeek como terceira camada — faz sentido para documentação e Markdown, mas cuidado com tasks que envolvem lógica de negócio mais complexa. Nos meus testes ele tende a alucinar mais em edge cases.

2

Eu uso os 2 também, mas através do OpenCode, ele não tem suporte nativo para as opções de assinaturas da Anthropic e da Google, mas pode ser resolvido facilmente com plugins/extensões

2
1

Um consideração, sabe que eu achei o Gemini melhor para código novo, mas apenas o modelo de raciocínio estendido dele, quase zero erros. Ja o claude, mesmo o claude opus extendido falhou miseravelmente com código para coisas novas e mais longas por um custo absurdo.

1

Yo lo que hago es utilizar claude como cerebro, pero lo que hago es parametrizar lo que primero cree: todas las reglas, haga todo y luego delegue tareas a las demás terminales. Es decir, utilizo los cli, utilizo a Gemini, codex y utilizo Open Code con el modelo de chatGPT 5.4 y estas dos las orquesto directamente con Claude code.

¿Cómo lo hace? Cree unas herramientas donde va y mira mi pantalla y luego detecta cuáles son las terminales que tiene que trabajar, ya saben, con cuáles está trabajando, cuál es la secuencia que tiene que hacer. Uno pone hacer una tarea en un branch aparte, la otra la pone a hacer otra tarea en un branch aparte. Utilizando engram, que es una solución de gentleman, guardó todo ese contexto en memoria y, utilizando después otro Open Code con un modelo de chatgpt 5.4 para verifique todo lo que hicieron las demás terminales y le da un visto bueno y le mandó contexto a la terminal principal usando las misma harramientas que construí, que en este caso es Claude Code.

Con este enfoque, hago que Claude code solo reciba contexto de lo que él debe entender y el trabajo pesado lo hace Open Code, o Gemini o Codex.

1

Boa abordagem. Eu faco parecido, rodo Claude Code e Gemini CLI lado a lado em terminais separados no PATAPIM e vou alternando conforme a tarefa. A ideia do MCP pra conectar os dois e esperta.