4 min de leitura ·

E se você pudesse usar Claude Code 41x mais barato?

Calma, isso não foi clickbait!

A realidade é que o Claude, IA da Anthropic, é conhecido por possuir os melhores modelos do mercado (a julgar pelo meu limitado conhecimento), mas tem um efeito colateral bem enfatizado: ele também é o mais caro.

Os limites de sessões tendiam a atingir rápido! Felizmente não tão rápido agora, graças à parceria estabelecida para uso dos colossus do Elon Musk (https://www.anthropic.com/news/higher-limits-spacex); e principalmente mais assustador eram os limites de uso semanal.

Mas, ainda assim, o custo em si do Claude continua gigante, por isso tem uma enxurrada de vídeos no YouTube calculando o custo-benefício das IAs.

Agora, se você usa Claude Code, abre um projeto XYZ qualquer e digita: /context.

Fez? Eu fiz e veja:

❯ /context
  ⎿  Context Usage
     ⛁ ⛁ ⛁ ⛁ ⛁ ⛁ ⛁ ⛁ ⛁ ⛁   Sonnet 4.6
     ⛁ ⛁ ⛀ ⛶ ⛶ ⛶ ⛶ ⛶ ⛶ ⛶   claude-sonnet-4-6
     ⛶ ⛶ ⛶ ⛶ ⛶ ⛶ ⛶ ⛶ ⛶ ⛶   26.3k/200k tokens (13%)

     Estimated usage by category
     ⛁ System prompt:   6.3k tokens (3.1%)
     ⛁ System tools:   10.3k tokens (5.2%)
     ⛁ Custom agents:   2.1k tokens (1.1%)
     ⛁ Memory files:    3.9k tokens (2.0%)
     ⛁ Skills:          2.8k tokens (1.4%)
     ⛁ Messages:          794 tokens (0.4%)
     ⛶ Free space:    140.7k tokens (70.4%)
     ⛝ Autocompact buffer: 33k tokens (16.5%)

Tradução: cada janela de contexto do meu claude-sonnet-4-6 possui 200k tokens, e antes de mandar um comando sequer, aproximadamente 27k tokens já foram embora. Além de esgotar o contexto rapidamente, isso é dinheiro indo pelo ralo.

Skills/plugins instalados, o prompt do próprio Claude, coisas que talvez nem sejam úteis, porque talvez só precise corrigir um bug minúsculo.

Bom, até aqui o plano era mesmo te assustar.

Agora, para quem lê o Akita on Rails, provavelmente já viu o post:

LLM Benchmarks: DeepSeek Destravado! Use DeepClaude
https://akitaonrails.com/2026/05/04/llm-benchmarks-deepseek-unlocked-deepclaude/

No geral, o Akita nos fez entender que compensa muito usar o DeepSeek como substituto ao Claude para várias tarefas! Principalmente porque, além de produzir o mesmo resultado quando rodado no mesmo "harness", é muito mais econômico.

Só pra você saber:

DeepSeek-V4-Flash é 825x mais barato no input e 41x mais barato no output que o Claude Sonnet 4.6.
DeepSeek-V4-Pro é 1.100x mais barato no input e 23x mais barato no output que o Claude Opus 4.7.

O DeepSeek é ordens de magnitude mais barato. Só que a documentação deles (https://api-docs.deepseek.com/quick_start/agent_integrations/claude_code) para configurar no harness do Claude, mostra que na pratica, você está substituindo os modelos da Anthropic pelos do DeepSeek.

Mas a ideia é proporcionar uma escolha: qual modelo você quer usar?

Eu fui descobrir a existência do DeepClaude pouco depois de construir o meu próprio Switcher! Fiz uma avaliação e considero o meu ccs (Claude Code Switcher) mais aconselhável para o meu fluxo: https://github.com/lizzyman04/claude-code-switcher

Primeiro vamos estabelecer que: o DeepSeek V4 Pro atinge nível A em benchmarks de codificação quando executado no loop de agentes do Claude Code (do experimento do Akita).

Agora, aqui vai uma comparação justa das duas opções:

	DeepClaude	ccs (Claude Code Switcher)
Repo	aattaran/deepclaude	lizzyman04/claude-code-switcher
Abordagem	Session wrapper	Profile manager

Ambas as ferramentas usam o mesmo truque: sobrescrever ANTHROPIC_BASE_URL + ANTHROPIC_AUTH_TOKEN + ANTHROPIC_MODEL antes de lançar o Claude Code. O loop de agente (edição de arquivos, execução bash, subagentes, uso de ferramentas) roda de forma idêntica nos dois.

A única coisa que muda é que:

O DeepClaude otimiza para sessões únicas sem estado.
O ccs otimiza para conveniência diária com persistência.

Comparação

O que o ccs faz que o DeepClaude não faz

ccs clean — lança Claude Code sem seus agents, skills e memory files. Isso é massivo pro problema que levantei dos 27k tokens consumidos antes do primeiro comando.
Perfis persistentes com switch — você configura uma vez, depois claude sempre usa o provedor ativo.
Alias deepseek — não precisa lembrar nenhum comando.
Adicionar qualquer provedor — não fica preso a deepseek/openrouter/fireworks. Se a API fala Anthropic-compatible, você pode adicionar.

O que o DeepClaude faz que o ccs não faz

Sessões verdadeiramente sem estado — nada é salvo em disco por padrão. Melhor para benchmarks isolados.
Design mais simples — só env vars, sem symlink, sem arquivos de config.

Por que prefiro o ccs que construí?

O DeepClaude é ótimo para experimentos pontuais — você roda uma sessão, ela acaba, tudo volta ao normal.

Mas meu fluxo diário é diferente:

De manhã, ccs deepseek — e o dia inteiro o claude usa DeepSeek
Quando quero usar Sonnet ou Opus volto em 1 segundo com ccs anthropic
Quando quero rodar algo sem mudar meu perfil padrão ccs run deepseek! Assim que termino a sessão, ele volta ao Claude normal

Bottom line

Claude Code é incrível. Mas o DeepSeek entrega mesma (ou melhor) qualidade por uma fração do preço.

⚠️ Disclaimer: como o Akita apontou, o DeepSeek no harness do Claude tem limitações: sem suporte a imagens, sem MCP, sem prompt caching da Anthropic. Mas para tarefas de código puro isso é irrelevante.

Oletros

15 horas atrás

Meus 2 cents,

Parabens pela iniciativa !

A questao de gasto com tokens no uso de IA/Agentes tem surgido com mais frequencia no radar dos DEVs (e se nao tomar cuidado, fica MUITO caro).

Uma solucao que tenho usado eh o OmniRoute, que permite cadastrar diversos tipos de provider LLM e criar cotas/combos para que quando um acaba faca a troca automatica.

Obrigado por compartilhar !

Saude e Sucesso !

Este post foi favoritado via extensão TABNEWS FAVORITOS

Tem curiosidade sobre IA ? Da uma olhada no meu LIVRO: IA PARA ENGENHEIROS

lizzyman04

Autor

13 horas atrás

Valeu! Não conhecia o OmniRoute, vou dar uma olhada! é interessante. Obrigado por compartilhar!

williamlopes

14 horas atrás

Achei interessante seus pontos e sua proposta, mas tem algo aí que não faz sentido.

Vc disse que prompt caching é irrelevante, mas isso é um erro grosseiro. Usar esse tipo de cache é justamente o que deixa viável o agentic com tool calling. Imagina toda vez pagar o valor cheio de input, sendo que poderia ser apenas uns míseros décimos de centavos? Esse ponto é extremamente crucial para esse benchmark. Aliás, recomendo ter uma comparação palpável com numeros e dados, porque só comparar o preço da API não é uma comparação real.

Pega um prompt complexo, passa para ambos, coloque os problemas, os pontos chaves e o custo em relação a entrega. Vamos ter aqui uma visão muito mais clara da comparação.

Valeu por levantar a discussão e propor sua solução.

lizzyman04

Autor

13 horas atrás

Ponto válido e bem colocado; eu generalizei demais ali. O prompt caching da Anthropic de fato muda a conta. O que quis dizer é que para alguns casos frequentes (sessões curtas, código puro, sem pipelines complexos) a ausência do caching não foi determinante.

Ainda sim, seu ponto contínua válido e bem colocado.

Obrigado pelo feedback!

gustainmars

15 horas atrás

Achei muito massa sua solução! Mas uma dúvida que fiquei foi: e como fica a questão de cobrança do DeepSeek? No primeiro uso vai solicitar uma api key, algo do gênero? Desculpa a ignorância, mas é que queria entender como funciona pra não ter surpresas depois hehe

lizzyman04

Autor

13 horas atrás

Boa pergunta! Sim, você precisa criar uma conta na DeepSeek e gerar uma API key em https://platform.deepseek.com/. O modelo de cobrança é pay-as-you-go, você deposita primeiro e a API desconta pelo uso. O valor mínimo para recarregar é bem baixo ($2) e dá pra construir uma MVP simples inteira só com isso.

O preço é por token que mencionei no post (veja https://api-docs.deepseek.com/quick_start/pricing), dura bastante. Não tem surpresa, você controla o quanto deposita.

lukexp

20 horas atrás

Eu sou assinante Claude, chatgpt, gemini e exatamente isso que ando percebendo que as outras IAs do topo estão cada vez mais próximas do que o claude oferece. A claude anda lançando ferramentas para prender o usuário como o cowork, mas as pessoas tem que levar em conta questões financeiras principalmente para tarefas agenticas.

lizzyman04

Autor

13 horas atrás

Esse é o ponto! Para tarefas agênticas o gap de qualidade está fechando rápido, mas o gap de preço continua gigante. Faz sentido usar Claude nativo quando você realmente precisa do diferencial dele, não por padrão pra tudo.

adiel

3 horas atrás

Vou tentar ajudar com algo...

Tenho testado por mais ou menos um mês os modelos de IA "abertos". Sinceramente, não cheguei a testar Opus 4.6 ou 4.7, apenas Sonnet. Então, não posso fazer uma comparação com esses. O que posso dizer é que realmente o Deepseek v4 flash é um ótimo custo benefício para código. Digo isso apos testar gpt-oss, Qwen 3.6, Kimi K2.5, MiniMax 2.7, etc.

Se alguém quiser testar esses modelos, recomendo a assinatura do Opencode GO. Custa apenas 5usd no primeiro mês e 10usd nos seguintes. Essa assinatura se converte em $60 mensais de uso. Usando o Deepseek v4 flash, é praticamente ilimitado. Se quiser usar modelos maiores como Kimi K2.5 também é o bastante - alternando com modelos menores.

O Opencode Zen é a versão PAYG. Mas, como citado em um comentário abaixo, dá acesso à alguns modelos grátis, por exemplo o MiniMax M2.5. Se não se importa com privacidade, é uma boa opção para testes.

Para quem quiser utilizar esses modelos a fundo, existem alternativas não PAYG que também parecem interessantes para mim. São elas (eventualmente, adicionarei os links):

Synthetic
Wafer
Crof

(O MiniMax coding plan é bom. Entretanto, considero lento se quiser usar para trabalho. Para testes e uso pessoal é interessante. A versão Highspeed não vale a pena, na minha opinião.)

JuanMathewsRebelloSantos

10 horas atrás

Sabe o que é mais legal que isso?
Eu uso o opencode com o DEEPSEEK V4, para tarefas de hacking, muito rápido e não pago nada.
E uso o Qeen3.6plus para programação. Estão me servindo bem até o momento.
Não pago literalmente nada e tá ilimitado até agora hehe

IvanPSG

7 horas atrás

Nao paga nada? Como isso?!

Compartilha o código do GTA com nóis kkkkkk