Economize até 10x no uso do Cursor e Claude Code · willybr

Esses dias fiz uma apresentação na empresa sobre uma coisa que vejo acontecer o tempo todo: muita gente usa direto os modelos frontier mais fortes (GPT-5.5, Opus 4.7) pra qualquer tarefa, sem se dar conta de que, dependendo do caso, dá pra economizar até cerca de 10x, e em certos casos até 60x escolhendo o modelo certo pra cada etapa. A diferença de custo entre eles é muito maior do que parece no dia a dia, e quase ninguém para pra olhar.

Pra embasar essa apresentação (e deixar fácil de qualquer um conferir os números), montei uma ferramenta: o Token Price Calculator, que compara o preço dos modelos disponíveis no Claude Code e no Cursor, lado a lado.

A informação até existe, mas está espalhada entre a documentação da Anthropic e a do Cursor, em tabelas com formatos diferentes. Juntei tudo num lugar só. Você digita quantos mil tokens (k) de entrada e saída espera usar, e ela mostra:

O custo estimado por modelo num gráfico de barras (dá pra comparar a proporção entre os modelos e entre entrada/saída rapidinho).
Uma tabela de preço por modelo com a tarifa por 1M de tokens (entrada/saída) e a janela de contexto de cada um.
Filtro pra mostrar/esconder modelos, ordenação e suporte a en-US/pt-BR (detecta o idioma do navegador).

Detalhe importante que confunde bastante: os preços por token são as tarifas de uso extra/on-demand, ou seja, o que você paga depois que o uso incluído do plano acaba. A mensalidade (Claude Pro/Max, Cursor Pro/Pro+/Ultra) é fixa e separada disso.

E tem um ponto que muita gente não percebe: a cota incluída no plano também é medida com base nesses mesmos custos por token. Então escolher modelos mais baratos não economiza só no uso extra, faz a cota incluída do seu plano render muito mais antes de você precisar pagar a mais. Na prática, o mesmo raciocínio de custo vale dos dois lados.

Stack: Vite + React, sem backend. Todos os dados de preço ficam num único arquivo (pricing.js), então é fácil manter atualizado.

Página do Projeto: https://wilsonneto-swe.github.io/token-price-calculator/
Código: https://github.com/wilsonneto-swe/token-price-calculator

A ordem de grandeza

Em uso de coding você normalmente manda muito contexto de entrada (código, arquivos) e a saída é bem menor (edições, respostas). Então um cenário realista é algo como 1M de tokens de entrada + 100k de saída. Com isso fixo, o custo de cada modelo lado a lado fica assim:

O que salta aos olhos:

O Composer 2.5 (US $0,75)** sai cerca de **10x mais barato que o Opus 4.7 (US$ 7,50) e 60x mais barato que o Opus 4.7 em Fast mode (US$ 45,00).
A diferença entre o tier mais barato e o mais caro chega a 60x, então a escolha do modelo por etapa pesa muito mais no bolso do que parece no dia a dia.

O fluxo que recomendo

Na prática, o que tem funcionado muito bem pra mim é separar as etapas: modelo caro pra pensar, modelo barato pra executar. Pras tarefas maiores e mais complexas, meu fluxo é Opus 4.7 para planejar -> Composer para implementar. O Composer do Cursor tem me surpreendido positivamente: dá conta da implementação (e até de planejar coisas menores) com qualidade, por uma fração do custo.

É justamente a tabela acima que sustenta isso: pagar Opus em todo o trabalho de implementação, onde o volume de tokens é maior, é jogar dinheiro fora pra boa parte das tarefas. Pra muita coisa do dia a dia o resultado é praticamente o mesmo, mas a conta no fim do mês não é.

Alguém aqui já usa esse tipo de fluxo (um modelo pra planejar, outro pra executar)? Queria saber quais combinações têm dado certo pra vocês.