Executando verificação de segurança...
14

Dúvida sincera: Claude code Pro oferece tokens sufientes para refatorar um sistema inteiro ?

Na empresa onde trabalho, a gente tá naquele cenário clássico: refatorar sistema legado enquanto bugs continuam surgindo em produção.

Não existe “pausa pra organizar a casa” — é basicamente trocar o pneu com o carro andando.

Recentemente resolvi investir em ferramentas de IA pra acelerar meu fluxo como dev fullstack. Comecei usando o Cursor.

No começo, a experiência foi boa. A produtividade realmente sobe quando você consegue usar bem essas ferramentas no dia a dia.

Só que em cerca de 15 dias, os tokens acabaram.

E aí começou o problema.

O Cursor ainda tem o modelo próprio deles, o Composer, mas sendo direto: não dá conta.
Principalmente em contexto mais complexo, como código legado, onde precisão e contexto fazem muita diferença.

Agora tô num dilema:

continuar pagando por uma ferramenta com limitação de tokens
ou migrar pra algo mais robusto, como Claude Code (plano Pro)

Mas tem um ponto importante: eu não tenho certeza se o plano Pro realmente cobre o volume de uso que eu preciso no dia a dia.

Porque não é só sobre ter acesso aos melhores modelos — é sobre conseguir usar sem ficar se policiando o tempo todo.

No meu cenário, eu dependo bastante de:

  • múltiplas interações pra entender contexto
  • refatorações incrementais
  • ajustes finos depois da primeira resposta
    Ou seja, não é um uso pontual. É contínuo.

E aí entra a dúvida real:
o plano Pro aguenta esse ritmo ou eu vou bater em limite no meio do trabalho de novo?
Porque passar por isso uma vez já foi ruim. Repetir seria pior ainda.

Carregando publicação patrocinada...
4

Meus 2 cents,

Parabens, voce destravou a fase "tokens, tokens, tokens".

Resposta simples: nao - agentes de codificacao (claudecode, codex, antigravity) comem tokens como se nao houvesse amanha.

Mesmo pago a quantidade geralmente nao eh suficiente.

Aqui voce vai ter de ser muito estrategico: por exemplo usar um modelo pago apenas para planejamento, criar um checklist do que precisa ser feito e usar modelos free e/ou locais para refatoramento seguindo o checklist.

Existem dicas de criar multiplas contas free (p.ex. google) e ficar fazendo "switch" entre elas.

De uma olhada no OmniRoute - talvez ele possa te ajudar como um 'hub' para multiplas conexoes e tentar vencer este tipo de dificuldade.

Saude e Sucesso !

1

Não é meio arriscado usar modelos free para mexer no código de projetos de empresas privados? Falo porque normalmente esses modelos usam os dados para treinamento. (Ninguém nem sabe se os outros modelos também não fazem isso mas... pelo menos falam que não)

1

Meus 2 cents extendidos,

Suas preocupacoes sao legitimas !

Mas aqui gosto de dividir em alguns pontos separados:

  1. Dados usados para treinamento: seja em modelos pagos (flagship como chatGPT, Gemini, Claude), pagos baixo custo (via openrouter) ou mesmo free (tambem via openrouter), sempre existe a duvida de estarem usando os dados para treinamento - como eh tudo 'caixa preta' a verdade eh que nao temos como saber exatamente o que vao fazer com isso, exceto o que se propoe via 'termos de uso' (mas se tem uma coisa que o evento 'Facebook–Cambridge Analytica' ensinou eh que entre o que uma empresa diz que faz e o que ela faz vai uma distancia imensa).

  2. Porem, existe a possibilidade de rodar modelos 'open weights' localmente (ou em uma GPU cloud alugada) onde voce tem 100% de controle e sem riscos de vazamento - no caso de uma GPU cloud o problema eh custo/hora.

Enfim, nao existe saida simples: tudo vai depender das escolhas (trade-offs) que voce quer fazer: api cara (modelos flagship), api barata (openrouter), api free (openrouter), localmente (mais lento) ou gpu cloud (custo/hora).

Saude e Sucesso !

1

Essa coisa de ter múltiplas contas você testou? Funciona com quais IAs? Uma que eu testei não adianta ele pega o IP e diz que acabou o free, cai o modelo. Ou só deu certo com o OmniRoute?

S2


Farei algo que muitos pedem para aprender a programar corretamente, gratuitamente (não vendo nada, é retribuição na minha aposentadoria) (links aqui).

2

Sobre a questao de multiplas contas, tem forum que participo onde o pessoal relata sucesso usando o OmmiRoute, e aqui mesmo no TABNEWS foi postado recentemente (menos de 2 meses, creio) sobre o uso de varias contas com modelos.

No meu caso, o que tenho usado eh: Gemini + Antigravity + Contas Google: funciona de boa (uso uma conta google coorporativa workspace e quanto acaba os creditos mudo para conta pessoal, e segue normal).

Saude e Sucesso.

3

Não irei falar sobre tokens, irei falar sobre programação de verdade.

Já trabalhei em um sistema legado, carroça, cheio de bugs de arredondamentos de valores, e eu já quis arrumar toda aquela bagaça pra se livrar dos infinitos atendimentos q entrava só pra corrigir 1 centavo no relatório do cliente.
Qndo estava lá, eles nunca deixaram eu tocar nessa parte e sabe q isso foi bom? pq se eu começasse a arrumar, iria dar um BO dos enormes, simplesmente pq o sistema estava parcialmente protegido contra problemas.
E o q seria essa proteção? TESTES... testes de unidade, testes de integração, testes e2e... sejá lá o q for, faltava testes por todo sistema.
A gente estava fazendo isso aos poucos, mas o sistema era gigante. Impossível arrumar tudo aquilo, sendo q o sistema ainda era dividido em 5 equipes. Imagina o pepino q iria dar.

Então assim, antes msm de querer ficar trocando a roda do seu sistema, aprenda a colocar sistemas q monitoram a condição do pneu.

Outra dica. Ao invés de arrumar tudo de uma vez, pq não fazer por partes? Sério, não tente bancar o herói. Vc não tem poder pra isso, mto menos a IA q temos atualmente. Pegando o assunto anterior, pega uma parte do sistema e protege ele com testes de como ele deve se comportar. Depois use IA ou seja lá o q quiser para dar manutenção especificamente naquela parte. Ela não pode ser dependente de outras partes, então nada de alterar o core do sistema, começe pelas bordas. Ai conforme vc for protegendo as bordas e refatorando as bordas, vá pulando para o core. O core é o ultimo a modificar.
Pq disso? simples, pq se vc alterar o core, vc obrigatoriamente irá ter uma enorme chance de quebrar tudo q depende dela.

Então sobre isso, vá com cautela, faça trabalho de formiga. Tu não é o superman, lembre disso. Comece pelo q vc consegue proteger nas bordas e depois vá indo para as partes q tem mais ligações.

É chato, é difícil, é cansativo. Mas se vc quer melhorar algo, não quebre o q já está funcionando, msm q capenga.

Boa sorte ai no teu trabalho.

1

Faz toda a diferença quando se tem testes unitários com via cobertura e de integração na hora de trabalhar com IA porque é parte da orientação delas de como entregar a tarefa. Dependendo de qual LLM e de como tu trabalha a própria IA entrega, testa, revisa, corrige.

Mas... No Brasil... Quem faz teste unitário? 🤣

1

Eu uso o GitHub Copilot Pro + Gemini + Antigravity + Warp + Agent Zero e tá dando conta (links no final da página).

O Github Copilot Pro libera acesso aos modelos bons (Claude Sonnet...) mas tambem tem muitos modelos free para tarefas menos complexas, análise de código e code review (Grok, Rapror). Iso diretamente no fluxo de trabalho junto ao VSCode, mas todos os meus projetos tem instruções e skills para os agentes não perderem tempo, não fazerem caca e seguirem sempre trabalhando baseado na documentação para não sair do rumo e disperdiçar tokens.

Tenho uma conta Google One AI que dá 2tb de espaço no Drive pra família alem de outros recursos. Com isso criei Gems no Gemini com papéis bem especificos e conhecimentos sobre ferramentas que utilizo (Gem do Sysadmin pra ajudar na infra, Gem de Devops para ajudar com questoes mais especificas de deploy). Então, eventualmente, abro o Gemini e tiro duvidas tecnicas ou compartilho o repo para ajudar em analises. Pra isso Gemini é excelente.

O Antigravity que uso em paralelo ao copilot está com a minha conta do Google One AI e uso esporadicamente (porque não gosto muito mesmo :p).

Também uso Terminal Warp para comando de build, deploy, etc que tem alguns tokens free e eu gasto mais quando tenho problemas pontuais como gestão de pacotes e builds quebrados.

Por fim, Agent Zero: uma suite free e open source que tu conecta no Open Router que por sua vez tem conexões com muitas LLMs conhecidas, menores e até gratuitas. O problema aqui é que LLMs gratuitas tem poucos tokens disponiveis e rates muito baixo alem de serem temporárias. Ainda por cima o Agent Zero recém lançou versão 1.0 então tudo que criei até agora pra resolver esse "problema" (incluindo uma customizacao para rotacionar tokens) se foi e tenho que customizar de novo (ou pegar algum plugin pra isso da recém inaugurada loja de plugins dele). Se eu tivesse mais infra poderia subir um Llama, mas não é o caso...

Levo algum tempo pra embarcar as ferramentas porque tenho que gerar as instruções para cada projeto (na verdade as próprias ferramentas fazem isso) mas a otimização e o resultado em termos de tempo e qualidade da entrega é gritante.

As vezes, dependendo da complexidade da tarefa, uso o "spec-kit" que, nas vezes que usei (criei plug in do drone CI, estensão do VSCode, um servidor de CUPS com impressoras brother pre configuradas, etc), faz o trabalho bem feito numa conversa só.

Em resumo são duas contas pagas (Copilot e Google One) e o resto é jogo de cintura com as opções free.

E eu comecei a mexer com IA na programação justamente porque estava trabalhando em um legado de PHP/Laravel + Postgress deprecado e bagunçado. Cada PR que eu fazia já refatorava pelo menos um serviço novo e limpava um caminhão de complexidade das controlers. Fui implementando testes unitários que ajudava a IA a se orientar também.

Ferramentas citadas:
https://www.warp.dev/drive
https://antigravity.google/
https://www.agent-zero.ai/
https://github.com/github/spec-kit

Planos:
https://one.google.com/about/plans?hl=pt
https://github.com/features/copilot/plans?locale=pt-br

0
1
1

Acho que usando o Cursor comprando créditos sob demanda é ainda mais vantajoso. É geralmente o que eu faço.

Utilizo os tokens do pacote até onde dá, e quando preciso de mais, acabo indo no on demand, e o meu projeto também é complexo.

Para otimizar, coloque o Cursor nos modelos do Gemini e Sonnet como default, e use o Opus só para decisões mais profundas.

Use e abuse das skills e escreva seus prompts em inglês.

1

Esse problema surgiu pois estão dependendo fortemente de uma moleta (IA) para isso. Eu recomendo estudar e adquirir preparo pois tocar sistema legado não é tão simples quanto parece, especialmente com IA.

Livro essencial: Refactoring: Improving Desing Existing Code

Não sabemos o escopo do projeto também. Quando maior o escopo, maior a probabilidade do modelo generativo errar, afinal isso é puramente probabilítico.

Se tiver mais conhecimento sobre, precisará de menos prompts, economizando mais. Prompts esse que irá fazer a atividade braçal e não assumir o controle. Se o sistema é crítico, nem deveria ter IA envolvida na escrita do código para começar.

1

A questão não é essa...
O autor do post muito provavelmente sabe refatorar um sistema legado e tem experiência para isso, a questão é o tempo que isso leva para ser feito no estilo "old fashioned", e a empresa não quer um funcionário meses debruçado em uma refatoração, para ela isso gera custos enormes.

Usar IA para aumento de produtividade nesse processo faz total sentido, quando supervisionado por um dev experiente.

1

Pelo pouco que conheço, não vai dar conta.

Estamos experimentando o uso de IA na empresa onde trabalho. Estamos com um plano pago (não sexatamente qual).

Ajuda bastante em alguns casos, mas não dá para usar para tudo. Os tokens acabam muito rápido. Uma tarefinha e lá se vão os tokens.

O consumo ainda é muito grande, tem horas que mesmo mandando restringir, ele lê mais coisas e consequente mente gasta mais tokens.

1

então....refatorar um sistema inteiro, tudo junto, ao mesmo tempo...não é exatamente uma abordagem muito recomendada.

Alem do que, sem mais nenhum detalhe do legado, tamanho ou quantidade de funcionalidades para tentar comparar se com alguem que já fez algo parecido, qq opinião é um tiro no escuro.

meus 0.02? teste....paga um mês do plano mais caro e veja até onde vai, só assim vai descobrir se da conta ou não.

1

Acredito que isso tem mais relação com a maturidade do time e da arquitetura do sistema do que com a aplicação da IA no processo.

Por exemplo, se estivéssemos 6 anos atrás, um trabalho como esse levaria mais ou menos tempo de acordo com a competência do time em codificar mas principalmente em arquitetar a refatoração.

Pois uma refatoração mal planejada gera muito mais retrabalho, uma coisa é trocar o pneu com o carro andando e outra é trocar o pneu com carro andando sem planejamento nenhum ou com planejamento ruim.

Nos dias de hoje, você vai adicionar IA na receita, ela vai potencializar tudo isso que eu falei, então uma boa arquitetura tente a dar melhores resultados que daria sem IA, uma má arquitetura vai no sentido oposto, tente a dar resultados bem piores ao adicionar IA. E isso vai refletir no consumo dos tokens, pois projetos mal feitos vão precisar de mais retrabalho e por tanto mais consumo de tokens.

Ou seja, não use IA para definir estratégia.

1

Claude code Pro oferece tokens sufientes para refatorar um sistema inteiro ?

NÃO

Me decepcionei genuinamente com o claude code pela ficção do modelo de tokens dele, Tem sessão diária (que pode esgotar com um prompt), tem sessão semanal e tem overpaid que come grana pra disgraça

o plano pro do code pode acabar em minutos em uma tarefa comopleta.

1

Para início de conversa, a resposta é: NÃO!

O plano Pro é 'freemium': você paga para ter uma mixaria de tokens e fica preso a isso. Fazem de propósito para você assinar o Max.
Por outro lado, o plano Max de 550 lulas é surreal. Os tokens diários duram mais tempo e tem os tokens semanais, que duram bastante também. Usamos aqui na empresa e já refatoramos sistemas legados e complexos em dias, usando apenas 30% dos tokens, e olha que ainda tem bastante.

Inclusive, dá para usar em 3 dispositivos simultaneamente. Em outro caso, testamos a mesma conta Max em 5 dispositivos diferentes e tivemos a conta banida; então, o seguro são os 3 que testamos até agora. Dá até para assinar com mais 2 pessoas e usar o Claude Code pelo terminal, pois o histórico fica salvo apenas na tua máquina e não fica no histórico para todos os usuários verem, a menos que você use lá na área do chat na web ou app.
Bom, essa foi a experiência que tivemos aqui na empresa. Outra coisa: eu alterno muito entre Sonnet e Opus. Uso o Opus para casos mais complexos, mas consome token igual um crackudo kkkkk.

1

O plano da claude de 1000 reais é literalmente um roubo. no melhor sentido possivel.
equivale a mais de 20 mil em tokens se vc fosse pagar por eles.

1

Desculpa se eu falar algo que ja falaram aqui nos comentários. Mas esse ultimo mês a minha empresa precisou refatorar TODA a arquitetura. Resolvemos fazer serviços novos, totalmente do zero. São uns dez projetos. Estamos usando apenas UMA conta Claude Pro, a mais cara. Todos os devs estão logadas nela. E nem chegamos perto de estourar o limite.

Vale lembrar que nao estamos usando tokens por api. Fizemos o login na conta do Claude, no vscode de cada dev.

1

O correto é preparar o projeto para ser refatorado.

Por exemplo estou refatorando um projeto em Delphi. O primeiro problema é justamente que tem arquivos gigantes que contém ícones e imagens. Então tem que criar um script pra deixar o código enxuto.

Ajustes assim vai reduzindo seu consumo de tokens.