Vivi a armadilha do orquestrador. Um único prompt disparava 10+ chamadas internas e eu travei retry com hard-limit pra parar a hemorragia.
Mas o número real é pior: uma vez por mês eu bato no limite do Claude Max, caio pro consumo direto por API e gasto ~¥50.000 (R$1.700) num único dia — e isso já é o ambiente onde fiz 5+ rodadas de ajuste de prompt e contexto. O ralo tem uma vazão que assusta.
LLM generativo não é substituto barato. É ferramenta cara que precisa de cálculo de hardware e mão técnica pra não virar incêndio na nuvem.