Nunca enfrentei limite da janela de contexto ou custos crescentes de API.
No primero os modelos que uso comprimem a conversa ao atingir o limite, tem funcionando bem pra mim, imagino que em códigos mais complexos deve dar algum trabalho.
E até o momento a combinação de muitos modelos gratuitos mais minha assinatura do Codex e do Windsurf tem me dado o suficiente pra usar no mês.