Ahhh eu entendi completamente errado então.
Essa thread do Reddit parece ter algumas dicas úteis.
Eu realmente acho que vale a pena experimentar hospedar alguma LLM e comparar os custos e o resultado. Mas, se continuar usando alguma API, além de procurar por modelos mais baratos, pode ver se o serviço que você está usando oferece um desconto, como é o caso do batch processing no Claude e batch API na OpenAI.