Para ter consciência do consumo de recursos, recomendo rodar local modelos menores e entender suas integrações. Só usar esse monte de serviço de llm monstro e comparar o que tem disponível no mercado nao fica claro o desperdício de recursos como você citou.
1