Faz total sentido! Embora imagino que as instruções em grande parte não sejam o que consome mais tokens, esse simples ajuste em muitas chamadas com certeza faz uma diferença.
Ótimo insight!
Faz total sentido! Embora imagino que as instruções em grande parte não sejam o que consome mais tokens, esse simples ajuste em muitas chamadas com certeza faz uma diferença.
Ótimo insight!
Valeu! A margem está justamente no detalhe do overhead. Topa trocar uma ideia sobre como auditar esses tokens em diferentes fluxos?