Meus 2 cents,
Se voce puder compartilhar o repo seria interessante - em particular fiquei impressionado com o "prompt enginnering", com a queda de 2000 para 200 token e o tempo de reposta - este tipo de detalhe eh especialmente interessante para entender o funcionamento e otimizacao de IA para aplicacoes do dia-a-dia.
Caso nao queira compartilhar em publico, se puder enviar ao meu email fico agradecido: [email protected]