Tem um artigo que ficou popular recentemente: OpenAI Charges by the Minute, S... · rafael

Em resposta a Duvida - Projeto com IA

Tem um artigo que ficou popular recentemente: OpenAI Charges by the Minute, So Make the Minutes Shorter. Em resumo, você pode acelerar o áudio para 2x ou 3x (mais do que isso, o autor teve problemas).

Também pode experimentar cortar alguns trechos do áudio e deixar a IA deduzir pelo contexto, por exemplo cortar 1s a cada 10s, mas suspeito que isso mais atrapalharia do que ajudaria. Acho que o Lucas Montano falou disso nesse vídeo.

A Rocketseat lançou um vídeo recente falando sobre transcrição de áudio também, mencionando serviços alternativos e o motivo de terem trocado.

Se mesmo assim o áudio estiver muito longo, você pode dividir em mais áudios e depois juntar as transcrições.

adryannsanntos

1 ano atrás

Atualmente eu já estou fazendo esse processo de acelerar o áudio (2x), meu real problema é na hora de passar essa transcriçao que foi gerada para a IA, por ela ser uma transcriçao com diarization, ela acaba ficando muito grande.

Oletros

1 ano atrás

Meus 2 cents extendidos,

Uma ideia pode ser usar um LLM menor (mais barato/free) para fazer a compactacao de informacao e o LLM maior para fazer o resumo e/ou analise.

Outra ideia eh usar abreviacoes para palavras ou trechos muito repetidos:

https://gist.github.com/jimsrc/46670bd97f1bad0845e0a208e33996c8

https://gist.github.com/VictorTaelin/d293328f75291b23e203e9d9db9bd136

Nos itens acima, utilizam compressao atraves de abreviacoes e passam um "dicionario" de abreviacoes para a LLM saber o que eh cada uma.

Nao sei se funciona no seu caso - mas enfim.

rafael

Autor

1 ano atrás

Ahhh eu entendi completamente errado então.

Essa thread do Reddit parece ter algumas dicas úteis.

Eu realmente acho que vale a pena experimentar hospedar alguma LLM e comparar os custos e o resultado. Mas, se continuar usando alguma API, além de procurar por modelos mais baratos, pode ver se o serviço que você está usando oferece um desconto, como é o caso do batch processing no Claude e batch API na OpenAI.