Whisper é bom demais. O whisper-tiny roda liso até em servidor fraco: dual-core, 2 GB RAM, CPU only, e áudio de 30 s leva ~300 ms pra transcrever. Consome pouca RAM, é estável e encaixa fácil em jobs/filas. Pra STT barato e simples, foi o melhor modelo que achei com bom desempenho sem precisar de gpu.
1
0
whisper-tiny é um modelo apenas para inglês