1

Como criei uma CLI em Python que traduz e dubla vídeos do YouTube usando IA (Open-Source)

Quero compartilhar com vocês um projeto open-source que desenvolvi recentemente para um Hackathon e que resolve uma dor real: acessibilidade de conteúdo em vídeo.

O YT-Dubber é uma ferramenta de linha de comando (CLI) construída em Python que automatiza todo o processo de baixar um vídeo do YouTube em inglês, transcrever o áudio, traduzir o texto para o português com IA e gerar uma nova faixa de áudio dublada com voz ultra-realista.

Tudo isso rodando direto no terminal de forma rápida.

🛠️ A Stack de Ferramentas (E por que escolhi cada uma)
Para colocar esse MVP de pé sem complicar a arquitetura, usei tecnologias que entregam o máximo de performance com o menor tempo de resposta:

Typer & Rich: Para criar uma interface de terminal (CLI) limpa, bonita, com barras de progresso reais e mensagens visuais claras para o usuário.

Whisper: Para uma transcrição precisa do áudio original em inglês.

Groq API (Llama 3.1): Escolha crucial pela velocidade. A Groq processa os tokens de tradução quase instantaneamente, garantindo que o pipeline não fique travado na etapa de tradução do texto para o português.

Edge-TTS: Para gerar a voz dublada em português. A qualidade das vozes neurais aqui é bizarra de tão natural, longe daquela voz robotizada do Google Tradutor de antigamente.

FFmpeg: O maestro dos bastidores, responsável por juntar o novo áudio dublado de volta no vídeo original de forma sincronizada.

🧗‍♂️ Os Desafios do Caminho
Nem tudo foi um mar de rosas. Como desenvolvedor no ambiente Windows, enfrentei algumas barreiras clássicas que quase todo mundo que trabalha com automação de mídia acaba esbarrando:

Gestão de Dependências e Ambiente: Configurar o pipeline para garantir que o FFmpeg fosse reconhecido corretamente pelo sistema e isolar as dependências no ambiente virtual (.venv) exigiu paciência.

Normalização de Quebras de Linha: O famoso aviso de LF will be replaced by CRLF no Git que assusta quem está começando, mas que no fundo é só o Windows sendo o Windows.

Conflitos de Repositório: Lidar com merges de arquivos gerados automaticamente pelo GitHub na hora de subir o primeiro commit. (Quem nunca deu um git push -f com segurança na vida após resolver um conflito que atire a primeira pedra!).

🚀 O Resultado Final
O código está estruturado de forma modular (separando a lógica de CLI da interface visual) e totalmente pronto para quem quiser testar ou evoluir a ferramenta.

Abaixo está o link do repositório para quem quiser dar uma olhada, abrir Issues ou contribuir com ideias (como suporte a múltiplos idiomas ou melhorias na sincronia de tempo):

🔗 GitHub: https://github.com/dilson-developer/YT-Dubber

O que acharam da escolha da Stack? O uso do Groq hoje para tradução rápida tem sido um divisor de águas nos projetos de vocês também? Bora trocar uma ideia nos comentários!

Carregando publicação patrocinada...