Criei um tradutor de documentos (PDF/DOCX) focado em privacidade usando a API do Gemini
Fala, pessoal do TabNews!
Recentemente, me vi frustrado com os limites de caracteres de tradutores online como Google Translate e DeepL ao tentar traduzir ebooks e scripts de código extensos. Para resolver isso, desenvolvi uma ferramenta desktop para Windows que utiliza a API do Gemini.
O que o projeto resolve?
A ideia foi criar algo que desse liberdade total ao usuário, sem mensalidades e mantendo a privacidade, já que o processamento do arquivo é feito localmente.
Principais funcionalidades:
Tradução de arquivos gigantes: Suporta TXT, DOCX e PDFs de centenas de páginas.
OCR Integrado: Consegue ler e traduzir PDFs que são apenas imagens (escaneados).
Formatação: O app tenta manter o layout original e exporta o resultado em um arquivo .docx limpo.
Privacidade: O documento não é enviado para servidores de terceiros para "filas de espera". O app faz a ponte direta entre seu PC e a API da Google.
Por que usar a API do Gemini?
Escolhi o Gemini pela generosidade do plano gratuito da Google Cloud e pela qualidade da tradução, que em muitos testes superou o GPT-3.5 em textos literários. O usuário utiliza sua própria chave de API (BYOK - Bring Your Own Key).
Gostaria de receber o feedback de vocês sobre essa abordagem de ferramentas locais usando APIs de terceiros. Vale a pena investir mais em interfaces desktop para IA?
https://celsoexpert.gumroad.com/l/pdf-translator-pro
Espero que seja útil para alguém aqui!