1 min de leitura ·

Criei um tradutor de documentos (PDF/DOCX) focado em privacidade usando a API do Gemini

Fala, pessoal do TabNews!
Recentemente, me vi frustrado com os limites de caracteres de tradutores online como Google Translate e DeepL ao tentar traduzir ebooks e scripts de código extensos. Para resolver isso, desenvolvi uma ferramenta desktop para Windows que utiliza a API do Gemini.
O que o projeto resolve?
A ideia foi criar algo que desse liberdade total ao usuário, sem mensalidades e mantendo a privacidade, já que o processamento do arquivo é feito localmente.
Principais funcionalidades:
Tradução de arquivos gigantes: Suporta TXT, DOCX e PDFs de centenas de páginas.
OCR Integrado: Consegue ler e traduzir PDFs que são apenas imagens (escaneados).
Formatação: O app tenta manter o layout original e exporta o resultado em um arquivo .docx limpo.
Privacidade: O documento não é enviado para servidores de terceiros para "filas de espera". O app faz a ponte direta entre seu PC e a API da Google.
Por que usar a API do Gemini?
Escolhi o Gemini pela generosidade do plano gratuito da Google Cloud e pela qualidade da tradução, que em muitos testes superou o GPT-3.5 em textos literários. O usuário utiliza sua própria chave de API (BYOK - Bring Your Own Key).
Gostaria de receber o feedback de vocês sobre essa abordagem de ferramentas locais usando APIs de terceiros. Vale a pena investir mais em interfaces desktop para IA?
https://celsoexpert.gumroad.com/l/pdf-translator-pro

Espero que seja útil para alguém aqui!

luca

5 meses atrás

Caramba cara que top esse projeto, parabéns pela ideia!
Sempre que vejo esses projetos fico curioso pra saber, em qual linguagem voce desenvolveu esse projeto?

CelsoProgramador

Autor

5 meses atrás

Obrigado pelo feedback, Luca! O projeto foi desenvolvido em Python. Como sou estudante da linguagem, este app foi uma forma de colocar em prática o que estou aprendendo para resolver um problema real.

IvanPSG

5 meses atrás

Bem, não sei se é exatamente privado, já que a Google vai ter acesso ao que você tá consumindo através da API, se for o que eu entendi.

CelsoProgramador

Autor

5 meses atrás

Fala Ivan! Exato. No modo API, aplicam-se as regras de privacidade da Google Cloud. Por isso implementei o fallback Offline (usando Transformers locais). Quem lida com contratos confidenciais ou dados sensíveis deve usar o modo Offline, que garante 'Air Gap' (sem contato com a rede). A API fica lá apenas como um bônus para quem precisa traduzir livros ou coisas não sensíveis com maior qualidade.