Recriar documentos mantendo layout e fidelidade ao original
Estou trabalhando em uma plataforma que lida com tradução de documentos oficiais (PDFs escaneados e digitais) e depois com a recriação do arquivo no idioma de destino, tentando manter o máximo possível de fidelidade visual ao documento original (layout, espaçamentos, quebras de linha, hierarquia visual etc.).
A tradução em si já está bem resolvida, mas o maior desafio tem sido a fase de reconstrução do documento, principalmente em casos como:
Textos com quebras de linha “não semânticas”
Diferença de tamanho entre idiomas (ex: PT ↔ EN ↔ ES)
Alinhamento de parágrafos, tabelas e campos fixos
Manter aparência “oficial” sem virar um documento claramente refeito do zero
Quais estratégias ou pipelines vocês já usaram para reconstrução fiel de PDFs?
Alguém já lidou com normalização de espaçamento / line-height entre idiomas diferentes?
Existe alguma abordagem ou ferramenta que ajude a preservar melhor a “identidade visual” do original?
Não posso entrar em detalhes específicos do produto, mas qualquer insight arquitetural, experiência prática ou referência já ajudaria bastante.
Valeu! 🙌