Pitch: Cansado de brigar com Regex e IA para ler documento? Criei uma API que transforma documentos em JSON (e queria o feedback de vocês)
Fala pessoal, tudo bem?
Queria compartilhar com vocês um SaaS que venho construindo e aproveitar para pedir aquele feedback sincero (e técnico) da comunidade. O projeto é o Structura.
A Dor (ou por que eu não aguentava mais criar parsers)
Sempre precisei fazer parseamento de documentos nos meus projetos, mas nunca ficava 100% satisfeito com o resultado. Tentar criar algo do zero gastava tempo demais.
Por outro lado, plugar um LLM direto na extração também gerava dor de cabeça: gastava muitas linhas de código só para tirar o texto, fazer o prompt de formatação e, no fim, a IA ainda alucinava ou quebrava a estrutura. O resultado? Eu acabava tendo que escrever um monte de Regex para consertar o JSON que vinha torto.
Foi para resolver essa minha própria frustração que criei o Structura. O objetivo é simples: entra um documento (PDF, Imagem, etc) e sai um dado estruturado (JSON ou XLSX), via API ou interface web.
O Antes e Depois na prática
Para ilustrar, peguei um extrato sujo do Nubank.
O Documento original:

O Resultado em JSON:

A ideia é que você possa criar um esquema visual de extração com muita facilidade e parametrizar a saída do jeito que o seu sistema precisa, com uma taxa de assertividade de 99.8%.
O que roda por baixo do capô? (Tech Stack)
Como sei que a galera aqui curte ver a arquitetura, aqui vai a stack que estou usando:
- Backend / Core: Python com FastAPI. A mágica da extração acontece com uma combinação de OCR tradicional e LLM.
- Frontend: Next.js.
- Autenticação: Appwrite (me adiantou muito a vida para focar no produto).
- Pagamentos: Stripe.
- Infraestrutura: Hospedei tudo no Railway. Foi minha primeira vez usando a plataforma e achei a experiência incrível e muito fácil para gerenciar os serviços.
Aqui está um pedaço da topologia no Railway (Frontend, Backend, WorkerRedis e Redis):

Como testar?
Eu liberei um Free Tier com 30 créditos gratuitos por mês. Vocês podem criar a conta, testar a interface web ou plugar direto na API de vocês para brincar.
O link é: structura.com.br
O pedido de Feedback
Meu principal objetivo postando aqui é colher feedbacks. Como vocês resolveriam esse problema hoje? O que acharam da stack? A documentação da API está clara? Se puderem testar, tentar "quebrar" a ferramenta e me dizer onde posso melhorar, eu agradeceria demais.
Valeu pelo espaço!
Fonte: https://structura.com.br