Salve, usei o Docling + LLM, tu vai conseguir uma performance muito boa.. Dependendo do tipo do documento existe OCR melhores para escritas como o PaddleOCR.
Respondendo a "Qual OCR utilizou? É possivel dizer?...pretendo..." dentro da publicação Pitch: Como cheguei a 99.8% de acerto extraindo dados de PDFs usando FastAPI, OCR e LLMs
1