OCR PDF — extrair texto
Extrai texto pesquisável de PDFs digitalizados. Corre localmente com Tesseract.
Processar: application/pdf
Processar ≤ 50.0 MB
About this tool
Extrai texto pesquisável de PDFs digitalizados. Corre localmente com Tesseract.
All processing happens in your browser. Your PDF never uploads to our servers. No account required, no usage limits.
Perguntas frequentes
Esta ferramenta OCR é gratuita?
Sim, totalmente gratuita sem limites de utilização e sem conta.
O meu PDF é enviado para um servidor?
Não. O Tesseract corre no teu navegador via WebAssembly — o teu PDF nunca sai do dispositivo.
A primeira utilização requer ligação à internet?
Sim. Da primeira vez que selecionas um idioma, descarregamos ~12 MB de dados treinados do CDN do Tesseract. Depois, o OCR funciona totalmente offline.
Que idiomas são suportados?
Inglês, espanhol, francês, alemão, italiano, português, neerlandês, coreano e japonês. Combina dois com "+" (ex.: eng+por) para documentos multilingues.
Qual é o formato de saída?
Um ficheiro .txt simples com o texto extraído por página. A exportação para PDF/A com camada de texto pesquisável chega numa próxima atualização.