OCR PDF — extraire le texte
Extrayez le texte recherchable de PDFs scannés. S'exécute localement avec Tesseract.
Traiter: application/pdf
Traiter ≤ 50.0 MB
About this tool
Extrayez le texte recherchable de PDFs scannés. S'exécute localement avec Tesseract.
All processing happens in your browser. Your PDF never uploads to our servers. No account required, no usage limits.
Questions fréquentes
Cet outil OCR est-il gratuit ?
Oui, totalement gratuit, sans limites d'utilisation ni compte requis.
Mon PDF est-il envoyé sur un serveur ?
Non. Tesseract s'exécute dans votre navigateur via WebAssembly — votre PDF ne quitte jamais votre appareil.
La première utilisation nécessite-t-elle une connexion ?
Oui. La première fois que vous sélectionnez une langue, nous téléchargeons ~12 Mo de données entraînées depuis le CDN Tesseract. Ensuite, l'OCR fonctionne hors ligne.
Quelles langues sont prises en charge ?
Anglais, espagnol, français, allemand, italien, portugais, néerlandais, coréen et japonais. Combinez-en deux avec "+" (ex : eng+spa) pour des documents multilingues.
Quel est le format de sortie ?
Un fichier .txt brut avec le texte extrait par page. L'export PDF/A avec couche de texte recherchable arrivera dans une future mise à jour.