OCR PDF — Text extrahieren
Durchsuchbaren Text aus gescannten PDFs extrahieren. Läuft lokal mit Tesseract.
Verarbeiten: application/pdf
Verarbeiten ≤ 50.0 MB
About this tool
Durchsuchbaren Text aus gescannten PDFs extrahieren. Läuft lokal mit Tesseract.
All processing happens in your browser. Your PDF never uploads to our servers. No account required, no usage limits.
Häufig gestellte Fragen
Ist dieses OCR-Tool kostenlos?
Ja, völlig kostenlos ohne Nutzungsbeschränkungen oder Konto.
Wird meine PDF auf einen Server hochgeladen?
Nein. Tesseract läuft in Ihrem Browser per WebAssembly — Ihre PDF verlässt nie Ihr Gerät.
Erfordert die erste Nutzung eine Internetverbindung?
Ja. Beim ersten Auswählen einer Sprache laden wir ~12 MB Trainingsdaten vom Tesseract-CDN. Danach funktioniert OCR vollständig offline.
Welche Sprachen werden unterstützt?
Englisch, Spanisch, Französisch, Deutsch, Italienisch, Portugiesisch, Niederländisch, Koreanisch und Japanisch. Kombinieren Sie zwei mit "+" (z. B. eng+deu) für mehrsprachige Dokumente.
Welches Format hat die Ausgabe?
Eine reine .txt-Datei mit dem extrahierten Text pro Seite. PDF/A-Export mit durchsuchbarer Textebene kommt in einer zukünftigen Aktualisierung.