Skip to content
reader.me

OCR PDF — ekstrak teks

Konversi

Ekstrak teks yang dapat dicari dari PDF hasil pindaian. Berjalan lokal dengan Tesseract.

Letakkan PDF di sini

Proses ≤ 50.0 MB

Tentang alat ini

Ekstrak teks yang dapat dicari dari PDF hasil pindaian. Berjalan lokal dengan Tesseract.

Privasi dari arsitektur

Semua pemrosesan terjadi di peramban Anda. PDF Anda tidak pernah diunggah ke server kami. Tidak perlu akun, tanpa batas penggunaan.

Cara kerjanya

  1. 1Pilih PDF — tidak pernah meninggalkan perangkat
  2. 2Konfigurasi alat sesuai kebutuhan
  3. 3Simpan hasil ke unduhan

Pertanyaan yang sering diajukan

Apakah alat OCR ini gratis?

Ya, sepenuhnya gratis tanpa batas penggunaan, tanpa perlu akun.

Apakah PDF saya akan diunggah ke server?

Tidak. Tesseract berjalan di browser Anda melalui WebAssembly — PDF Anda tidak pernah meninggalkan perangkat Anda.

Apakah penggunaan pertama memerlukan koneksi internet?

Ya. Pertama kali Anda memilih bahasa, kami mengunduh ~12 MB data terlatih dari CDN Tesseract. Setelah itu, OCR bekerja sepenuhnya offline.

Bahasa apa yang didukung?

Inggris, Spanyol, Prancis, Jerman, Italia, Portugis, Belanda, Korea dan Jepang. Campurkan dua dengan "+" (misalnya eng+spa) untuk dokumen multibahasa.

Apa format outputnya?

Berkas .txt biasa dengan teks yang diekstrak per halaman. Ekspor PDF/A dengan lapisan teks yang dapat dicari akan datang dalam pembaruan mendatang.