OCR PDF — извлечь текст
Извлеките текст с возможностью поиска из отсканированных PDF. Работает локально через Tesseract.
Обработать: application/pdf
Обработать ≤ 50.0 MB
About this tool
Извлеките текст с возможностью поиска из отсканированных PDF. Работает локально через Tesseract.
All processing happens in your browser. Your PDF never uploads to our servers. No account required, no usage limits.
Часто задаваемые вопросы
Этот инструмент OCR бесплатный?
Да, полностью бесплатно без ограничений по использованию и без необходимости создавать учётную запись.
Будет ли мой PDF загружен на сервер?
Нет. Tesseract работает в вашем браузере через WebAssembly — ваш PDF никогда не покидает ваше устройство.
Требует ли первое использование подключения к интернету?
Да. При первом выборе языка мы загружаем ~12 МБ обученных данных из Tesseract CDN. После этого OCR работает полностью офлайн.
Какие языки поддерживаются?
Английский, испанский, французский, немецкий, итальянский, португальский, голландский, корейский и японский. Сочетайте два с «+» (например, eng+spa) для многоязычных документов.
В каком формате выходные данные?
Простой файл .txt с извлечённым текстом по страницам. Экспорт PDF/A со слоем текста для поиска в будущем обновлении.