OCR

OCR (Optical Character Recognition, оптическое распознавание символов) превращает изображение текста в настоящие, выделяемые символы. Отсканированная страница или фотография документа для компьютера — всего лишь сетка пикселей: текста в ней нет, есть только картинка, которая случайно похожа на слова. OCR анализирует форму букв и восстанавливает лежащую под ними строку символов.

Результат обычно записывается обратно как невидимый текстовый слой, лежащий ровно поверх исходного изображения: страница по-прежнему выглядит как скан, но теперь по ней можно искать, копировать её и индексировать. Современные движки справляются с несколькими языками, колонками и таблицами, а точность сильно зависит от исходного разрешения: чистый скан 300 DPI распознаётся гораздо лучше, чем смазанный снимок с телефона. Tesseract, движок с открытым исходным кодом, — это то, на чём строится большинство браузерных инструментов.

Поскольку OCR часто работает с чувствительными бумагами — счетами, договорами, удостоверениями личности, — то, где оно происходит, действительно вопрос приватности. reader.me выполняет распознавание с помощью WebAssembly прямо в вашем браузере, поэтому изображение страницы и полученный из него текст остаются на вашем устройстве и никуда не отправляются для прочтения сервером.

Связанные инструменты

Больше терминов

AcroForm XFA Metadata Compression Embedded fonts Text layer

← Назад к глоссарию