OCR

OCR (Optical Character Recognition — оптичне розпізнавання символів) перетворює зображення тексту на справжні, виділювані символи. Скан-сторінка чи фото документа для комп'ютера — лише сітка пікселів: тексту в ній немає, тільки картинка, яка випадково схожа на слова. OCR аналізує форми літер і відновлює рядок символів, що стоїть за ними.

Результат зазвичай записується назад як невидимий текстовий шар, розташований точно поверх вихідного зображення, тож сторінка все ще виглядає як скан, але тепер у ній можна шукати, копіювати її та індексувати. Сучасні рушії опрацьовують кілька мов, колонки й таблиці, а точність сильно залежить від роздільності джерела: чистий скан 300 DPI розпізнається набагато краще за розмите фото з телефона. Tesseract, рушій з відкритим кодом, — той, на якому будується більшість браузерних інструментів.

Оскільки OCR часто проходить по чутливих паперах — рахунках, договорах, документах, що посвідчують особу, — де саме він відбувається, є справжнім питанням приватності. reader.me виконує розпізнавання за допомогою WebAssembly у вашому браузері, тож зображення сторінки й текст, який воно породжує, лишаються на вашому пристрої й ніколи нікуди не надсилаються, щоб їх прочитав сервер.

Пов'язані інструменти

Більше термінів

AcroForm XFA Metadata Compression Embedded fonts Text layer

← Назад до глосарію