OCR

OCR (Optical Character Recognition — оптично разпознаване на знаци) превръща картината на текста в истински, избираеми знаци. Сканирана страница или снимка на документ за компютъра е просто решетка от пиксели: в нея няма текст, само изображение, което случайно прилича на думи. OCR анализира формите на буквите и възстановява заложения зад тях низ от знаци.

Резултатът обикновено се записва обратно като невидим текстов слой, разположен точно върху оригиналното изображение, така че страницата все още изглежда като сканиран файл, но вече е търсима, копируема и индексируема. Съвременните системи се справят с множество езици, колони и таблици, а точността зависи силно от резолюцията на източника: чисто сканиране при 300 DPI се разпознава далеч по-добре от размазана снимка от телефон. Tesseract, системата с отворен код, е тази, върху която стъпват повечето инструменти в браузъра.

Тъй като OCR често работи върху чувствителни документи — фактури, договори, лични карти — къде се случва е реален въпрос за поверителността. reader.me изпълнява разпознаването с WebAssembly вътре в браузъра ви, така че изображението на страницата и текстът, който то произвежда, остават на устройството ви и никога не се изпращат никъде, за да бъдат прочетени от сървър.

Свързани инструменти

Още термини

AcroForm XFA Metadata Compression Embedded fonts Text layer

← Обратно към речника