OCR

OCR (Optical Character Recognition, czyli optyczne rozpoznawanie znaków) zamienia obraz tekstu w prawdziwe, zaznaczalne znaki. Zeskanowana strona albo zdjęcie dokumentu są dla komputera jedynie siatką pikseli — nie ma w nich tekstu, tylko obraz, który przypadkiem wygląda jak słowa. OCR analizuje kształty liter i odtwarza ukryty pod nimi ciąg znaków.

Wynik zwykle zapisuje się z powrotem jako niewidoczną warstwę tekstu leżącą dokładnie na oryginalnym obrazie, więc strona nadal wygląda jak skan, ale jest już przeszukiwalna, kopiowalna i można ją zindeksować. Nowoczesne silniki radzą sobie z wieloma językami, kolumnami i tabelami, a dokładność mocno zależy od rozdzielczości źródła: czysty skan 300 DPI rozpoznaje się o wiele lepiej niż rozmazane zdjęcie z telefonu. Tesseract, silnik o otwartym kodzie, to ten, na którym opiera się większość narzędzi działających w przeglądarce.

Ponieważ OCR często przetwarza wrażliwe papiery — faktury, umowy, dokumenty tożsamości — to, gdzie się odbywa, jest realnym pytaniem o prywatność. reader.me uruchamia rozpoznawanie przez WebAssembly wewnątrz Twojej przeglądarki, więc obraz strony i tekst, który z niego powstaje, zostają na Twoim urządzeniu i nigdy nie są nigdzie wysyłane, by odczytał je serwer.

Powiązane narzędzia

Więcej terminów

AcroForm XFA Metadata Compression Embedded fonts Text layer

← Powrót do słownika