OCR

OCR (Optical Character Recognition) förvandlar bilden av text till faktiska, markerbara tecken. En inskannad sida eller ett foto av ett dokument är, för en dator, bara ett rutnät av pixlar: det finns ingen text i det, bara en bild som råkar se ut som ord. OCR analyserar bokstävernas former och bygger upp den underliggande teckensträngen på nytt.

Resultatet skrivs vanligtvis tillbaka som ett osynligt textlager som ligger exakt ovanpå originalbilden, så att sidan fortfarande ser ut som skanningen men nu går att söka i, kopiera och indexera. Moderna motorer klarar flera språk, spalter och tabeller, och träffsäkerheten beror starkt på källans upplösning: en ren skanning på 300 DPI känns igen långt bättre än en suddig mobilbild. Tesseract, motorn med öppen källkod, är den som de flesta webbläsarbaserade verktyg bygger på.

Eftersom OCR ofta körs på känsliga papper, fakturor, avtal och id-handlingar, är frågan om var det sker en verklig integritetsfråga. reader.me kör igenkänningen med WebAssembly inne i din webbläsare, så att sidbilden och texten den ger upphov till stannar på din enhet och aldrig skickas någonstans för att läsas av en server.

Relaterade verktyg

Fler termer

AcroForm XFA Metadata Compression Embedded fonts Text layer

← Tillbaka till ordlistan