OCR

L'OCR (Optical Character Recognition, reconeixement òptic de caràcters) converteix la imatge d'un text en caràcters reals i seleccionables. Una pàgina escanejada o una foto d'un document és, per a l'ordinador, només una graella de píxels: no hi ha text, només una imatge que sembla paraules. L'OCR analitza les formes de les lletres i reconstrueix la cadena de caràcters que hi ha a sota.

El resultat normalment s'escriu com una capa de text invisible situada just damunt de la imatge original, de manera que la pàgina continua semblant l'escaneig però ara es pot cercar, copiar i indexar. Els motors moderns gestionen diversos idiomes, columnes i taules, i la precisió depèn molt de la resolució d'origen: un escaneig net a 300 PPP es reconeix molt millor que una foto borrosa feta amb el mòbil. Tesseract, el motor de codi obert, és el més utilitzat com a base de les eines que funcionen al navegador.

Com que l'OCR sovint treballa sobre paperassa sensible —factures, contractes, documents d'identitat—, on s'executa és una qüestió real de privacitat. reader.me fa el reconeixement amb WebAssembly dins del teu navegador, així que la imatge de la pàgina i el text que en surt es queden al teu dispositiu i no s'envien mai enlloc perquè un servidor els llegeixi.

Eines relacionades

Més termes

AcroForm XFA Metadata Compression Embedded fonts Text layer

← Torna al glossari