Skip to content
reader.me

OCR

L'OCR (Optical Character Recognition) trasforma l'immagine di un testo in caratteri veri e selezionabili. Una pagina scansionata o la foto di un documento, per un computer, è solo una griglia di pixel: non contiene testo, solo un'immagine che per caso sembra fatta di parole. L'OCR analizza le forme delle lettere e ricostruisce la sequenza di caratteri che vi sta sotto.

Il risultato viene di solito riscritto come un livello di testo invisibile che si posa esattamente sopra l'immagine originale, così la pagina sembra ancora la scansione ma ora è ricercabile, copiabile e indicizzabile. I motori moderni gestiscono più lingue, colonne e tabelle, e l'accuratezza dipende molto dalla risoluzione di partenza: una scansione pulita a 300 DPI viene riconosciuta molto meglio di una foto sfocata fatta col telefono. Tesseract, il motore open source, è quello su cui si basa la maggior parte degli strumenti che girano nel browser.

Poiché l'OCR spesso lavora su documenti sensibili, fatture, contratti, documenti d'identità, dove avviene è una vera questione di privacy. reader.me esegue il riconoscimento con WebAssembly dentro il tuo browser, così l'immagine della pagina e il testo che ne ricava restano sul tuo dispositivo e non vengono mai inviati da nessuna parte per essere letti da un server.