Skip to content
reader.me

OCR

Το OCR (Optical Character Recognition, οπτική αναγνώριση χαρακτήρων) μετατρέπει την εικόνα του κειμένου σε πραγματικούς, επιλέξιμους χαρακτήρες. Μια σαρωμένη σελίδα ή μια φωτογραφία ενός εγγράφου είναι, για έναν υπολογιστή, απλώς ένα πλέγμα από εικονοστοιχεία: δεν υπάρχει κείμενο μέσα της, μόνο μια εικόνα που τυχαίνει να μοιάζει με λέξεις. Το OCR αναλύει τα σχήματα των γραμμάτων και ανακατασκευάζει την υποκείμενη ακολουθία χαρακτήρων.

Το αποτέλεσμα συνήθως γράφεται πίσω ως ένα αόρατο επίπεδο κειμένου που κάθεται ακριβώς πάνω από την αρχική εικόνα, ώστε η σελίδα να εξακολουθεί να μοιάζει με τη σάρωση αλλά τώρα να είναι αναζητήσιμη, αντιγράψιμη και ευρετηριάσιμη. Οι σύγχρονες μηχανές χειρίζονται πολλές γλώσσες, στήλες και πίνακες, και η ακρίβεια εξαρτάται σε μεγάλο βαθμό από την ανάλυση της πηγής: μια καθαρή σάρωση στα 300 DPI αναγνωρίζεται πολύ καλύτερα από ένα θολό στιγμιότυπο κινητού. Το Tesseract, η μηχανή ανοιχτού κώδικα, είναι αυτή πάνω στην οποία χτίζουν τα περισσότερα εργαλεία που τρέχουν στο πρόγραμμα περιήγησης.

Επειδή το OCR συχνά εκτελείται πάνω σε ευαίσθητα χαρτιά — τιμολόγια, συμβόλαια, έγγραφα ταυτότητας — το πού συμβαίνει είναι ένα πραγματικό ζήτημα απορρήτου. Το reader.me τρέχει την αναγνώριση με WebAssembly μέσα στο πρόγραμμα περιήγησής σου, οπότε η εικόνα της σελίδας και το κείμενο που παράγει μένουν στη συσκευή σου και δεν στέλνονται ποτέ πουθενά για να διαβαστούν από έναν διακομιστή.