OCR

OCR (Optical Character Recognition) टेक्स्ट की तस्वीर को असली, चुनने योग्य अक्षरों में बदल देता है। कोई स्कैन किया हुआ पेज या किसी दस्तावेज़ की फ़ोटो कंप्यूटर के लिए महज़ पिक्सेलों की एक जाली है: उसमें कोई टेक्स्ट नहीं होता, सिर्फ़ एक छवि होती है जो संयोग से शब्दों जैसी दिखती है। OCR अक्षरों के आकार का विश्लेषण करता है और उनके पीछे छिपी अक्षरों की श्रृंखला को फिर से बना देता है।

परिणाम आमतौर पर एक अदृश्य टेक्स्ट परत के रूप में वापस लिखा जाता है, जो मूल छवि के ठीक ऊपर बैठती है, ताकि पेज अब भी स्कैन जैसा दिखे पर खोजने योग्य, कॉपी करने योग्य और इंडेक्स करने योग्य हो। आधुनिक इंजन कई भाषाओं, स्तंभों और तालिकाओं को संभालते हैं, और सटीकता स्रोत के रिज़ॉल्यूशन पर बहुत निर्भर करती है: एक साफ़ 300 DPI स्कैन धुँधली फ़ोन तस्वीर की तुलना में कहीं बेहतर पहचाना जाता है। ओपन-सोर्स इंजन Tesseract वह है जिस पर ब्राउज़र-आधारित अधिकांश टूल बने होते हैं।

चूँकि OCR अक्सर संवेदनशील कागज़ात — चालान, अनुबंध, पहचान दस्तावेज़ों — पर चलता है, इसलिए यह कहाँ होता है यह वाकई गोपनीयता का सवाल है। reader.me आपके ब्राउज़र के भीतर WebAssembly से पहचान चलाता है, इसलिए पेज की छवि और जो टेक्स्ट वह बनाता है, दोनों आपके डिवाइस पर ही रहते हैं और किसी सर्वर से पढ़वाने के लिए कहीं नहीं भेजे जाते।