OCR
OCR (Optical Character Recognition) টেক্সটের ছবিকে প্রকৃত, নির্বাচনযোগ্য অক্ষরে রূপান্তরিত করে। একটি স্ক্যান করা পৃষ্ঠা বা কোনো নথির ছবি কম্পিউটারের কাছে নিছক পিক্সেলের একটি গ্রিড: এতে কোনো টেক্সট নেই, কেবল একটি ছবি যা দেখতে শব্দের মতো লাগে। OCR অক্ষরের আকৃতি বিশ্লেষণ করে নিচের অক্ষরগুলোর স্ট্রিং পুনর্গঠন করে।
ফলাফলটি সাধারণত মূল ছবির ঠিক উপরে বসা একটি অদৃশ্য টেক্সট স্তর হিসেবে লেখা হয়, ফলে পৃষ্ঠাটি দেখতে স্ক্যানের মতোই থাকে কিন্তু এখন তা অনুসন্ধানযোগ্য, কপিযোগ্য ও ইনডেক্সযোগ্য। আধুনিক ইঞ্জিনগুলো একাধিক ভাষা, কলাম ও সারণি সামলায়, আর নির্ভুলতা অনেকটাই উৎসের রেজোলিউশনের উপর নির্ভর করে: একটি পরিষ্কার ৩০০ DPI স্ক্যান ঝাপসা ফোনের ছবির চেয়ে অনেক ভালোভাবে শনাক্ত হয়। ওপেন-সোর্স ইঞ্জিন Tesseract-এর উপরই বেশিরভাগ ব্রাউজার-ভিত্তিক টুল গড়ে ওঠে।
যেহেতু OCR প্রায়ই সংবেদনশীল কাগজপত্রের — চালান, চুক্তি, পরিচয়পত্রের — উপর চলে, এটি কোথায় ঘটছে তা একটি বাস্তব গোপনীয়তার প্রশ্ন। reader.me স্বীকৃতি প্রক্রিয়াটি আপনার ব্রাউজারের ভেতরে WebAssembly দিয়ে চালায়, ফলে পৃষ্ঠার ছবি ও তা থেকে তৈরি টেক্সট আপনার ডিভাইসেই থাকে এবং সার্ভারে পড়ার জন্য কোথাও পাঠানো হয় না।