OCR
فناوری OCR (مخفف Optical Character Recognition، یعنی بازشناسی نوری نویسه) تصویرِ متن را به کاراکترهای واقعی و قابل انتخاب تبدیل میکند. یک صفحهٔ اسکنشده یا عکسِ یک سند، برای کامپیوتر فقط شبکهای از پیکسل است: هیچ متنی در آن نیست، صرفاً تصویری که اتفاقاً شبیه کلمههاست. OCR شکل حرفها را تحلیل میکند و رشتهٔ کاراکترهای زیرین را بازمیسازد.
نتیجه معمولاً بهصورت یک لایهٔ متنِ نامرئی نوشته میشود که دقیقاً روی تصویر اصلی مینشیند؛ پس صفحه هنوز شبیه همان اسکن است اما حالا قابل جستوجو، قابل کپی و قابل نمایهسازی است. موتورهای امروزی از چند زبان، چند ستون و جدولها پشتیبانی میکنند و دقت بهشدت به وضوح منبع بستگی دارد: یک اسکن تمیز ۳۰۰ DPI خیلی بهتر از یک عکس تار با گوشی بازشناسی میشود. Tesseract، آن موتور متنباز، همانی است که بیشتر ابزارهای مبتنی بر مرورگر روی آن ساخته میشوند.
چون OCR اغلب روی اسناد حساس اجرا میشود، فاکتورها، قراردادها، مدارک هویتی، اینکه این کار کجا انجام میشود یک پرسش واقعیِ حریم خصوصی است. reader.me بازشناسی را با WebAssembly داخل مرورگر شما اجرا میکند، پس تصویر صفحه و متنی که از آن تولید میشود روی دستگاه شما میماند و هرگز جایی فرستاده نمیشود تا سروری آن را بخواند.
ابزارهای مرتبط