OCR

فناوری OCR (مخفف Optical Character Recognition، یعنی بازشناسی نوری نویسه) تصویرِ متن را به کاراکترهای واقعی و قابل انتخاب تبدیل می‌کند. یک صفحهٔ اسکن‌شده یا عکسِ یک سند، برای کامپیوتر فقط شبکه‌ای از پیکسل است: هیچ متنی در آن نیست، صرفاً تصویری که اتفاقاً شبیه کلمه‌هاست. OCR شکل حرف‌ها را تحلیل می‌کند و رشتهٔ کاراکترهای زیرین را بازمی‌سازد.

نتیجه معمولاً به‌صورت یک لایهٔ متنِ نامرئی نوشته می‌شود که دقیقاً روی تصویر اصلی می‌نشیند؛ پس صفحه هنوز شبیه همان اسکن است اما حالا قابل جست‌وجو، قابل کپی و قابل نمایه‌سازی است. موتورهای امروزی از چند زبان، چند ستون و جدول‌ها پشتیبانی می‌کنند و دقت به‌شدت به وضوح منبع بستگی دارد: یک اسکن تمیز ۳۰۰ DPI خیلی بهتر از یک عکس تار با گوشی بازشناسی می‌شود. Tesseract، آن موتور متن‌باز، همانی است که بیشتر ابزارهای مبتنی بر مرورگر روی آن ساخته می‌شوند.

چون OCR اغلب روی اسناد حساس اجرا می‌شود، فاکتورها، قراردادها، مدارک هویتی، اینکه این کار کجا انجام می‌شود یک پرسش واقعیِ حریم خصوصی است. reader.me بازشناسی را با WebAssembly داخل مرورگر شما اجرا می‌کند، پس تصویر صفحه و متنی که از آن تولید می‌شود روی دستگاه شما می‌ماند و هرگز جایی فرستاده نمی‌شود تا سروری آن را بخواند.

ابزارهای مرتبط

اصطلاح‌های بیشتر

AcroForm XFA Metadata Compression Embedded fonts Text layer

← بازگشت به واژه‌نامه