OCR

تقنية OCR (التعرّف الضوئي على الحروف، Optical Character Recognition) تحوّل صورة النص إلى حروف حقيقية قابلة للتحديد. صفحة ممسوحة ضوئيًا أو صورة لمستند هي، بالنسبة للحاسوب، مجرد شبكة من البكسلات: لا نص فيها، بل صورة تصادف أنها تشبه كلمات. وOCR يحلل أشكال الحروف ويعيد بناء سلسلة الحروف الكامنة خلفها.

تُكتب النتيجة عادةً كطبقة نص غير مرئية تستقر فوق الصورة الأصلية تمامًا، فتبقى الصفحة بمظهر المسح الضوئي لكنها صارت قابلة للبحث والنسخ والفهرسة. المحركات الحديثة تتعامل مع لغات وأعمدة وجداول متعددة، والدقة تعتمد كثيرًا على دقة المصدر: مسح نظيف بدقة 300 DPI يُتعرَّف عليه أفضل بكثير من صورة هاتف ضبابية. ومحرك Tesseract مفتوح المصدر هو ما تبني عليه معظم الأدوات العاملة في المتصفح.

ولأن OCR يعمل غالبًا على أوراق حساسة، فواتير وعقود ووثائق هوية، فإن مكان حدوثه سؤال خصوصية حقيقي. يشغّل reader.me التعرّف عبر WebAssembly داخل متصفحك، فتبقى صورة الصفحة والنص الناتج عنها على جهازك ولا تُرسل إلى أي مكان لتقرأها خوادم.

أدوات ذات صلة

مصطلحات أخرى

AcroForm XFA Metadata Compression Embedded fonts Text layer

← العودة إلى المسرد