Skip to content
reader.me

टेक्स्ट परत

टेक्स्ट परत (text layer) PDF का वह हिस्सा है जो असली, मशीन-पठनीय अक्षर रखता है — वह सामग्री जिसे आप कर्सर से चुन सकते हैं, कॉपी कर सकते हैं, खोज सकते हैं और ज़ोर से पढ़वा सकते हैं। किसी वर्ड प्रोसेसर या पेज-लेआउट ऐप से बनी PDF में यह परत स्वाभाविक रूप से होती है, जिसमें हर अक्षर एक स्थिति और एक फ़ॉन्ट से मानचित्रित होता है।

इसका विपरीत है स्कैन की गई PDF, जो अक्सर महज़ एक पेज की तस्वीर होती है जो PDF पैकेजिंग में लिपटी होती है। यह दस्तावेज़ जैसी दिखती है, पर नीचे कोई टेक्स्ट नहीं होता, इसलिए खोज को कुछ नहीं मिलता और चयन कुछ नहीं पकड़ता। OCR ही वह है जो गायब परत जोड़ता है: यह छवि के अक्षरों को पहचानता है और उन्हें दृश्य पिक्सेलों से संरेखित एक अदृश्य टेक्स्ट परत के रूप में वापस लिख देता है, जिससे पेज वैसा ही दिखता रहता है पर पूरी तरह खोजने योग्य बन जाता है।

यह जानना कि किसी फ़ाइल में असली टेक्स्ट परत है या नहीं, रोज़मर्रा की बहुत-सी झुँझलाहट समझा देता है — कि एक PDF खोजने योग्य क्यों है और दूसरी नहीं। जब आपको वह परत चाहिए, तो उसे लोकल रूप से बनाने का अर्थ है कि दस्तावेज़ के शब्द आपकी अपनी मशीन पर निकाले जाते हैं, बजाय किसी रिमोट सेवा को सौंपे जाने के जो उन्हें रोक रख सकती है।