Skip to content
reader.me

ชั้นข้อความ

ชั้นข้อความคือส่วนของ PDF ที่เก็บอักขระจริงที่เครื่องอ่านได้ เป็นเนื้อหาที่คุณเลือกด้วยเคอร์เซอร์ คัดลอก ค้นหา และให้อ่านออกเสียงได้ PDF ที่สร้างจากโปรแกรมประมวลผลคำหรือโปรแกรมจัดหน้ามีชั้นนี้มาในตัว โดยอักขระแต่ละตัวจับคู่กับตำแหน่งและฟอนต์

สิ่งที่ตรงข้ามคือ PDF ที่สแกนมา ซึ่งมักเป็นเพียงภาพของหน้าที่ห่อด้วยบรรจุภัณฑ์ PDF มันดูเหมือนเอกสาร แต่ไม่มีข้อความอยู่เบื้องล่าง การค้นหาจึงไม่พบอะไรและการเลือกก็ไม่ได้อะไรมา OCR คือสิ่งที่เพิ่มชั้นที่ขาดหายไป มันรู้จำอักขระในภาพและเขียนกลับเป็นชั้นข้อความที่มองไม่เห็นซึ่งจัดเรียงตรงกับพิกเซลที่มองเห็น ทำให้หน้ายังดูเหมือนเดิมในขณะที่ค้นหาได้อย่างสมบูรณ์

การรู้ว่าไฟล์มีชั้นข้อความจริงหรือไม่ ช่วยอธิบายความหงุดหงิดในชีวิตประจำวันได้มาก ว่าทำไม PDF หนึ่งจึงค้นหาได้และอีกไฟล์ไม่ได้ เมื่อคุณต้องการชั้นนั้น การสร้างมันในเครื่องหมายความว่าคำในเอกสารถูกดึงออกบนเครื่องของคุณเอง แทนที่จะถูกส่งไปยังบริการระยะไกลที่อาจเก็บมันไว้