שכבת טקסט
שכבת הטקסט היא החלק של PDF שמחזיק תווים אמיתיים וקריאים למכונה, התוכן שאתה יכול לבחור עם הסמן, להעתיק, לחפש ולהקריא בקול. PDF שנבנה ממעבד תמלילים או מאפליקציית עימוד יש לו את השכבה הזאת באופן מקורי, כשכל תו ממופה למיקום ולגופן.
הניגוד הוא ה‑PDF הסרוק, שלעיתים קרובות הוא רק תמונה של עמוד עטופה באריזת PDF. הוא נראה כמו מסמך, אך אין מתחתיו טקסט, אז חיפוש לא מוצא דבר ובחירה לא תופסת דבר. OCR הוא מה שמוסיף את השכבה החסרה: הוא מזהה את התווים בתמונה וכותב אותם בחזרה כשכבת טקסט בלתי נראית מיושרת לפיקסלים הגלויים, ומשאיר את העמוד נראה אותו דבר תוך שהוא הופך אותו לניתן לחיפוש מלא.
לדעת אם לקובץ יש שכבת טקסט אמיתית מסביר הרבה תסכול יומיומי, למה PDF אחד ניתן לחיפוש ואחר לא. כשאתה צריך את השכבה הזאת, יצירתה באופן מקומי פירושה שהמילים של המסמך מחולצות על המחשב שלך ולא מועברות לשירות מרוחק שעלול לשמור אותן.
כלים קשורים