Skip to content
reader.me

مسرد PDF

مسرد PDF: المصطلحات والصيغ

ما يعنيه فعلًا كل مصطلح وصيغة في عالم PDF، بلغة واضحة. المصطلحات التقنية التي تصادفك، مشروحة.

الصيغ

PDF

صيغة PDF (Portable Document Format) هي صيغة ملفات تثبّت الموضع الدقيق لكل حرف وخط وصورة على الصفحة، حتى يبدو المستند متطابقًا سواء فتحته على هاتف أو حاسوب محمول أو على جهاز إخراج في مطبعة. أنشأتها Adobe عام 1993 ثم سلّمت المواصفة إلى منظمة ISO عام 2008، حيث صارت معيارًا مفتوحًا باسم ISO 32000. هذا الانفتاح هو السبب في أن أدوات مستقلة كثيرة تستطيع قراءة وكتابة ملفات PDF دون أن تستأذن أحدًا.

PDF/A

صيغة PDF/A هي ملف ISO 19005 المصمَّم للأرشفة طويلة الأمد. الهدف بسيط: مستند يُفتح بعد خمسين عامًا يجب أن يظهر تمامًا كما يظهر اليوم، دون خطوط مفقودة ودون اعتماد على موارد خارجية ربما تكون قد اختفت. ولضمان ذلك، يمنع المعيار أي شيء قد ينهار مع مرور الوقت.

PDF/UA

صيغة PDF/UA (المعيار ISO 14289، حيث يرمز UA إلى الوصول الشامل Universal Accessibility) هي المعيار الذي يجعل ملف PDF قابلًا للاستخدام من قبل الأشخاص الذين يعتمدون على التقنيات المساعِدة. لا يستطيع قارئ الشاشة فهم حبر على ورقة؛ فهو يحتاج إلى بنية منطقية تحته. وPDF/UA يحدد بالضبط كيف يجب أن تُبنى تلك البنية.

PDF/X

صيغة PDF/X (المعيار ISO 15930) هي عائلة الملفات المصنوعة للطباعة الاحترافية وفنون الغرافيك. حين يذهب ملف إلى مطبعة تجارية، يصبح الغموض مكلفًا: خط مفقود، أو صورة RGB في موضع كان يُنتظر فيه CMYK، أو صندوق اقتصاص غير معرَّف، أي من هذه قد يفسد دفعة طباعة كاملة. وPDF/X يزيل هذا الغموض بإجبار كل تفصيل حرج للطباعة على أن يكون صريحًا.

المفاهيم

OCR

تقنية OCR (التعرّف الضوئي على الحروف، Optical Character Recognition) تحوّل صورة النص إلى حروف حقيقية قابلة للتحديد. صفحة ممسوحة ضوئيًا أو صورة لمستند هي، بالنسبة للحاسوب، مجرد شبكة من البكسلات: لا نص فيها، بل صورة تصادف أنها تشبه كلمات. وOCR يحلل أشكال الحروف ويعيد بناء سلسلة الحروف الكامنة خلفها.

AcroForm

نموذج AcroForm هو تقنية النماذج الأصلية المدمجة في PDF، ذلك النوع من النماذج التفاعلية الذي صار جزءًا من الصيغة منذ أواخر التسعينيات. الحقول القابلة للتعبئة التي تراها في إقرار ضريبي أو استمارة طلب، صناديق نص ومربعات اختيار وأزرار راديو وقوائم منسدلة وحقول توقيع، كلها كائنات AcroForm مُعرَّفة مباشرةً في بنية كائنات PDF.

XFA

تقنية XFA (بنية نماذج XML، XML Forms Architecture) هي تقنية النماذج البديلة من Adobe، حيث يُعرَّف النموذج لا عبر كائنات PDF الأصلية بل عبر حمولة XML مضمَّنة داخل غلاف PDF. صُمِّمت للنماذج المعقّدة والديناميكية: تخطيطات تكبر كلما أضفت صفوفًا، وحقول تظهر أو تختفي بناءً على إجابات سابقة، وربط محكم بمخططات بيانات في الخلفية.

البيانات الوصفية

البيانات الوصفية هي البيانات عن بياناتك، أي المعلومات التي يحملها ملف PDF خارج محتوى الصفحة المرئي. وهناك مخزنان رئيسيان: قاموس معلومات المستند القديم (العنوان والمؤلف والموضوع والكلمات المفتاحية والبرنامج الذي أنشأه وتواريخ الإنشاء والتعديل)، و XMP، وهو كتلة مبنية على XML تحوي الحقول نفسها إضافةً إلى خصائص أغنى وقابلة للتوسّع.

الضغط

الضغط هو ما يبقي أحجام ملفات PDF قابلة للإدارة، ومستند واحد عادةً يمزج عدة طرق لأنه يمزج عدة أنواع من المحتوى. النص وتعليمات الرسم المتجهي تُضغط دون فقدان بخوارزمية Flate (وهي خوارزمية Deflate نفسها وراء ZIP)، فيعود كل حرف تمامًا كما دخل.

الخطوط المضمَّنة

الخطوط المضمَّنة هي محارف مُحزَّمة داخل ملف PDF نفسه بدلًا من استعارتها من الحاسوب الذي يفتحه. هذه هي الميزة التي تجعل PDF محمولًا حقًا: إذا سافر الخط مع المستند، فإن النص يُرسم على نحو متطابق في كل مكان، حتى على جهاز لم يُثبَّت عليه ذلك المحرف قط.

طبقة النص

طبقة النص هي الجزء من ملف PDF الذي يحمل حروفًا حقيقية قابلة للقراءة آليًا، أي المحتوى الذي تستطيع تحديده بالمؤشر ونسخه والبحث فيه وقراءته بصوت عالٍ. ملف PDF المبني من معالج نصوص أو تطبيق تنسيق صفحات يملك هذه الطبقة أصلًا، إذ يُربط كل حرف بموضع وخط.

العلامة المائية

العلامة المائية هي نص أو صورة تُوضع فوق صفحات ملف PDF للإشارة إلى الحالة أو الملكية، كلمة "مسودة" أو "سري" باهتة قطريًا عبر الصفحة، أو شعار شركة، أو سطر حقوق نشر. إنها تشير إلى نيّة دون أن تحجب المحتوى الكامن، عادةً بكونها شبه شفافة أو بجلوسها خلف النص الرئيسي.

الخطّنة (Linearization)

الخطّنة (Linearization)، التي تسوّقها Adobe باسم Fast Web View، هي طريقة لإعادة تنظيم ترتيب بايتات ملف PDF الداخلي حتى يمكن عرضه قبل وصول الملف كله. ففي ملف PDF عادي، يقع جدول المراجع المتقاطعة الذي يفهرس كل كائن في النهاية تمامًا، فيحتاج العارض تقنيًا إلى الملف الكامل ليعرف أين توجد الأشياء.

الأمان

تشفير AES

خوارزمية AES (معيار التشفير المتقدّم، Advanced Encryption Standard) هي الشيفرة الكتلية التي تؤمّن ملف PDF المحمي بكلمة مرور. حين تقفل مستندًا، تُشفَّر دفوق محتوى الصفحة وسلاسلها بـ AES، والطريق الوحيد للعودة إلى البايتات المقروءة هو تقديم كلمة المرور الصحيحة واشتقاق المفتاح الصحيح. وبدونها، يكون الملف على القرص مجرد نص مشفَّر.

التوقيع الإلكتروني

التوقيع الإلكتروني، بأوسع معنى قانوني، هو أي بيانات مرفقة بمستند تشير إلى نيّة الموقِّع في الموافقة، من اسم مكتوب أو خربشة مرسومة إلى ختم مدعوم تشفيريًا. ولائحة eIDAS الأوروبية ترتّب هذه الأنواع في مستويات، والتمييز بينها مهم حين يتعيّن على التوقيع أن يصمد لاحقًا.

التوقيع الرقمي

التوقيع الرقمي هو الآلية التشفيرية التي تثبت من وقّع ملف PDF وأن لا أحد عدّله منذ ذلك الحين. إنه المحرك التقني الذي تعتمد عليه أقوى التواقيع الإلكترونية، وهو مبني على تشفير المفتاح العام لا على أي صورة لخط قلم.

الصور

الرسوم المتجهة

الرسوم المتجهة تصف الصورة كرياضيات، نقاط وخطوط ومنحنيات وتعبئات، لا كشبكة ثابتة من النقاط الملونة. فالدائرة تُخزَّن كمركز ونصف قطر ولون، فيعيد الحاسوب رسمها بأي حجم يُطلب. والنتيجة هي الخاصية المميزة لفن المتجهات: يتدرّج إلى أي حجم دون فقدان للحدّة.

الصورة النقطية

الصورة النقطية هي شبكة مستطيلة من البكسلات، يحمل كل منها قيمة لون، وهي النموذج وراء كل صورة فوتوغرافية ومسح ضوئي. وخلافًا للمتجه، تملك الصورة النقطية دقة أصلية ثابتة: تخزّن عددًا محددًا من النقاط عرضًا وطولًا، وكل تفاصيلها مخبوزة في تلك الشبكة.

JPG

صيغة JPG (وتُكتب أيضًا JPEG، نسبةً إلى مجموعة الخبراء المصوِّرين Joint Photographic Experts Group التي عرّفتها) هي الصيغة النقطية مع الفقدان المبنية للصور الفوتوغرافية. تعمل بتحويل الصورة إلى مكوّنات ترددية والتخلّص من التفاصيل الدقيقة التي يقلّ احتمال أن تفتقدها العين البشرية، وهكذا تعصر صورة بألوان كاملة في ملف صغير.

PNG

صيغة PNG (رسوميات الشبكة المحمولة، Portable Network Graphics) هي الصيغة النقطية دون فقدان للرسومات ذات الحواف الحادة واللون المسطّح، لقطات الشاشة والشعارات والأيقونات والمخططات وأي شيء يحوي نصًا. "دون فقدان" يعني أنها تخزّن الصورة بالضبط: أعد حفظها كما تشاء ولا يتغيّر بكسل واحد، عكس التدهور التراكمي في JPEG.

WebP

صيغة WebP هي صيغة صور من Google تهدف إلى استبدال JPEG و PNG معًا بحاوية واحدة. وحيلتها هي دعم وضعين: ضغط مع فقدان للصور الفوتوغرافية، مثل JPEG، وضغط دون فقدان للرسومات، مثل PNG، مع إنتاج ملفات أصغر من أي منهما عادةً بجودة مماثلة.

TIFF

صيغة TIFF (صيغة ملف الصورة الموسومة، Tagged Image File Format) هي الصيغة النقطية الثقيلة المستخدمة في الأرشفة والمسح الضوئي والتصوير الاحترافي. واسمها يأتي من بنيتها: مجموعة مرنة من الوسوم تصف الصورة، تتيح لملف TIFF واحد أن يحمل بيانات غير مضغوطة أو مضغوطة دون فقدان، وأعماق بت عالية، وملفات لون مضمَّنة، وقدرًا كبيرًا من البيانات الوصفية التقنية.

SVG

صيغة SVG (الرسوميات المتجهة القابلة للتدرّج، Scalable Vector Graphics) هي صيغة متجهة مفتوحة مبنية على XML، أي صورة مكتوبة كنص قابل للقراءة يصف أشكالًا ومسارات وألوانًا ونصوصًا. ولأنها متجهة، تتدرّج إلى أي حجم بحواف حادة تمامًا، ولأنها XML، يمكن تنسيقها بـ CSS وتحريكها، بل والبحث فيها أو تحريرها في محرر نص عادي.

DPI

وحدة DPI (نقطة في البوصة، dots per inch) تقيس الدقة، أي كم نقطة من التفاصيل تُحزَم في كل بوصة من صورة أو طباعة. وكلما زاد الرقم، دقّت التفاصيل وكبر الملف. وهي الإعداد الأوحد الذي يقرّر في الغالب ما إذا كان المسح أو التصدير سيبدو حادًا أم مخيّبًا.