อภิธานศัพท์ PDF
อภิธานศัพท์ PDF: คำศัพท์และรูปแบบไฟล์
ความหมายที่แท้จริงของทุกคำศัพท์และทุกรูปแบบไฟล์ PDF ด้วยภาษาที่เข้าใจง่าย ศัพท์เฉพาะที่คุณพบเจอ อธิบายไว้ให้แล้ว
รูปแบบไฟล์
PDF (Portable Document Format) คือรูปแบบไฟล์ที่ตรึงตำแหน่งของอักขระ เส้น และภาพทุกชิ้นบนหน้าให้อยู่กับที่อย่างแม่นยำ เอกสารจึงดูเหมือนกันทุกประการไม่ว่าคุณจะเปิดบนโทรศัพท์ บนแล็ปท็อป หรือบน RIP ของโรงพิมพ์ Adobe สร้างมันขึ้นในปี 1993 และส่งมอบข้อกำหนดให้ ISO ในปี 2008 จนกลายเป็นมาตรฐานเปิด ISO 32000 ความเปิดกว้างนี้เองคือเหตุผลที่เครื่องมืออิสระจำนวนมากสามารถอ่านและเขียน PDF ได้โดยไม่ต้องขออนุญาตใคร
PDF/APDF/A คือโปรไฟล์ตามมาตรฐาน ISO 19005 ที่สร้างขึ้นเพื่อการเก็บรักษาระยะยาว เป้าหมายนั้นเรียบง่าย เอกสารที่เปิดในอีกห้าสิบปีข้างหน้าควรแสดงผลเหมือนกับวันนี้ทุกประการ โดยไม่มีฟอนต์หาย และไม่ต้องพึ่งพาทรัพยากรภายนอกที่อาจสูญหายไปแล้ว เพื่อรับประกันสิ่งนั้น มาตรฐานจึงห้ามทุกอย่างที่อาจพังเมื่อเวลาผ่านไป
PDF/UAPDF/UA (ISO 14289 โดย UA ย่อมาจาก Universal Accessibility) คือมาตรฐานที่ทำให้ PDF ใช้งานได้สำหรับผู้ที่พึ่งพาเทคโนโลยีสิ่งอำนวยความสะดวก โปรแกรมอ่านหน้าจอไม่อาจเข้าใจหมึกที่อยู่บนหน้ากระดาษได้ มันต้องการโครงสร้างเชิงตรรกะอยู่เบื้องล่าง PDF/UA กำหนดไว้อย่างชัดเจนว่าโครงสร้างนั้นต้องสร้างขึ้นอย่างไร
PDF/XPDF/X (ISO 15930) คือตระกูลของโปรไฟล์ที่สร้างขึ้นสำหรับงานพิมพ์ระดับมืออาชีพและงานศิลป์กราฟิก เมื่อไฟล์ถูกส่งไปยังเครื่องพิมพ์เชิงพาณิชย์ ความคลุมเครือคือต้นทุนที่แพง ฟอนต์ที่หายไป ภาพ RGB ในจุดที่ควรเป็น CMYK หรือกล่องตัดขอบที่ไม่ได้กำหนด อาจทำลายการพิมพ์ทั้งรอบได้ PDF/X ขจัดความคลุมเครือนั้นด้วยการบังคับให้รายละเอียดสำคัญต่อการพิมพ์ทุกอย่างถูกระบุอย่างชัดเจน
แนวคิด
OCR (Optical Character Recognition) เปลี่ยนภาพของข้อความให้กลายเป็นอักขระจริงที่เลือกได้ หน้าที่สแกนมาหรือภาพถ่ายของเอกสารนั้น สำหรับคอมพิวเตอร์แล้วเป็นเพียงตารางของพิกเซล ไม่มีข้อความอยู่ในนั้นเลย มีแค่ภาพที่บังเอิญดูเหมือนคำพูด OCR วิเคราะห์รูปร่างของตัวอักษรและสร้างสายอักขระเบื้องหลังขึ้นมาใหม่
AcroFormAcroForm คือเทคโนโลยีฟอร์มที่มีมาในตัวของ PDF เป็นฟอร์มแบบโต้ตอบชนิดที่อยู่คู่กับรูปแบบไฟล์นี้มาตั้งแต่ปลายทศวรรษ 1990 ช่องที่กรอกได้ซึ่งคุณเห็นในแบบแสดงรายการภาษีหรือใบสมัคร ทั้งกล่องข้อความ ช่องทำเครื่องหมาย ปุ่มตัวเลือก เมนูแบบเลื่อนลง และช่องลายเซ็น ล้วนเป็นอ็อบเจ็กต์ AcroForm ที่นิยามไว้โดยตรงในโครงสร้างอ็อบเจ็กต์ของ PDF
XFAXFA (XML Forms Architecture) คือเทคโนโลยีฟอร์มทางเลือกของ Adobe ที่ฟอร์มไม่ได้นิยามด้วยอ็อบเจ็กต์ PDF ในตัว แต่นิยามด้วยข้อมูล XML ที่ฝังอยู่ภายในเปลือก PDF มันถูกออกแบบมาสำหรับฟอร์มที่ซับซ้อนและเปลี่ยนแปลงได้ ทั้งเลย์เอาต์ที่ขยายเมื่อคุณเพิ่มแถว ช่องที่ปรากฏหรือหายไปตามคำตอบก่อนหน้า และการผูกแน่นกับสคีมาข้อมูลฝั่งหลังบ้าน
เมทาดาทาเมทาดาทาคือข้อมูลที่บอกเกี่ยวกับข้อมูลของคุณ เป็นสารสนเทศที่ PDF พกพาไว้นอกเหนือจากเนื้อหาหน้าที่มองเห็น มันมีที่เก็บหลักสองแห่ง คือพจนานุกรมข้อมูลเอกสารแบบดั้งเดิม (ชื่อเรื่อง ผู้เขียน หัวข้อ คำสำคัญ ซอฟต์แวร์ที่สร้างมันขึ้น และวันที่สร้างกับวันที่แก้ไข) และ XMP ซึ่งเป็นบล็อกอิงกับ XML ที่เก็บฟิลด์เดียวกันบวกกับคุณสมบัติที่ละเอียดและขยายได้มากกว่า
การบีบอัดการบีบอัดคือสิ่งที่ทำให้ขนาดไฟล์ PDF จัดการได้ และเอกสารฉบับเดียวมักผสมหลายวิธีเข้าด้วยกัน เพราะมันผสมเนื้อหาหลายชนิด ข้อความและคำสั่งวาดเวกเตอร์ถูกบีบอัดแบบไม่สูญเสียด้วย Flate (อัลกอริทึม Deflate ตัวเดียวกับที่อยู่เบื้องหลัง ZIP) อักขระทุกตัวจึงกลับมาเหมือนตอนที่ใส่เข้าไปทุกประการ
ฟอนต์ฝังตัวฟอนต์ฝังตัวคือชุดตัวอักษรที่บรรจุอยู่ภายในตัว PDF เอง แทนที่จะยืมมาจากคอมพิวเตอร์ที่เปิดมัน นี่คือคุณสมบัติที่ทำให้ PDF พกพาได้อย่างแท้จริง หากฟอนต์เดินทางไปพร้อมเอกสาร ข้อความก็จะแสดงผลเหมือนกันทุกที่ แม้แต่บนเครื่องที่ไม่เคยติดตั้งชุดตัวอักษรนั้น
ชั้นข้อความชั้นข้อความคือส่วนของ PDF ที่เก็บอักขระจริงที่เครื่องอ่านได้ เป็นเนื้อหาที่คุณเลือกด้วยเคอร์เซอร์ คัดลอก ค้นหา และให้อ่านออกเสียงได้ PDF ที่สร้างจากโปรแกรมประมวลผลคำหรือโปรแกรมจัดหน้ามีชั้นนี้มาในตัว โดยอักขระแต่ละตัวจับคู่กับตำแหน่งและฟอนต์
ลายน้ำลายน้ำคือข้อความหรือภาพที่วางทับบนหน้าของ PDF เพื่อกำกับสถานะหรือความเป็นเจ้าของ เช่นคำว่า "DRAFT" หรือ "CONFIDENTIAL" จาง ๆ พาดเฉียงทั่วหน้า โลโก้บริษัท หรือบรรทัดลิขสิทธิ์ มันส่งสัญญาณเจตนาโดยไม่บดบังเนื้อหาเบื้องล่าง โดยมักทำให้กึ่งโปร่งใสหรือวางอยู่หลังข้อความหลัก
การจัดเรียงเชิงเส้นการจัดเรียงเชิงเส้น ซึ่ง Adobe ทำตลาดในชื่อ Fast Web View คือวิธีจัดลำดับไบต์ภายในของ PDF ใหม่ เพื่อให้แสดงผลได้ก่อนที่ทั้งไฟล์จะมาถึง ใน PDF ปกติ ตารางอ้างอิงไขว้ที่ทำดัชนีอ็อบเจ็กต์ทุกชิ้นอยู่ที่ส่วนท้ายสุด โปรแกรมดูจึงต้องการไฟล์ทั้งหมดในทางเทคนิคเพื่อรู้ว่าสิ่งต่าง ๆ อยู่ที่ใด
ความปลอดภัย
AES (Advanced Encryption Standard) คือบล็อกไซเฟอร์ที่ปกป้อง PDF ที่ใส่รหัสผ่านไว้ เมื่อคุณล็อกเอกสาร สตรีมเนื้อหาหน้าและสตริงต่าง ๆ จะถูกเข้ารหัสด้วย AES และทางเดียวที่จะกลับไปสู่ไบต์ที่อ่านได้คือการให้รหัสผ่านที่ถูกต้องและดึงคีย์ที่ถูกต้องออกมา หากไม่มีมัน ไฟล์บนดิสก์ก็เป็นเพียงข้อความที่เข้ารหัสไว้
ลายเซ็นอิเล็กทรอนิกส์ลายเซ็นอิเล็กทรอนิกส์ ในความหมายทางกฎหมายที่กว้างที่สุด คือข้อมูลใด ๆ ที่แนบไปกับเอกสารเพื่อบ่งบอกเจตนาของผู้ลงนามที่จะตกลง ตั้งแต่ชื่อที่พิมพ์หรือเส้นยึกยือที่วาดขึ้น ไปจนถึงตราประทับที่ค้ำด้วยการเข้ารหัส กฎระเบียบ eIDAS ของสหภาพยุโรปจัดสิ่งเหล่านี้ออกเป็นระดับชั้น และความแตกต่างนั้นสำคัญเมื่อลายเซ็นต้องยืนหยัดได้ในภายหลัง
ลายเซ็นดิจิทัลลายเซ็นดิจิทัลคือกลไกการเข้ารหัสที่พิสูจน์ว่าใครเป็นผู้เซ็น PDF และยืนยันว่าไม่มีใครเปลี่ยนแปลงมันนับแต่นั้น มันคือเครื่องยนต์ทางเทคนิคที่ลายเซ็นอิเล็กทรอนิกส์ที่แข็งแกร่งที่สุดพึ่งพา และสร้างขึ้นจากการเข้ารหัสแบบกุญแจสาธารณะ ไม่ใช่ภาพรอยปากกาใด ๆ
ภาพ
กราฟิกเวกเตอร์อธิบายภาพเป็นคณิตศาสตร์ ทั้งจุด เส้น เส้นโค้ง และการเติมสี แทนที่จะเป็นตารางตายตัวของจุดสี วงกลมถูกเก็บเป็นจุดศูนย์กลาง รัศมี และสี คอมพิวเตอร์จึงวาดมันใหม่ที่ขนาดใดก็ได้ตามที่ขอ ผลที่ตามมาคือคุณสมบัติเด่นของงานเวกเตอร์ มันขยายได้ทุกขนาดโดยไม่สูญเสียความคมชัด
แรสเตอร์ภาพแรสเตอร์คือตารางสี่เหลี่ยมของพิกเซล แต่ละพิกเซลเก็บค่าสีหนึ่งค่า เป็นโมเดลเบื้องหลังภาพถ่ายและภาพสแกนทุกชิ้น ต่างจากเวกเตอร์ตรงที่แรสเตอร์มีความละเอียดดั้งเดิมที่ตายตัว มันเก็บจำนวนจุดในแนวกว้างและแนวลึกที่แน่นอน และรายละเอียดทั้งหมดถูกอบติดอยู่ในตารางนั้น
JPGJPG (เขียนอีกแบบว่า JPEG ตามชื่อ Joint Photographic Experts Group ที่นิยามมันขึ้น) คือรูปแบบแรสเตอร์แบบสูญเสียที่สร้างมาเพื่อภาพถ่าย มันทำงานโดยแปลงภาพเป็นองค์ประกอบเชิงความถี่และทิ้งรายละเอียดเล็ก ๆ ที่ตามนุษย์มีโอกาสสังเกตเห็นน้อยที่สุด ซึ่งเป็นวิธีที่มันบีบภาพถ่ายสีเต็มให้เป็นไฟล์ขนาดเล็ก
PNGPNG (Portable Network Graphics) คือรูปแบบแรสเตอร์แบบไม่สูญเสียสำหรับกราฟิกที่มีขอบคมและสีแบน ทั้งภาพหน้าจอ โลโก้ ไอคอน ไดอะแกรม และอะไรก็ตามที่มีข้อความ แบบไม่สูญเสียหมายความว่ามันเก็บภาพไว้เป๊ะ บันทึกซ้ำกี่ครั้งก็ได้โดยไม่มีพิกเซลใดเปลี่ยน ตรงกันข้ามกับการเสื่อมต่อรุ่นของ JPEG
WebPWebP คือรูปแบบภาพจาก Google ที่มุ่งแทนที่ทั้ง JPEG และ PNG ด้วยคอนเทนเนอร์เดียว เคล็ดลับของมันคือรองรับสองโหมด คือการบีบอัดแบบสูญเสียสำหรับภาพถ่ายแบบเดียวกับ JPEG และการบีบอัดแบบไม่สูญเสียสำหรับกราฟิกแบบเดียวกับ PNG โดยปกติให้ไฟล์เล็กกว่าทั้งสองรูปแบบที่คุณภาพเทียบเท่ากัน
TIFFTIFF (Tagged Image File Format) คือรูปแบบแรสเตอร์รุ่นใหญ่ที่ใช้ในการจัดเก็บ การสแกน และงานภาพระดับมืออาชีพ ชื่อของมันมาจากโครงสร้าง คือชุดแท็กที่ยืดหยุ่นซึ่งอธิบายภาพ ทำให้ TIFF ไฟล์เดียวเก็บข้อมูลที่ไม่บีบอัดหรือบีบอัดแบบไม่สูญเสีย ความลึกบิตสูง โปรไฟล์สีฝังตัว และเมทาดาทาทางเทคนิคจำนวนมากได้
SVGSVG (Scalable Vector Graphics) คือรูปแบบเวกเตอร์แบบเปิดที่อิงกับ XML เป็นภาพที่เขียนเป็นข้อความที่อ่านได้ซึ่งอธิบายรูปทรง เส้นทาง สี และตัวอักษร เพราะเป็นเวกเตอร์ มันจึงขยายได้ทุกขนาดด้วยขอบที่คมกริบ และเพราะเป็น XML มันจึงจัดสไตล์ด้วย CSS ได้ ทำภาพเคลื่อนไหวได้ และแม้แต่ค้นหาหรือแก้ไขในโปรแกรมแก้ไขข้อความธรรมดาได้
DPIDPI (dots per inch หรือจุดต่อนิ้ว) วัดความละเอียด ว่ามีจุดของรายละเอียดอัดแน่นอยู่ในแต่ละนิ้วของภาพหรืองานพิมพ์มากเพียงใด ตัวเลขยิ่งสูง รายละเอียดยิ่งละเอียดและไฟล์ยิ่งใหญ่ มันคือการตั้งค่าเดียวที่มักเป็นตัวตัดสินว่าการสแกนหรือการส่งออกจะดูคมชัดหรือน่าผิดหวัง