GLOSARI PDF
Glosari PDF: istilah dan format
Apa sebenarnya maksud setiap istilah dan format PDF, dalam bahasa yang mudah. Jargon yang kamu temui, dijelaskan.
Format
PDF (Portable Document Format) ialah format fail yang mengunci kedudukan tepat setiap aksara, garisan, dan imej pada satu halaman, jadi sesuatu dokumen kelihatan serupa sama ada kamu membukanya di telefon, komputer riba, atau pada RIP sebuah kedai cetak. Adobe menciptanya pada 1993 dan menyerahkan spesifikasinya kepada ISO pada 2008, di mana ia menjadi standard terbuka ISO 32000. Keterbukaan itulah yang membolehkan begitu banyak alat bebas membaca dan menulis PDF tanpa perlu meminta izin sesiapa pun.
PDF/APDF/A ialah profil ISO 19005 yang dibina untuk pengarkiban jangka panjang. Matlamatnya mudah: sesuatu dokumen yang dibuka lima puluh tahun lagi sepatutnya terpapar sama persis seperti hari ini, tanpa fon yang hilang dan tanpa kebergantungan pada sumber luaran yang mungkin sudah lenyap. Untuk menjamin perkara itu, standard ini melarang apa-apa yang boleh rosak seiring masa.
PDF/UAPDF/UA (ISO 14289, di mana UA bermaksud Universal Accessibility) ialah standard yang menjadikan sebuah PDF boleh digunakan oleh orang yang bergantung pada teknologi bantuan. Pembaca skrin tidak dapat memahami dakwat di atas halaman; ia memerlukan struktur logik di sebaliknya. PDF/UA mentakrifkan dengan tepat bagaimana struktur itu mesti dibina.
PDF/XPDF/X (ISO 15930) ialah keluarga profil yang dibuat untuk percetakan profesional dan seni grafik. Apabila sesuatu fail dihantar ke mesin cetak komersial, kekaburan itu mahal: fon yang hilang, imej RGB di tempat CMYK diharapkan, atau kotak pangkas yang tidak ditakrif boleh merosakkan keseluruhan larian cetakan. PDF/X menghapuskan kekaburan itu dengan memaksa setiap butiran penting cetakan dinyatakan secara jelas.
Konsep
OCR (Optical Character Recognition) menukar gambar teks menjadi aksara sebenar yang boleh dipilih. Sebuah halaman imbasan atau foto dokumen, bagi komputer, hanyalah grid piksel: tiada teks di dalamnya, hanya satu imej yang kebetulan kelihatan seperti perkataan. OCR menganalisis bentuk huruf dan membina semula rentetan aksara yang mendasarinya.
AcroFormSebuah AcroForm ialah teknologi borang asli dan terbina dalam PDF, jenis borang interaktif yang telah menjadi sebahagian daripada format ini sejak akhir tahun 1990-an. Medan boleh diisi yang kamu lihat dalam borang cukai atau borang permohonan, kotak teks, kotak semak, butang radio, senarai juntai bawah, dan medan tandatangan, ialah objek AcroForm yang ditakrif terus dalam struktur objek PDF.
XFAXFA (XML Forms Architecture) ialah teknologi borang alternatif Adobe, yang mana borang itu ditakrif bukan oleh objek PDF asli tetapi oleh muatan XML yang dibenamkan di dalam pembalut PDF. Ia direka untuk borang yang kompleks dan dinamik: susun atur yang membesar apabila kamu menambah baris, medan yang muncul atau hilang berdasarkan jawapan terdahulu, dan ikatan rapat dengan skema data hujung belakang.
MetadataMetadata ialah data tentang data kamu, maklumat yang dibawa sesuatu PDF di luar kandungan halaman yang kelihatan. Terdapat dua simpanan utama: Document Information Dictionary warisan (tajuk, pengarang, subjek, kata kunci, perisian yang menciptanya, serta tarikh penciptaan dan pengubahsuaian) dan XMP, satu blok berasaskan XML yang menyimpan medan yang sama serta sifat yang lebih kaya dan boleh dikembangkan.
PemampatanPemampatan ialah perkara yang mengekalkan saiz fail PDF supaya terkawal, dan sesuatu dokumen tunggal biasanya mencampurkan beberapa kaedah kerana ia mencampurkan beberapa jenis kandungan. Teks dan arahan lukisan vektor dimampatkan tanpa kehilangan dengan Flate (algoritma Deflate yang sama di sebalik ZIP), jadi setiap aksara kembali persis seperti asalnya.
Fon terbenamFon terbenam ialah muka taip yang dibungkus di dalam PDF itu sendiri dan bukan dipinjam daripada komputer yang membukanya. Inilah ciri yang menjadikan PDF benar-benar mudah alih: jika fon mengembara bersama dokumen, teks terpapar serupa di mana-mana sahaja, malah pada mesin yang tidak pernah memasang muka taip itu.
Lapisan teksLapisan teks ialah bahagian PDF yang menyimpan aksara sebenar yang boleh dibaca mesin, kandungan yang boleh kamu pilih dengan kursor, salin, cari, dan dibaca dengan kuat. Sebuah PDF yang dibina daripada pemproses kata atau aplikasi susun atur halaman mempunyai lapisan ini secara asli, dengan setiap aksara dipetakan kepada satu kedudukan dan satu fon.
Tera airTera air ialah teks atau imej yang dihamparkan ke atas halaman PDF untuk menandakan status atau pemilikan, kalimat "DRAF" atau "SULIT" yang pudar secara pepenjuru merentas halaman, logo syarikat, atau baris hak cipta. Ia menandakan niat tanpa mengaburkan kandungan asas, biasanya dengan separa lutsinar atau berada di belakang teks utama.
PenglinearanPenglinearan, yang dipasarkan oleh Adobe sebagai Fast Web View, ialah satu cara menyusun semula urutan bait dalaman sebuah PDF supaya ia boleh dipaparkan sebelum keseluruhan fail tiba. Dalam PDF biasa, jadual rujukan silang yang mengindeks setiap objek berada di hujung sekali, jadi pemapar secara teknikal memerlukan fail yang lengkap untuk mengetahui di mana letaknya sesuatu.
Keselamatan
AES (Advanced Encryption Standard) ialah sifer blok yang melindungi PDF yang dikawal kata laluan. Apabila kamu mengunci sesuatu dokumen, strim kandungan halaman dan rentetannya disulitkan dengan AES, dan satu-satunya jalan kembali ke bait yang boleh dibaca ialah dengan membekalkan kata laluan yang betul dan menerbitkan kunci yang tepat. Tanpanya, fail di cakera hanyalah teks sifer.
Tandatangan elektronikTandatangan elektronik, dalam erti undang-undang yang paling luas, ialah sebarang data yang dilampirkan pada sesuatu dokumen yang menunjukkan niat penandatangan untuk bersetuju, daripada nama yang ditaip atau coretan yang dilukis sehingga meterai yang disokong secara kriptografi. Peraturan eIDAS Kesatuan Eropah menyusunnya kepada beberapa peringkat, dan perbezaan itu penting apabila sesuatu tandatangan perlu bertahan kemudian.
Tandatangan digitalTandatangan digital ialah mekanisme kriptografi yang membuktikan siapa yang menandatangani sesuatu PDF dan bahawa tiada sesiapa mengubahnya sejak itu. Ia ialah enjin teknikal yang menjadi sandaran tandatangan elektronik yang paling kuat, dan ia dibina daripada kriptografi kunci awam, bukan daripada sebarang gambar coretan pen.
Imej
Grafik vektor menggambarkan sesuatu imej sebagai matematik, titik, garisan, lengkung, dan isian, dan bukan sebagai grid tetap titik berwarna. Sebuah bulatan disimpan sebagai satu pusat, satu jejari, dan satu warna, jadi komputer melukisnya semula pada apa jua saiz yang diminta. Akibatnya ialah sifat yang mentakrifkan seni vektor: ia berskala kepada apa jua saiz tanpa kehilangan ketajaman.
RasterSebuah imej raster ialah grid piksel berbentuk segi empat tepat, setiap satu memegang nilai warna, model di sebalik setiap foto dan imbasan. Tidak seperti vektor, raster mempunyai resolusi asli yang tetap: ia menyimpan persis sekian banyak titik melintang dan menurun, dan semua butirannya dipanggang ke dalam grid itu.
JPGJPG (juga ditulis JPEG, sempena Joint Photographic Experts Group yang mentakrifkannya) ialah format raster berkehilangan yang dibina untuk foto. Ia berfungsi dengan menukar imej kepada komponen frekuensi dan membuang butiran halus yang paling kecil kemungkinan terlepas pandang oleh mata manusia, dan begitulah ia memerah foto berwarna penuh menjadi fail yang kecil.
PNGPNG (Portable Network Graphics) ialah format raster tanpa kehilangan untuk grafik dengan tepi tajam dan warna rata, tangkapan skrin, logo, ikon, rajah, dan apa-apa yang mengandungi teks. Tanpa kehilangan bermaksud ia menyimpan imej dengan persis: simpan semula seberapa kerap yang kamu suka dan tiada satu piksel pun berubah, bertentangan dengan reputan bergenerasi JPEG.
WebPWebP ialah format imej daripada Google yang menyasarkan untuk menggantikan kedua-dua JPEG dan PNG dengan satu bekas. Helahnya ialah menyokong dua mod: pemampatan berkehilangan untuk foto, seperti JPEG, dan pemampatan tanpa kehilangan untuk grafik, seperti PNG, sambil biasanya menghasilkan fail yang lebih kecil daripada kedua-duanya pada kualiti yang setanding.
TIFFTIFF (Tagged Image File Format) ialah format raster kelas berat yang digunakan dalam pengarkiban, pengimbasan, dan pengimejan profesional. Namanya datang daripada strukturnya: satu set tag yang fleksibel menggambarkan imej, yang membolehkan satu TIFF tunggal memegang data yang tidak dimampatkan atau dimampatkan tanpa kehilangan, kedalaman bit yang tinggi, profil warna terbenam, dan banyak metadata teknikal.
SVGSVG (Scalable Vector Graphics) ialah format vektor terbuka berasaskan XML, sebuah imej yang ditulis sebagai teks boleh baca yang menggambarkan bentuk, laluan, warna, dan teks. Oleh sebab ia vektor, ia berskala kepada apa jua saiz dengan tepi yang tajam dengan sempurna, dan oleh sebab ia XML, ia boleh digayakan dengan CSS, dianimasikan, dan malah dicari atau disunting dalam penyunting teks biasa.
DPIDPI (dots per inch) mengukur resolusi, berapa banyak titik butiran yang dipadatkan ke dalam setiap inci sesuatu imej atau cetakan. Semakin tinggi nombornya, semakin halus butirannya dan semakin besar failnya. Ia ialah satu tetapan tunggal yang paling kerap menentukan sama ada sesuatu imbasan atau eksport kelihatan tajam atau mengecewakan.