Skip to content
reader.me

GLOSARI PDF

Glosari PDF: istilah dan format

Apa sebenarnya maksud setiap istilah dan format PDF, dalam bahasa yang mudah. Jargon yang kamu temui, dijelaskan.

Format

PDF

PDF (Portable Document Format) ialah format fail yang mengunci kedudukan tepat setiap aksara, garisan, dan imej pada satu halaman, jadi sesuatu dokumen kelihatan serupa sama ada kamu membukanya di telefon, komputer riba, atau pada RIP sebuah kedai cetak. Adobe menciptanya pada 1993 dan menyerahkan spesifikasinya kepada ISO pada 2008, di mana ia menjadi standard terbuka ISO 32000. Keterbukaan itulah yang membolehkan begitu banyak alat bebas membaca dan menulis PDF tanpa perlu meminta izin sesiapa pun.

PDF/A

PDF/A ialah profil ISO 19005 yang dibina untuk pengarkiban jangka panjang. Matlamatnya mudah: sesuatu dokumen yang dibuka lima puluh tahun lagi sepatutnya terpapar sama persis seperti hari ini, tanpa fon yang hilang dan tanpa kebergantungan pada sumber luaran yang mungkin sudah lenyap. Untuk menjamin perkara itu, standard ini melarang apa-apa yang boleh rosak seiring masa.

PDF/UA

PDF/UA (ISO 14289, di mana UA bermaksud Universal Accessibility) ialah standard yang menjadikan sebuah PDF boleh digunakan oleh orang yang bergantung pada teknologi bantuan. Pembaca skrin tidak dapat memahami dakwat di atas halaman; ia memerlukan struktur logik di sebaliknya. PDF/UA mentakrifkan dengan tepat bagaimana struktur itu mesti dibina.

PDF/X

PDF/X (ISO 15930) ialah keluarga profil yang dibuat untuk percetakan profesional dan seni grafik. Apabila sesuatu fail dihantar ke mesin cetak komersial, kekaburan itu mahal: fon yang hilang, imej RGB di tempat CMYK diharapkan, atau kotak pangkas yang tidak ditakrif boleh merosakkan keseluruhan larian cetakan. PDF/X menghapuskan kekaburan itu dengan memaksa setiap butiran penting cetakan dinyatakan secara jelas.

Konsep

OCR

OCR (Optical Character Recognition) menukar gambar teks menjadi aksara sebenar yang boleh dipilih. Sebuah halaman imbasan atau foto dokumen, bagi komputer, hanyalah grid piksel: tiada teks di dalamnya, hanya satu imej yang kebetulan kelihatan seperti perkataan. OCR menganalisis bentuk huruf dan membina semula rentetan aksara yang mendasarinya.

AcroForm

Sebuah AcroForm ialah teknologi borang asli dan terbina dalam PDF, jenis borang interaktif yang telah menjadi sebahagian daripada format ini sejak akhir tahun 1990-an. Medan boleh diisi yang kamu lihat dalam borang cukai atau borang permohonan, kotak teks, kotak semak, butang radio, senarai juntai bawah, dan medan tandatangan, ialah objek AcroForm yang ditakrif terus dalam struktur objek PDF.

XFA

XFA (XML Forms Architecture) ialah teknologi borang alternatif Adobe, yang mana borang itu ditakrif bukan oleh objek PDF asli tetapi oleh muatan XML yang dibenamkan di dalam pembalut PDF. Ia direka untuk borang yang kompleks dan dinamik: susun atur yang membesar apabila kamu menambah baris, medan yang muncul atau hilang berdasarkan jawapan terdahulu, dan ikatan rapat dengan skema data hujung belakang.

Metadata

Metadata ialah data tentang data kamu, maklumat yang dibawa sesuatu PDF di luar kandungan halaman yang kelihatan. Terdapat dua simpanan utama: Document Information Dictionary warisan (tajuk, pengarang, subjek, kata kunci, perisian yang menciptanya, serta tarikh penciptaan dan pengubahsuaian) dan XMP, satu blok berasaskan XML yang menyimpan medan yang sama serta sifat yang lebih kaya dan boleh dikembangkan.

Pemampatan

Pemampatan ialah perkara yang mengekalkan saiz fail PDF supaya terkawal, dan sesuatu dokumen tunggal biasanya mencampurkan beberapa kaedah kerana ia mencampurkan beberapa jenis kandungan. Teks dan arahan lukisan vektor dimampatkan tanpa kehilangan dengan Flate (algoritma Deflate yang sama di sebalik ZIP), jadi setiap aksara kembali persis seperti asalnya.

Fon terbenam

Fon terbenam ialah muka taip yang dibungkus di dalam PDF itu sendiri dan bukan dipinjam daripada komputer yang membukanya. Inilah ciri yang menjadikan PDF benar-benar mudah alih: jika fon mengembara bersama dokumen, teks terpapar serupa di mana-mana sahaja, malah pada mesin yang tidak pernah memasang muka taip itu.

Lapisan teks

Lapisan teks ialah bahagian PDF yang menyimpan aksara sebenar yang boleh dibaca mesin, kandungan yang boleh kamu pilih dengan kursor, salin, cari, dan dibaca dengan kuat. Sebuah PDF yang dibina daripada pemproses kata atau aplikasi susun atur halaman mempunyai lapisan ini secara asli, dengan setiap aksara dipetakan kepada satu kedudukan dan satu fon.

Tera air

Tera air ialah teks atau imej yang dihamparkan ke atas halaman PDF untuk menandakan status atau pemilikan, kalimat "DRAF" atau "SULIT" yang pudar secara pepenjuru merentas halaman, logo syarikat, atau baris hak cipta. Ia menandakan niat tanpa mengaburkan kandungan asas, biasanya dengan separa lutsinar atau berada di belakang teks utama.

Penglinearan

Penglinearan, yang dipasarkan oleh Adobe sebagai Fast Web View, ialah satu cara menyusun semula urutan bait dalaman sebuah PDF supaya ia boleh dipaparkan sebelum keseluruhan fail tiba. Dalam PDF biasa, jadual rujukan silang yang mengindeks setiap objek berada di hujung sekali, jadi pemapar secara teknikal memerlukan fail yang lengkap untuk mengetahui di mana letaknya sesuatu.

Keselamatan

Imej

Vektor

Grafik vektor menggambarkan sesuatu imej sebagai matematik, titik, garisan, lengkung, dan isian, dan bukan sebagai grid tetap titik berwarna. Sebuah bulatan disimpan sebagai satu pusat, satu jejari, dan satu warna, jadi komputer melukisnya semula pada apa jua saiz yang diminta. Akibatnya ialah sifat yang mentakrifkan seni vektor: ia berskala kepada apa jua saiz tanpa kehilangan ketajaman.

Raster

Sebuah imej raster ialah grid piksel berbentuk segi empat tepat, setiap satu memegang nilai warna, model di sebalik setiap foto dan imbasan. Tidak seperti vektor, raster mempunyai resolusi asli yang tetap: ia menyimpan persis sekian banyak titik melintang dan menurun, dan semua butirannya dipanggang ke dalam grid itu.

JPG

JPG (juga ditulis JPEG, sempena Joint Photographic Experts Group yang mentakrifkannya) ialah format raster berkehilangan yang dibina untuk foto. Ia berfungsi dengan menukar imej kepada komponen frekuensi dan membuang butiran halus yang paling kecil kemungkinan terlepas pandang oleh mata manusia, dan begitulah ia memerah foto berwarna penuh menjadi fail yang kecil.

PNG

PNG (Portable Network Graphics) ialah format raster tanpa kehilangan untuk grafik dengan tepi tajam dan warna rata, tangkapan skrin, logo, ikon, rajah, dan apa-apa yang mengandungi teks. Tanpa kehilangan bermaksud ia menyimpan imej dengan persis: simpan semula seberapa kerap yang kamu suka dan tiada satu piksel pun berubah, bertentangan dengan reputan bergenerasi JPEG.

WebP

WebP ialah format imej daripada Google yang menyasarkan untuk menggantikan kedua-dua JPEG dan PNG dengan satu bekas. Helahnya ialah menyokong dua mod: pemampatan berkehilangan untuk foto, seperti JPEG, dan pemampatan tanpa kehilangan untuk grafik, seperti PNG, sambil biasanya menghasilkan fail yang lebih kecil daripada kedua-duanya pada kualiti yang setanding.

TIFF

TIFF (Tagged Image File Format) ialah format raster kelas berat yang digunakan dalam pengarkiban, pengimbasan, dan pengimejan profesional. Namanya datang daripada strukturnya: satu set tag yang fleksibel menggambarkan imej, yang membolehkan satu TIFF tunggal memegang data yang tidak dimampatkan atau dimampatkan tanpa kehilangan, kedalaman bit yang tinggi, profil warna terbenam, dan banyak metadata teknikal.

SVG

SVG (Scalable Vector Graphics) ialah format vektor terbuka berasaskan XML, sebuah imej yang ditulis sebagai teks boleh baca yang menggambarkan bentuk, laluan, warna, dan teks. Oleh sebab ia vektor, ia berskala kepada apa jua saiz dengan tepi yang tajam dengan sempurna, dan oleh sebab ia XML, ia boleh digayakan dengan CSS, dianimasikan, dan malah dicari atau disunting dalam penyunting teks biasa.

DPI

DPI (dots per inch) mengukur resolusi, berapa banyak titik butiran yang dipadatkan ke dalam setiap inci sesuatu imej atau cetakan. Semakin tinggi nombornya, semakin halus butirannya dan semakin besar failnya. Ia ialah satu tetapan tunggal yang paling kerap menentukan sama ada sesuatu imbasan atau eksport kelihatan tajam atau mengecewakan.