GLOSARIUM PDF
Glosarium PDF: istilah dan format
Apa arti sebenarnya dari setiap istilah dan format PDF, dalam bahasa yang sederhana. Jargon yang kamu temui, dijelaskan.
Format
PDF (Portable Document Format) adalah format file yang mengunci posisi persis setiap karakter, garis, dan gambar di sebuah halaman, sehingga dokumen terlihat sama entah kamu membukanya di ponsel, laptop, atau di mesin RIP percetakan. Adobe menciptakannya pada 1993 dan menyerahkan spesifikasinya ke ISO pada 2008, di mana ia menjadi standar terbuka ISO 32000. Keterbukaan itulah yang membuat begitu banyak alat independen bisa membaca dan menulis PDF tanpa harus minta izin siapa pun.
PDF/APDF/A adalah profil ISO 19005 yang dibuat untuk pengarsipan jangka panjang. Tujuannya sederhana: dokumen yang dibuka lima puluh tahun lagi harus tampil persis seperti hari ini, tanpa font yang hilang dan tanpa ketergantungan pada sumber daya eksternal yang mungkin sudah lenyap. Untuk menjamin itu, standar ini melarang apa pun yang bisa rusak seiring waktu.
PDF/UAPDF/UA (ISO 14289, di mana UA berarti Universal Accessibility) adalah standar yang membuat sebuah PDF bisa dipakai oleh orang yang mengandalkan teknologi bantu. Pembaca layar tidak bisa memahami tinta di atas kertas; ia butuh struktur logis di baliknya. PDF/UA mendefinisikan persis bagaimana struktur itu harus dibangun.
PDF/XPDF/X (ISO 15930) adalah keluarga profil yang dibuat untuk percetakan profesional dan seni grafis. Ketika sebuah file dikirim ke mesin cetak komersial, ambiguitas itu mahal: font yang hilang, gambar RGB padahal yang diharapkan CMYK, atau trim box yang tak terdefinisi bisa merusak seluruh proses cetak. PDF/X menghilangkan ambiguitas itu dengan memaksa setiap detail penting untuk percetakan menjadi eksplisit.
Konsep
OCR (Optical Character Recognition) mengubah gambar teks menjadi karakter yang benar-benar bisa dipilih. Sebuah halaman pindaian atau foto dokumen, bagi komputer, hanyalah kisi piksel: tidak ada teks di dalamnya, hanya gambar yang kebetulan terlihat seperti kata-kata. OCR menganalisis bentuk huruf dan menyusun kembali rangkaian karakter di baliknya.
AcroFormAcroForm adalah teknologi formulir bawaan asli PDF, jenis formulir interaktif yang telah menjadi bagian dari format ini sejak akhir 1990-an. Kolom isian yang kamu lihat di formulir pajak atau formulir pendaftaran, kotak teks, kotak centang, tombol radio, menu drop-down, dan kolom tanda tangan, semuanya adalah objek AcroForm yang didefinisikan langsung dalam struktur objek PDF.
XFAXFA (XML Forms Architecture) adalah teknologi formulir alternatif milik Adobe, di mana formulir didefinisikan bukan oleh objek PDF asli melainkan oleh muatan XML yang disematkan di dalam pembungkus PDF. Ia dirancang untuk formulir yang kompleks dan dinamis: tata letak yang tumbuh saat kamu menambah baris, kolom yang muncul atau hilang berdasarkan jawaban sebelumnya, dan keterikatan erat dengan skema data di sisi back-end.
MetadataMetadata adalah data tentang datamu, informasi yang dibawa sebuah PDF di luar konten halaman yang terlihat. Ada dua tempat penyimpanan utama: Document Information Dictionary yang lama (judul, penulis, subjek, kata kunci, perangkat lunak yang membuatnya, serta tanggal pembuatan dan modifikasi) dan XMP, sebuah blok berbasis XML yang menyimpan kolom yang sama plus properti yang lebih kaya dan bisa diperluas.
KompresiKompresi adalah yang menjaga ukuran file PDF tetap terkelola, dan satu dokumen biasanya memadukan beberapa metode karena ia memadukan beberapa jenis konten. Teks dan instruksi gambar vektor dikompresi tanpa kehilangan data dengan Flate (algoritma Deflate yang sama di balik ZIP), jadi setiap karakter kembali persis seperti saat masuk.
Font tersematFont tersemat adalah jenis huruf yang dikemas di dalam PDF itu sendiri alih-alih dipinjam dari komputer yang membukanya. Inilah fitur yang membuat PDF benar-benar portabel: jika font ikut berpindah bersama dokumen, teks tampil identik di mana saja, bahkan di mesin yang tidak pernah memasang jenis huruf itu.
Lapisan teksLapisan teks adalah bagian dari sebuah PDF yang menyimpan karakter nyata yang bisa dibaca mesin, konten yang bisa kamu pilih dengan kursor, salin, cari, dan dibacakan dengan suara. Sebuah PDF yang dibuat dari pengolah kata atau aplikasi tata letak halaman memiliki lapisan ini secara bawaan, dengan setiap karakter dipetakan ke posisi dan sebuah font.
WatermarkWatermark adalah teks atau gambar yang dibubuhkan di atas halaman-halaman PDF untuk menandai status atau kepemilikan, sebuah tulisan samar "DRAFT" atau "CONFIDENTIAL" yang melintang miring di halaman, logo perusahaan, atau baris hak cipta. Ia menyiratkan niat tanpa menutupi konten di baliknya, biasanya dengan menjadi semi-transparan atau berada di belakang teks utama.
LinearisasiLinearisasi, yang dipasarkan Adobe sebagai Fast Web View, adalah cara menata ulang urutan byte internal sebuah PDF agar bisa ditampilkan sebelum seluruh file tiba. Dalam PDF biasa, tabel referensi silang yang mengindeks setiap objek berada di paling akhir, jadi secara teknis penampil membutuhkan file lengkap untuk tahu di mana letak segala sesuatu.
Keamanan
AES (Advanced Encryption Standard) adalah block cipher yang mengamankan PDF terproteksi kata sandi. Saat kamu mengunci sebuah dokumen, stream konten halaman dan string-nya dienkripsi dengan AES, dan satu-satunya jalan kembali ke byte yang bisa dibaca adalah memasukkan kata sandi yang benar dan menurunkan kunci yang tepat. Tanpa itu, file di disk hanyalah ciphertext.
Tanda tangan elektronikTanda tangan elektronik, dalam pengertian hukum yang paling luas, adalah data apa pun yang dilampirkan ke sebuah dokumen yang menunjukkan niat penanda tangan untuk menyetujui, mulai dari nama yang diketik atau coretan yang digambar hingga segel yang didukung kriptografi. Regulasi eIDAS di Uni Eropa memilah ini ke dalam beberapa tingkat, dan perbedaan itu penting ketika sebuah tanda tangan harus teruji di kemudian hari.
Tanda tangan digitalTanda tangan digital adalah mekanisme kriptografi yang membuktikan siapa yang menandatangani sebuah PDF dan bahwa tidak ada yang mengubahnya sejak saat itu. Ia adalah mesin teknis yang diandalkan oleh tanda tangan elektronik terkuat, dan dibangun dari kriptografi kunci publik, bukan dari gambar goresan pena apa pun.
Gambar
Grafik vektor mendeskripsikan sebuah gambar sebagai matematika, titik, garis, kurva, dan isian, alih-alih sebagai kisi tetap berisi titik-titik berwarna. Sebuah lingkaran disimpan sebagai pusat, jari-jari, dan warna, jadi komputer menggambarnya ulang pada ukuran berapa pun yang diminta. Konsekuensinya adalah sifat khas seni vektor: ia bisa diskalakan ke ukuran apa pun tanpa kehilangan ketajaman.
RasterGambar raster adalah kisi piksel berbentuk persegi panjang, masing-masing menyimpan sebuah nilai warna, model di balik setiap foto dan pindaian. Tidak seperti vektor, raster punya resolusi asli yang tetap: ia menyimpan persis sekian banyak titik ke samping dan ke bawah, dan seluruh detailnya tertanam di dalam kisi itu.
JPGJPG (ditulis juga JPEG, dari Joint Photographic Experts Group yang mendefinisikannya) adalah format raster lossy yang dibuat untuk foto. Ia bekerja dengan mengubah gambar menjadi komponen frekuensi dan membuang detail halus yang paling kecil kemungkinannya diperhatikan mata manusia, dan begitulah ia memampatkan foto berwarna penuh menjadi file kecil.
PNGPNG (Portable Network Graphics) adalah format raster lossless untuk grafis dengan tepi tajam dan warna datar, tangkapan layar, logo, ikon, diagram, dan apa pun yang mengandung teks. Lossless berarti ia menyimpan gambar dengan persis: simpan ulang sesering apa pun yang kamu mau dan tidak satu piksel pun berubah, kebalikan dari penurunan generasional JPEG.
WebPWebP adalah format gambar dari Google yang bertujuan menggantikan JPEG sekaligus PNG dengan satu wadah. Triknya adalah mendukung dua mode: kompresi lossy untuk foto, seperti JPEG, dan kompresi lossless untuk grafis, seperti PNG, sambil biasanya menghasilkan file lebih kecil daripada keduanya pada kualitas yang sebanding.
TIFFTIFF (Tagged Image File Format) adalah format raster kelas berat yang dipakai dalam pengarsipan, pemindaian, dan pencitraan profesional. Namanya berasal dari strukturnya: sekumpulan tag fleksibel yang mendeskripsikan gambar, yang memungkinkan satu TIFF menyimpan data tak terkompresi atau terkompresi tanpa kehilangan data, kedalaman bit tinggi, profil warna tersemat, dan banyak sekali metadata teknis.
SVGSVG (Scalable Vector Graphics) adalah format vektor terbuka berbasis XML, sebuah gambar yang ditulis sebagai teks yang bisa dibaca yang mendeskripsikan bentuk, jalur, warna, dan teks. Karena ia vektor, ia bisa diskalakan ke ukuran apa pun dengan tepi yang sempurna tajam, dan karena ia XML, ia bisa ditata dengan CSS, dianimasikan, bahkan dicari atau diedit di editor teks biasa.
DPIDPI (dots per inch) mengukur resolusi, berapa banyak titik detail yang dijejalkan ke setiap inci sebuah gambar atau cetakan. Semakin tinggi angkanya, semakin halus detailnya dan semakin besar filenya. Ia adalah satu-satunya pengaturan yang paling sering menentukan apakah sebuah pindaian atau ekspor terlihat tajam atau mengecewakan.