Skip to content
reader.me

GLOSARIUM PDF

Glosarium PDF: istilah dan format

Apa arti sebenarnya dari setiap istilah dan format PDF, dalam bahasa yang sederhana. Jargon yang kamu temui, dijelaskan.

Format

PDF

PDF (Portable Document Format) adalah format file yang mengunci posisi persis setiap karakter, garis, dan gambar di sebuah halaman, sehingga dokumen terlihat sama entah kamu membukanya di ponsel, laptop, atau di mesin RIP percetakan. Adobe menciptakannya pada 1993 dan menyerahkan spesifikasinya ke ISO pada 2008, di mana ia menjadi standar terbuka ISO 32000. Keterbukaan itulah yang membuat begitu banyak alat independen bisa membaca dan menulis PDF tanpa harus minta izin siapa pun.

PDF/A

PDF/A adalah profil ISO 19005 yang dibuat untuk pengarsipan jangka panjang. Tujuannya sederhana: dokumen yang dibuka lima puluh tahun lagi harus tampil persis seperti hari ini, tanpa font yang hilang dan tanpa ketergantungan pada sumber daya eksternal yang mungkin sudah lenyap. Untuk menjamin itu, standar ini melarang apa pun yang bisa rusak seiring waktu.

PDF/UA

PDF/UA (ISO 14289, di mana UA berarti Universal Accessibility) adalah standar yang membuat sebuah PDF bisa dipakai oleh orang yang mengandalkan teknologi bantu. Pembaca layar tidak bisa memahami tinta di atas kertas; ia butuh struktur logis di baliknya. PDF/UA mendefinisikan persis bagaimana struktur itu harus dibangun.

PDF/X

PDF/X (ISO 15930) adalah keluarga profil yang dibuat untuk percetakan profesional dan seni grafis. Ketika sebuah file dikirim ke mesin cetak komersial, ambiguitas itu mahal: font yang hilang, gambar RGB padahal yang diharapkan CMYK, atau trim box yang tak terdefinisi bisa merusak seluruh proses cetak. PDF/X menghilangkan ambiguitas itu dengan memaksa setiap detail penting untuk percetakan menjadi eksplisit.

Konsep

OCR

OCR (Optical Character Recognition) mengubah gambar teks menjadi karakter yang benar-benar bisa dipilih. Sebuah halaman pindaian atau foto dokumen, bagi komputer, hanyalah kisi piksel: tidak ada teks di dalamnya, hanya gambar yang kebetulan terlihat seperti kata-kata. OCR menganalisis bentuk huruf dan menyusun kembali rangkaian karakter di baliknya.

AcroForm

AcroForm adalah teknologi formulir bawaan asli PDF, jenis formulir interaktif yang telah menjadi bagian dari format ini sejak akhir 1990-an. Kolom isian yang kamu lihat di formulir pajak atau formulir pendaftaran, kotak teks, kotak centang, tombol radio, menu drop-down, dan kolom tanda tangan, semuanya adalah objek AcroForm yang didefinisikan langsung dalam struktur objek PDF.

XFA

XFA (XML Forms Architecture) adalah teknologi formulir alternatif milik Adobe, di mana formulir didefinisikan bukan oleh objek PDF asli melainkan oleh muatan XML yang disematkan di dalam pembungkus PDF. Ia dirancang untuk formulir yang kompleks dan dinamis: tata letak yang tumbuh saat kamu menambah baris, kolom yang muncul atau hilang berdasarkan jawaban sebelumnya, dan keterikatan erat dengan skema data di sisi back-end.

Metadata

Metadata adalah data tentang datamu, informasi yang dibawa sebuah PDF di luar konten halaman yang terlihat. Ada dua tempat penyimpanan utama: Document Information Dictionary yang lama (judul, penulis, subjek, kata kunci, perangkat lunak yang membuatnya, serta tanggal pembuatan dan modifikasi) dan XMP, sebuah blok berbasis XML yang menyimpan kolom yang sama plus properti yang lebih kaya dan bisa diperluas.

Kompresi

Kompresi adalah yang menjaga ukuran file PDF tetap terkelola, dan satu dokumen biasanya memadukan beberapa metode karena ia memadukan beberapa jenis konten. Teks dan instruksi gambar vektor dikompresi tanpa kehilangan data dengan Flate (algoritma Deflate yang sama di balik ZIP), jadi setiap karakter kembali persis seperti saat masuk.

Font tersemat

Font tersemat adalah jenis huruf yang dikemas di dalam PDF itu sendiri alih-alih dipinjam dari komputer yang membukanya. Inilah fitur yang membuat PDF benar-benar portabel: jika font ikut berpindah bersama dokumen, teks tampil identik di mana saja, bahkan di mesin yang tidak pernah memasang jenis huruf itu.

Lapisan teks

Lapisan teks adalah bagian dari sebuah PDF yang menyimpan karakter nyata yang bisa dibaca mesin, konten yang bisa kamu pilih dengan kursor, salin, cari, dan dibacakan dengan suara. Sebuah PDF yang dibuat dari pengolah kata atau aplikasi tata letak halaman memiliki lapisan ini secara bawaan, dengan setiap karakter dipetakan ke posisi dan sebuah font.

Watermark

Watermark adalah teks atau gambar yang dibubuhkan di atas halaman-halaman PDF untuk menandai status atau kepemilikan, sebuah tulisan samar "DRAFT" atau "CONFIDENTIAL" yang melintang miring di halaman, logo perusahaan, atau baris hak cipta. Ia menyiratkan niat tanpa menutupi konten di baliknya, biasanya dengan menjadi semi-transparan atau berada di belakang teks utama.

Linearisasi

Linearisasi, yang dipasarkan Adobe sebagai Fast Web View, adalah cara menata ulang urutan byte internal sebuah PDF agar bisa ditampilkan sebelum seluruh file tiba. Dalam PDF biasa, tabel referensi silang yang mengindeks setiap objek berada di paling akhir, jadi secara teknis penampil membutuhkan file lengkap untuk tahu di mana letak segala sesuatu.

Keamanan

Gambar

Vektor

Grafik vektor mendeskripsikan sebuah gambar sebagai matematika, titik, garis, kurva, dan isian, alih-alih sebagai kisi tetap berisi titik-titik berwarna. Sebuah lingkaran disimpan sebagai pusat, jari-jari, dan warna, jadi komputer menggambarnya ulang pada ukuran berapa pun yang diminta. Konsekuensinya adalah sifat khas seni vektor: ia bisa diskalakan ke ukuran apa pun tanpa kehilangan ketajaman.

Raster

Gambar raster adalah kisi piksel berbentuk persegi panjang, masing-masing menyimpan sebuah nilai warna, model di balik setiap foto dan pindaian. Tidak seperti vektor, raster punya resolusi asli yang tetap: ia menyimpan persis sekian banyak titik ke samping dan ke bawah, dan seluruh detailnya tertanam di dalam kisi itu.

JPG

JPG (ditulis juga JPEG, dari Joint Photographic Experts Group yang mendefinisikannya) adalah format raster lossy yang dibuat untuk foto. Ia bekerja dengan mengubah gambar menjadi komponen frekuensi dan membuang detail halus yang paling kecil kemungkinannya diperhatikan mata manusia, dan begitulah ia memampatkan foto berwarna penuh menjadi file kecil.

PNG

PNG (Portable Network Graphics) adalah format raster lossless untuk grafis dengan tepi tajam dan warna datar, tangkapan layar, logo, ikon, diagram, dan apa pun yang mengandung teks. Lossless berarti ia menyimpan gambar dengan persis: simpan ulang sesering apa pun yang kamu mau dan tidak satu piksel pun berubah, kebalikan dari penurunan generasional JPEG.

WebP

WebP adalah format gambar dari Google yang bertujuan menggantikan JPEG sekaligus PNG dengan satu wadah. Triknya adalah mendukung dua mode: kompresi lossy untuk foto, seperti JPEG, dan kompresi lossless untuk grafis, seperti PNG, sambil biasanya menghasilkan file lebih kecil daripada keduanya pada kualitas yang sebanding.

TIFF

TIFF (Tagged Image File Format) adalah format raster kelas berat yang dipakai dalam pengarsipan, pemindaian, dan pencitraan profesional. Namanya berasal dari strukturnya: sekumpulan tag fleksibel yang mendeskripsikan gambar, yang memungkinkan satu TIFF menyimpan data tak terkompresi atau terkompresi tanpa kehilangan data, kedalaman bit tinggi, profil warna tersemat, dan banyak sekali metadata teknis.

SVG

SVG (Scalable Vector Graphics) adalah format vektor terbuka berbasis XML, sebuah gambar yang ditulis sebagai teks yang bisa dibaca yang mendeskripsikan bentuk, jalur, warna, dan teks. Karena ia vektor, ia bisa diskalakan ke ukuran apa pun dengan tepi yang sempurna tajam, dan karena ia XML, ia bisa ditata dengan CSS, dianimasikan, bahkan dicari atau diedit di editor teks biasa.

DPI

DPI (dots per inch) mengukur resolusi, berapa banyak titik detail yang dijejalkan ke setiap inci sebuah gambar atau cetakan. Semakin tinggi angkanya, semakin halus detailnya dan semakin besar filenya. Ia adalah satu-satunya pengaturan yang paling sering menentukan apakah sebuah pindaian atau ekspor terlihat tajam atau mengecewakan.