Lapisan teks
Lapisan teks adalah bagian dari sebuah PDF yang menyimpan karakter nyata yang bisa dibaca mesin, konten yang bisa kamu pilih dengan kursor, salin, cari, dan dibacakan dengan suara. Sebuah PDF yang dibuat dari pengolah kata atau aplikasi tata letak halaman memiliki lapisan ini secara bawaan, dengan setiap karakter dipetakan ke posisi dan sebuah font.
Kebalikannya adalah PDF hasil pindaian, yang sering kali hanyalah gambar sebuah halaman yang dibungkus kemasan PDF. Ia terlihat seperti dokumen, tetapi tidak ada teks di baliknya, jadi pencarian tidak menemukan apa pun dan pemilihan tidak menangkap apa pun. OCR-lah yang menambahkan lapisan yang hilang itu: ia mengenali karakter dalam gambar dan menuliskannya kembali sebagai lapisan teks tak terlihat yang sejajar dengan piksel yang terlihat, membuat halaman tetap tampak sama sambil menjadikannya sepenuhnya bisa dicari.
Mengetahui apakah sebuah file punya lapisan teks asli menjelaskan banyak rasa frustrasi sehari-hari, mengapa satu PDF bisa dicari dan yang lain tidak. Saat kamu membutuhkan lapisan itu, membuatnya secara lokal berarti kata-kata dokumen diekstrak di mesinmu sendiri alih-alih diserahkan ke layanan jarak jauh yang bisa menyimpannya.