Lapisan teks

Lapisan teks ialah bahagian PDF yang menyimpan aksara sebenar yang boleh dibaca mesin, kandungan yang boleh kamu pilih dengan kursor, salin, cari, dan dibaca dengan kuat. Sebuah PDF yang dibina daripada pemproses kata atau aplikasi susun atur halaman mempunyai lapisan ini secara asli, dengan setiap aksara dipetakan kepada satu kedudukan dan satu fon.

Kontrasnya ialah PDF imbasan, yang sering kali hanyalah gambar sesuatu halaman yang dibalut dalam pembungkusan PDF. Ia kelihatan seperti dokumen, tetapi tiada teks di sebaliknya, jadi carian tidak menemui apa-apa dan pemilihan tidak menangkap apa-apa. OCR ialah perkara yang menambah lapisan yang hilang itu: ia mengenali aksara dalam imej dan menulisnya semula sebagai lapisan teks halimunan yang dijajarkan pada piksel yang kelihatan, meninggalkan halaman kelihatan sama sambil menjadikannya boleh dicari sepenuhnya.

Mengetahui sama ada sesuatu fail mempunyai lapisan teks sebenar menjelaskan banyak kekecewaan harian, mengapa satu PDF boleh dicari dan satu lagi tidak. Apabila kamu memerlukan lapisan itu, menjananya secara setempat bermakna perkataan dokumen diekstrak pada mesin kamu sendiri dan bukan dihantar ke perkhidmatan jarak jauh yang boleh menyimpannya.

Alat berkaitan

Istilah lain

OCR AcroForm XFA Metadata Compression Embedded fonts

← Kembali ke glosari