Skip to content
reader.me

Метаданные

Метаданные — это данные о ваших данных, сведения, которые PDF несёт сверх видимого содержимого страницы. Хранилищ два: устаревший словарь информации о документе (заголовок, автор, тема, ключевые слова, создавшая программа, а также даты создания и изменения) и XMP — блок на основе XML, содержащий те же поля плюс более богатые, расширяемые свойства.

Большая часть этого невидима, когда вы читаете документ, — именно поэтому людей это застаёт врасплох. PDF, экспортированный из офисного пакета, часто встраивает настоящее имя автора и исходное имя файла; файл, полученный из скана, может записать использованное устройство. Ничего из этого не появляется на странице, но любой, кто заглянет в файл, сможет это прочитать. Для тех, кто публикует документы, такой скрытый след способен выдать больше, чем задумывалось.

Удалить или отредактировать метаданные перед тем, как делиться файлом, — базовый шаг гигиены приватности, и, как и сам документ, его лучше делать там, где файл уже находится, — на вашей собственной машине, чтобы в процессе не возникло лишней копии. Заметьте, что хорошие метаданные тоже полезны: они делают документы доступными для поиска и держат архивы в порядке, так что цель — контроль над ними, а не слепое удаление.