Siêu dữ liệu
Siêu dữ liệu là dữ liệu nói về dữ liệu của bạn, những thông tin mà một tệp PDF mang theo ngoài nội dung trang nhìn thấy được. Có hai kho chính: Document Information Dictionary cũ (tiêu đề, tác giả, chủ đề, từ khóa, phần mềm tạo ra nó, cùng ngày tạo và ngày sửa) và XMP, một khối dựa trên XML chứa cùng các trường đó cộng thêm những thuộc tính phong phú, có thể mở rộng.
Phần lớn thông tin này vô hình khi bạn đọc tài liệu, và đó chính xác là lý do nó khiến người ta bất ngờ. Một tệp PDF xuất ra từ bộ ứng dụng văn phòng thường nhúng tên thật của tác giả và tên tệp gốc; một tệp tạo ra từ bản quét có thể ghi lại thiết bị đã dùng. Không điều nào trong số đó xuất hiện trên trang, vậy mà bất kỳ ai kiểm tra tệp đều đọc được. Với những người công bố tài liệu, dấu vết ẩn đó có thể tiết lộ nhiều hơn dự định.
Tước bỏ hoặc chỉnh sửa siêu dữ liệu trước khi bạn chia sẻ một tệp là một bước vệ sinh quyền riêng tư cơ bản, và như chính tài liệu, tốt nhất nên làm ngay nơi tệp đang nằm, trên chính máy của bạn, để không có bản sao thừa nào được tạo ra trong quá trình. Lưu ý rằng siêu dữ liệu tốt cũng có giá trị: nó khiến tài liệu dễ tìm kiếm và giữ cho kho lưu trữ ngăn nắp, nên mục tiêu là kiểm soát nó, chứ không phải xóa một cách mù quáng.
Công cụ liên quan