メタデータ
メタデータとは、データについてのデータ、つまりPDFが見えるページの内容を超えて持っている情報のことです。主な保管場所は2つあります。従来のDocument Information Dictionary(タイトル、作成者、件名、キーワード、作成に使ったソフトウェア、作成日と更新日)と、同じ項目に加えてより豊かで拡張可能なプロパティを保持するXMLベースのブロックであるXMPです。
このほとんどは文書を読むときには見えません。だからこそ人を驚かせます。オフィススイートから書き出したPDFは作成者の本名や元のファイル名を埋め込んでいることが多く、スキャンから生成したファイルは使った装置を記録していることがあります。どれもページには現れませんが、ファイルを調べれば誰でも読めます。文書を公開する人にとって、その隠れた痕跡は意図した以上のものを漏らしかねません。
ファイルを共有する前にメタデータを取り除くか編集することは、基本的なプライバシー衛生の一手です。そして文書そのものと同じく、ファイルがすでにある場所、つまり自分のマシンで行うのが最善で、その過程で余分なコピーが作られることもありません。ただし、良いメタデータには価値もあることに注意してください。文書を検索可能にし、アーカイブを整理された状態に保ちます。目指すべきは、やみくもな削除ではなく、その制御です。