元数据
元数据是关于你数据的数据,是 PDF 在可见页面内容之外所携带的信息。主要有两处存放点:传统的文档信息字典(标题、作者、主题、关键词、创建它的软件,以及创建和修改日期),以及 XMP——一段基于 XML 的区块,它保存相同的字段,外加更丰富、可扩展的属性。
当你阅读文档时,这些大多是不可见的,这正是它令人意外之处。从办公套件导出的 PDF 常常嵌入了作者的真名和原始文件名;从扫描生成的文件可能记录了所用的设备。这些都不出现在页面上,然而任何检视文件的人都能读到。对于发布文档的人来说,那条隐藏的痕迹可能泄露出超出本意的信息。
在你分享文件之前剥除或编辑元数据,是一项基本的隐私卫生举措,而和文档本身一样,最好在文件已经所在之处——你自己的机器上——完成,这样整个过程不会产生额外的副本。要注意,好的元数据也有价值:它让文档可被搜索,让档案保持有序,所以目标是对它的掌控,而非盲目删除。