Skip to content
reader.me

中繼資料

中繼資料是關於你資料的資料,也就是一份 PDF 在可見的頁面內容之外所帶著的資訊。主要有兩個儲存處:傳統的文件資訊字典(標題、作者、主旨、關鍵字、建立它的軟體,以及建立與修改日期)以及 XMP,那是一段以 XML 為基礎的區塊,存放相同的欄位,外加更豐富、可擴充的屬性。

當你閱讀文件時,這些大多看不見,這正是它會讓人吃驚的原因。從辦公軟體匯出的 PDF,常常嵌入了作者的真實姓名與原始檔名;由掃描產生的檔案,可能記錄了所用的裝置。這些都不會出現在頁面上,然而任何檢視該檔案的人都讀得到。對於任何發布文件的人來說,那條隱藏的痕跡可能洩漏比預期更多的資訊。

在分享檔案前先去除或編輯中繼資料,是一項基本的隱私衛生步驟,而且和文件本身一樣,最好在檔案已經所在之處,也就是你自己的機器上進行,這樣過程中就不會多生出一份副本。要留意,好的中繼資料也有價值:它讓文件可被搜尋,也讓檔案室井然有序,所以目標是掌控它,而非盲目刪除。