Skip to content
reader.me

Metadaten

Metadaten sind die Daten über deine Daten – die Informationen, die ein PDF über den sichtbaren Seiteninhalt hinaus mit sich trägt. Es gibt zwei Hauptspeicher: das klassische Document Information Dictionary (Titel, Autor, Thema, Schlüsselwörter, die erstellende Software sowie Erstell- und Änderungsdatum) und XMP, einen XML-basierten Block, der dieselben Felder plus reichhaltigere, erweiterbare Eigenschaften enthält.

Das meiste davon ist beim Lesen des Dokuments unsichtbar, und genau deshalb überrascht es viele. Ein aus einer Office-Anwendung exportiertes PDF bettet oft den echten Namen des Autors und den ursprünglichen Dateinamen ein; eine aus einem Scan erzeugte Datei kann das verwendete Gerät festhalten. Nichts davon erscheint auf der Seite, doch jeder, der die Datei inspiziert, kann es lesen. Für alle, die Dokumente veröffentlichen, kann diese verborgene Spur mehr verraten als beabsichtigt.

Metadaten vor dem Teilen einer Datei zu entfernen oder zu bearbeiten ist eine grundlegende Maßnahme der Datenschutzhygiene, und wie das Dokument selbst macht man das am besten dort, wo die Datei ohnehin liegt – auf dem eigenen Rechner –, damit dabei keine zusätzliche Kopie entsteht. Beachte: Gute Metadaten haben auch ihren Wert, sie machen Dokumente durchsuchbar und halten Archive geordnet. Das Ziel ist also Kontrolle darüber, nicht blindes Löschen.