Skip to content
reader.me

Metadata

Metadata is de data over je data, de informatie die een PDF met zich meedraagt buiten de zichtbare pagina-inhoud. Er zijn twee belangrijke opslagplaatsen: het oudere Document Information Dictionary (titel, auteur, onderwerp, trefwoorden, de software die het maakte, en aanmaak- en wijzigingsdatums) en XMP, een op XML gebaseerd blok dat dezelfde velden bevat plus rijkere, uitbreidbare eigenschappen.

Het meeste hiervan is onzichtbaar wanneer je het document leest, en juist daarom verrast het mensen. Een PDF die uit een kantoorpakket is geëxporteerd, sluit vaak de echte naam van de auteur en de oorspronkelijke bestandsnaam in; een bestand dat uit een scan is gemaakt, kan het gebruikte apparaat vastleggen. Niets daarvan verschijnt op de pagina, en toch kan iedereen die het bestand inspecteert het lezen. Voor wie documenten publiceert, kan dat verborgen spoor meer lekken dan bedoeld.

Metadata verwijderen of bewerken voordat je een bestand deelt, is een basale stap in privacyhygiëne, en net als bij het document zelf doe je dat het best waar het bestand al staat, op je eigen apparaat, zodat er geen extra kopie ontstaat. Let wel: goede metadata heeft ook waarde, want het maakt documenten doorzoekbaar en houdt archieven geordend, dus het doel is er controle over hebben, niet blind verwijderen.