Skip to content
reader.me

PDF-WOORDENLIJST

PDF-woordenlijst: termen en formaten

Wat elke PDF-term en elk formaat echt betekent, in gewone taal. Het jargon dat je tegenkomt, uitgelegd.

Formaten

PDF

PDF (Portable Document Format) is een bestandsformaat dat de exacte plek van elk teken, elke lijn en elke afbeelding op een pagina vastlegt, zodat een document er identiek uitziet of je het nu opent op een telefoon, een laptop of de RIP van een drukkerij. Adobe bedacht het in 1993 en gaf de specificatie in 2008 aan ISO, waar het de open standaard ISO 32000 werd. Juist door die openheid kunnen zo veel onafhankelijke tools een PDF lezen en schrijven zonder iemand om toestemming te vragen.

PDF/A

PDF/A is het ISO 19005-profiel dat gemaakt is voor langdurige archivering. Het doel is simpel: een document dat over vijftig jaar wordt geopend, moet er precies zo uitzien als vandaag, zonder ontbrekende lettertypen en zonder afhankelijkheid van externe bronnen die misschien verdwenen zijn. Om dat te garanderen verbiedt de standaard alles wat na verloop van tijd kapot zou kunnen gaan.

PDF/UA

PDF/UA (ISO 14289, waarbij UA staat voor Universal Accessibility) is de standaard die een PDF bruikbaar maakt voor mensen die afhankelijk zijn van hulptechnologie. Een schermlezer kan niets met inkt op een pagina; hij heeft een logische structuur eronder nodig. PDF/UA legt precies vast hoe die structuur opgebouwd moet zijn.

PDF/X

PDF/X (ISO 15930) is de familie profielen die gemaakt is voor professioneel drukwerk en grafische vormgeving. Wanneer een bestand naar een commerciële drukpers gaat, is dubbelzinnigheid duur: een ontbrekend lettertype, een RGB-afbeelding waar CMYK werd verwacht, of een ongedefinieerde snijmarge kan een hele oplage verpesten. PDF/X haalt die dubbelzinnigheid weg door elk drukkritisch detail expliciet te maken.

Concepten

OCR

OCR (Optical Character Recognition) zet een afbeelding van tekst om in echte, selecteerbare tekens. Een gescande pagina of een foto van een document is voor een computer slechts een raster van pixels: er zit geen tekst in, alleen een afbeelding die toevallig op woorden lijkt. OCR analyseert de vormen van letters en reconstrueert de onderliggende reeks tekens.

AcroForm

Een AcroForm is de eigen, ingebouwde formuliertechnologie van PDF, het soort interactief formulier dat sinds eind jaren negentig deel uitmaakt van het formaat. De invulbare velden die je in een belastingaangifte of een aanvraagformulier ziet, tekstvakken, selectievakjes, keuzerondjes, vervolgkeuzelijsten en handtekeningvelden, zijn AcroForm-objecten die rechtstreeks in de objectstructuur van de PDF zijn gedefinieerd.

XFA

XFA (XML Forms Architecture) is de alternatieve formuliertechnologie van Adobe, waarin het formulier niet wordt gedefinieerd door eigen PDF-objecten maar door een XML-payload die in de PDF-omhulling is ingesloten. Het was ontworpen voor complexe, dynamische formulieren: opmaak die meegroeit als je rijen toevoegt, velden die verschijnen of verdwijnen op basis van eerdere antwoorden, en een nauwe koppeling met back-end gegevensschema's.

Metadata

Metadata is de data over je data, de informatie die een PDF met zich meedraagt buiten de zichtbare pagina-inhoud. Er zijn twee belangrijke opslagplaatsen: het oudere Document Information Dictionary (titel, auteur, onderwerp, trefwoorden, de software die het maakte, en aanmaak- en wijzigingsdatums) en XMP, een op XML gebaseerd blok dat dezelfde velden bevat plus rijkere, uitbreidbare eigenschappen.

Compressie

Compressie houdt de bestandsgrootte van PDFs beheersbaar, en één document mengt meestal meerdere methoden omdat het meerdere soorten inhoud mengt. Tekst en vectortekeninstructies worden zonder verlies gecomprimeerd met Flate (hetzelfde Deflate-algoritme achter ZIP), zodat elk teken er precies zo uitkomt als het erin ging.

Ingesloten lettertypen

Ingesloten lettertypen zijn lettertypen die in de PDF zelf zitten in plaats van geleend van de computer die hem opent. Dit is de functie die een PDF echt draagbaar maakt: als het lettertype met het document meereist, wordt de tekst overal identiek weergegeven, zelfs op een machine waarop dat lettertype nooit is geïnstalleerd.

Tekstlaag

De tekstlaag is het deel van een PDF dat echte, machineleesbare tekens bevat, de inhoud die je met de cursor kunt selecteren, kopiëren, doorzoeken en hardop kunt laten voorlezen. Een PDF die uit een tekstverwerker of opmaakprogramma komt, heeft deze laag van nature, met elk teken gekoppeld aan een positie en een lettertype.

Watermerk

Een watermerk is tekst of een afbeelding die over de pagina's van een PDF wordt gelegd om status of eigendom te markeren, een vaag "CONCEPT" of "VERTROUWELIJK" diagonaal over de pagina, een bedrijfslogo, of een copyrightregel. Het geeft een bedoeling aan zonder de onderliggende inhoud te verbergen, meestal door halfdoorzichtig te zijn of achter de hoofdtekst te zitten.

Linearisatie

Linearisatie, door Adobe op de markt gebracht als Fast Web View, is een manier om de interne bytevolgorde van een PDF te herorganiseren zodat hij kan worden weergegeven voordat het hele bestand is binnengekomen. In een gewone PDF staat de kruisverwijzingstabel die elk object indexeert helemaal aan het einde, dus een viewer heeft technisch gezien het complete bestand nodig om te weten waar dingen staan.

Beveiliging

Afbeeldingen

Vector

Vectorafbeeldingen beschrijven een afbeelding als wiskunde, punten, lijnen, krommen en vullingen, in plaats van als een vast raster van gekleurde stippen. Een cirkel wordt opgeslagen als een middelpunt, een straal en een kleur, zodat de computer hem opnieuw tekent op elke gevraagde grootte. Het gevolg is de bepalende eigenschap van vectorkunst: hij schaalt naar elke grootte zonder verlies van scherpte.

Raster

Een rasterafbeelding is een rechthoekig raster van pixels, elk met een kleurwaarde, het model achter elke foto en scan. Anders dan een vector heeft een raster een vaste oorspronkelijke resolutie: het slaat precies zoveel stippen breed en hoog op, en al het detail is in dat raster ingebakken.

JPG

JPG (ook geschreven als JPEG, naar de Joint Photographic Experts Group die het definieerde) is het lossy rasterformaat dat voor foto's is gemaakt. Het werkt door de afbeelding om te zetten in frequentiecomponenten en het fijne detail weg te gooien dat het menselijk oog het minst snel mist, en zo perst het een volkleurenfoto in een klein bestand.

PNG

PNG (Portable Network Graphics) is het lossless rasterformaat voor afbeeldingen met scherpe randen en vlakke kleuren, schermafbeeldingen, logo's, pictogrammen, diagrammen en alles wat tekst bevat. Lossless betekent dat het de afbeelding exact opslaat: sla hem zo vaak op als je wilt en er verandert geen enkele pixel, het tegenovergestelde van het generationele verval van JPEG.

WebP

WebP is een afbeeldingsformaat van Google dat zowel JPEG als PNG wil vervangen door één container. De truc is dat het twee modi ondersteunt: lossy compressie voor foto's, zoals JPEG, en lossless compressie voor afbeeldingen, zoals PNG, terwijl het bij vergelijkbare kwaliteit doorgaans kleinere bestanden produceert dan beide.

TIFF

TIFF (Tagged Image File Format) is het zwaargewicht rasterformaat dat wordt gebruikt bij archivering, scannen en professionele beeldvorming. De naam komt van zijn structuur: een flexibele set tags die de afbeelding beschrijven, waardoor een enkele TIFF ongecomprimeerde of lossless gecomprimeerde data, hoge bitdieptes, ingesloten kleurprofielen en een hoop technische metadata kan bevatten.

SVG

SVG (Scalable Vector Graphics) is een open, op XML gebaseerd vectorformaat, een afbeelding geschreven als leesbare tekst die vormen, paden, kleuren en tekst beschrijft. Omdat het vector is, schaalt het naar elke grootte met perfect scherpe randen, en omdat het XML is, kan het met CSS worden opgemaakt, geanimeerd en zelfs doorzocht of bewerkt in een gewone teksteditor.

DPI

DPI (dots per inch) meet resolutie, hoeveel stippen detail in elke inch van een afbeelding of afdruk zijn gepakt. Hoe hoger het getal, hoe fijner het detail en hoe groter het bestand. Het is de ene instelling die het vaakst bepaalt of een scan of export er scherp of teleurstellend uitziet.