In dit artikel lees je over de belangrijkste tags voor pdf. Het (her-)kennen van tags helpt je om een pdf toegankelijk te maken in een pdf-tagger of om een pdf op toegankelijkheid te controleren.
Tags
Een toegankelijke pdf is ‘getagd’. Dat betekent dat er ook een structuurboom (een ’tag tree’) is met daar alle inhoud. Elk content deel heeft de juiste tag die aangeeft of die content bijvoorbeeld een kop, een alinea of een voetnoot is. Hiermee maak je de inhoud van een pdf ook toegankelijk voor mensen die bijvoorbeeld een screenreader gebruiken.
Tags kunnen worden aangemaakt tijdens het exporteren van een brondocument naar een pdf, maar kunnen ook handmatig worden toegevoegd of verbeterd in de uiteindelijke pdf.
De term ’tag’ bestaat overigens niet in de officiële PDF-standaard. In PDF 1.7 heten het ‘Structure elements’. Die zijn er op blocklevel niveau en op inline niveau. Je ziet daarom verschillende termen:
- codes (gebruikt in voorgaande versies Acrobat Pro)
- labels (gebruikt door Microsoft)
- toegankelijkheidstags (gebruikt in laatste versie van Acrobat Pro)
- Structure Elements
- BLSE (Blocklevel Structure Element)
- ILSE (Inline Structure Element)
We onderscheiden 4 soorten tags:
- Tags om te groeperen: met deze tags kun je bij elkaar horende tags groeperen en zo je tag tree overzichtelijker maken. Sommige van deze tags hebben ook een semantische betekenis en kun je niet zomaar gebruiken voor een willekeurige groep tags.
- Tags op blokniveau: voor het structuren van de inhoud op de pagina.
- Inline tags: voor inhoud binnen een tag op blocklevel niveau.
- Tags voor beeldelementen: voor grafische objecten of visuele elementen die in een document worden gebruikt om beelden, diagrammen, tekeningen, afbeeldingen en andere niet-tekstuele inhoud weer te geven.
We noemen hier de meeste tags, maar niet alle, tags per categorie.
Tags om te groeperen
<Document> | Deze tag staat bovenaan de structuurboom, de tag tree, en bevat alle andere tags. |
---|---|
<Part> | Bevat een grote sectie van het document, zoals een hoofdstuk van een boek. Kan bijvoorbeeld weer <Article>-tags of <Sect>-tags bevatten die ook weer tags groeperen. |
<Art> | Bedoeld voor het groeperen van alle tags van een specifiek artikel of een onderscheidbaar deel van de inhoud. Zoals nieuwsartikelen, tijdschriftartikelen en blogposts. Kan niet in een andere Art-tag genest worden. |
<Sect> | Een container voor het groeperen van bij elkaar horende tags in een deel van het document. Zoals een kop met paragrafen, of een tekstvak. Kan genest worden voor subsecties. |
<Div> | Betekenisloos. Gebruik waar mogelijk andere elementen. |
<Blockquote> | Voor een meer paragrafen die van een andere bron zijn. |
<Caption> | Voor het bijschrift bij een tabel of een figuur. |
<TOC> | Inhoudsopgave. Kan <TOC>-tags en <TOCI>-tags bevatten. |
<TOCI> | Item in een inhoudsopgave. Kan de volgende tags bevatten: <Lbl>, <Reference>, <NonStruct>, <P> , <TOC |
<Index> | Voor een index. Bevat bijvoorbeeld lijstelementen. |
<NonStruct> | Niet semantisch. Kan bijvoorbeeld handig zijn om alle content van een pagina bij elkaar te houden. |
Tags op blokniveau
Titel | Hiervoor bestaat in PDF 1.7 geen tag. Het is best practice om een <Title>-tag te rolmappen naar een <P>. In PDF 2.0 bestaat wel een <Title>-tag. |
---|---|
<H1> t/m <H6> | Een kop gedeelte van het document. |
<P> | Alinea’s |
<Table> | Tag voor het markeren van een datatabel. Deze gebruik je in combinatie met voor een tabelrij, voor een kolomkop of rijkop, voor een tabelcel. Eventueel gebruik je ook <Thead>, <TBody> en <TFooter>. |
<L> | Tag voor een opsomming (lijst). Gebruik daarin <L> (voor een geneste lijst), <LI> (een item in de lijst), <Lbl> (voor de term, het cijfer of het opsommingsteken) en <LBody> (de tekst in de lijst). |
Inline tags
Span | Geen speciale betekenis, maar je kunt het goed gebruiken voor bijvoorbeeld een taalwisseling binnen een tekst, voor het toevoegen van daadwerkelijke tekst of alternatieve tekst. |
---|---|
Quote | Een citaat binnen een alinea. |
Note | Voor voetnoten en eindnoten waarnaar verwezen wordt vanuit de hoofdtekst. Kan een <Lbl>-tag bevatten. Waar in de leesvolgorde je voetnoten plaatst is niet vastgelegd in de standaard. Ze mogen in de regel of aan het eind van de pagina staan. |
Reference | Een verwijzing naar inhoud elders in het document, een kruisverwijzing of het nummer van een voetnoot. |
Bibentry | Een item in een bibliografie. |
Code | Een fragment van computerprogrammatekst of code. |
Link | Combinatie van tags voor een hyperlink. |
Annot | Annotaties zijn best lastig te begrijpen. Ik houd voor nu de tekst uit de standaard aan: Een annotatie is een associatie tussen een deel van de inhoud van de inline tag en een overeenkomstige pdf-annotatie. Annotatie wordt gebruikt voor alle pdf-annotaties behalve link-annotaties en widget- annotaties. |
Tags voor beeldelementen
<Figure> | Grafische inhoud. Met het placement-attribuut wordt de plaats aangegeven. Als je dit niet goed gaat bij een afbeelding dan krijg je meldingen over het ontbreken van de ‘bounding box’. |
---|---|
<Formula> | Wiskundige formule |
<Form> | Een interactief formulierveld. |
Lege tags
In de standaard zijn lege tags niet toegestaan, op enkele uitzonderingen na:
- <TD> om de tabelstructuur te behouden
- <LI> om de lijststructuur te behouden
- <Span> voor ‘daadwerkellijke tekst’, spaties, metadata-eigenschappen en attributen
- <Div> voor metadata-eigenschappen en attributen
- <Document> voor een leeg document dat uit 1 pagina bestaat
- <NonStruct> en <Private> in specifieke gevallen
Tags bekijken of repareren
Je kunt de tags van een pdf bekijken in bijvoorbeeld Acrobat Pro of PAC. Het verwijderen van overbodige tags, het toevoegen of veranderen van tags kan met verschillende programma’s, waaronder Acrobat Pro.
Geef een reactie