Dat statistieken je nuttige inzichten geven, daar is iedereen wel van overtuigd. Het geeft je een beeld van hoe je website wordt gebruikt en welke pagina’s vooral bekeken worden. Maar hoe vaak worden documenten zoals pdf’s op je website gedownload? Veel webredacties weten dat nog niet. Alleen met inzicht en kennis kun je gaan verbeteren. In dit artikel leggen we je uit wat bij statistieken voor documenten komt kijken.
Waarom zou je meten?
Als je niet kan meten, dan kan je het gebruik van documenten op je website niet in beeld brengen. En daardoor heb je als webredactie ook geen argumenten om bepaald documenten ‘te weren’ van je website of keuzes te maken voor een andere opzet. Ook meer capaciteit vragen voor het beheer van je website is lastig zonder cijfers. Documenten zijn gewoon webpagina’s die aandacht en onderhoud nodig hebben. Je moet dus gaan meten.
Als eerste wil je weten hoeveel pdf’s en andere documenten op de website staan. Dit doe je door een contentaudit uit te voeren. Je zult versteld staan van de hoeveelheid. Het varieert van 10% tot wel 80% van je content.
Een onderdeel van de contentaudit is onderzoeken of de documenten die online staan ook daadwerkelijk gedownload worden. Want waarom zou je al die documenten op je website laten staan als niemand erin is geïnteresseerd? Of misschien is het wel belangrijke content, maar is deze informatie niet goed te vinden of te gebruiken in een ontoegankelijke of ongebruiksvriendelijke pdf. Of is de pdf ongebruiksvriendelijk en niet op elk apparaat te gebruiken.
Een grote hoeveelheid niet goed bruikbare pdf’s; het kost teveel tijd om ze te onderhouden en ze vervuilen je zoekresultaten. Als je niet verplicht bent om deze documenten te publiceren (bijvoorbeeld vanwege een wettelijke verplichting), dan kan je op basis van lage bezoekersaantallen onderbouwen dat het beter is dat deze documenten van de website gehaald worden. En op basis van hoge bezoekersaantallen kan je keuzes maken over het verbeteren van bruikbaarheid en toegankelijkheid van content. De cijfers helpen je ook bij beslissingen over welke documenten je als eerste aanpakt en welke documenten je wellicht beter in een ander, bruikbaarder, bestandsformaat aanbiedt.
Hoe kan je websitebezoek meten?
Websitebezoek kan je meten aan de hand van statistiekensoftware zoals Google Analytics en Piwik. Ook zijn er nog tal van andere web analytics tools en sommige contentmanagementsystemen hebben ingebouwde statistieken. Ook werken steeds meer gemeenten met de audittool Siteimprove. Met deze tool kun je ook zien hoe vaak documenten aangeklikt worden. Er wordt een code geplaatst op pagina’s om dit te meten.
Wij focussen ons in dit artikel op twee gratis programma’s: Google Analytics en Piwik. Google Analytics wordt veel gebruikt door overheden, maar overheidsorganisaties zetten steeds vaker Piwik in voor het vergaren van gegevens. Hiermee blijft een overheid namelijk baas over haar data en deelt ze deze niet met derden.
Google Analytics
Google Analytics meet niet automatisch hoe vaak documenten gedownload worden. Om dit voor elkaar te krijgen moet je aan de slag met Google Tag Manager. Dit is een tool waarmee je tags op je website kan plaatsen en specifieke dingen kan meten, bijvoorbeeld het klikken op externe links. Met Google Tag Manager hoeft er maar 1 script op je website geplaatst te worden. De rest, zoals instellingen voor het meten van pdf’s stel je in via de Google Tag Manager.
Google Tag Manager in een notendop
Als eerste meld je je via www.google.nl/tagmanager aan voor de Google Tag Manager en maak je een account aan voor de website die je wilt gaan meten. Net zoals bij Google Analytics kan je dit voor meerdere websites doen. Als je dat hebt gedaan, dan is de eerste stap een ‘container’ maken. De container is een stukje code van Google Tag Manager die zorgt dat je alles meet waarvan je instelt dat je het wilt meten. De code van de container plaats je in de broncode van je webpagina’s. De meetcode van Google Analytics gebruik je hier niet meer.
Vervolgens maak je in Google Tag Manager ‘tags’. Je moet in ieder geval een tag maken voor je Google Analytics code. Met andere tags meet je bijvoorbeeld specifiek het aantal downloads van pdf’s. Een uitgebreide beschrijving vind je op www.digitalanalisten.nl/handleidingen/google-analytics/handleiding-google-tagmanager. (De hier aangeboden pdf is wel gecodeerd, maar helaas niet optimaal toegankelijk).
Wil je andere documenten meten, zoals Word-documenten, dan moet je hier ook een tag voor maken. Maak een tag aan voor ieder bestandsformaat dat op je website staat.
Statistieken bekijken
Als de Google Tag Manager up and running is, dan kan je via Google Analytics bekijken welke pdf’s hoe vaak worden gedownload. Dit kan je terugvinden bij Gedrag > Gebeurtenissen > Overzicht. In dit voorbeeld hebben we de gebeurtenis ‘Pdf bekeken’ genoemd.
Als je dan gaat kijken bij ‘Gebeurtenislabel’ dan zie je daar een overzicht staan van alle gedownloade pdf’s.
De resultaten kan je exporteren naar een csv-bestand (een databaseformaat) of een Excel-bestand om de statistieken daarna verder te analyseren.
Piwik
Een andere tool om downloads te meten is Piwik. Dit is een open source programma om bezoekersstatistieken van websites te meten. In tegenstelling tot Google Analytics hebben gebruikers van Piwik volledige controle over (het delen van) de verzamelde gegevens, die worden opgeslagen in een database op een eigen serverruimte.
Het nadeel van Piwik is dat het wat complexer is omdat software op een eigen aparte serverruimte geïnstalleerd moet worden. Bovendien moet de software met enige regelmaat geüpdatet worden. Piwik zelf biedt hosting aan vanaf 25 dollar per maand.
Rijkswebsites kunnen bij Dienst Publiek en Communicatie (DPC) informeren of ze kunnen gebruik kunnen maken van de gedeelde standaardinstallatie. Voordeel is onder andere dat je Piwik niet zelf hoeft te installeren op een server.
Het mooie van Piwik is dat deze automatisch de downloads voor je telt. Je hoeft hier dus niet iets extra’s voor in te stellen.
In Piwik ga je naar Acties > Downloads. Hier vind je niet alleen de bezoekersaantallen van de pdf’s die op jouw website staan, maar ook pdf’s die op andere websites staan waarnaar je gelinkt hebt. Bovendien staan hier ook bestandsformaten zoals Word of Excel die je eventueel op je website hebt staan.
De resultaten kan je exporteren naar een csv-bestand voor verdere analyse.
Je mist nog gegevens
Met statistiekentools als Google Analytics en Piwik kun je niet alles meten. Zo kan je niet zien welke documenten 0 keer zijn gedownload. Wat je ook mist is het aantal downloads dat niet via links op jouw website tot stand komt, maar met zoeken via Google, links in een e-mail of een andere website of bijvoorbeeld door bladwijzers.
Google Search Console
Voor het aantal downloads dat tot stand komt omdat mensen je pdf vinden via zoeken met Google kun je Google Search Console gebruiken. Hiermee kun je kijken naar het aantal keer dat pagina’s geraadpleegd zijn vanaf een zoekresultatenpagina in Google.
Logbestanden
Wil je het aantal directe downloads (mail, andere websites, bladwijzers) in kaart brengen, dan heb je de logbestanden van de webserver nodig. Hierin wordt bijgehouden hoe vaak op de webserver een verzoek naar de verschillende pagina’s is gedaan. Deze ruwe data moeten verwerkt worden naar voor jou bruikbare gegevens. Je systeembeheerder kan je hiermee helpen en kan bijvoorbeeld gebruik maken van de Piwik Log Analytics Tool. De data van de logbestanden kan hiermee geïmporteerd en inzichtelijk gemaakt worden in Piwik. Er is een handleiding voor de Piwik Log Analytics Tool.
CMS
Ook de leverancier van je CMS (Content Management Systeem) zou je moeten kunnen helpen aan bruikbare data over het aantal downloads van documenten.
Google Analytics of Piwik?
Om pdf’s te kunnen meten in Google Analytics moet je behoorlijk wat instellingen doen. Het is een lastige materie waar je wellicht een analyticsexpert bij nodig hebt. Piwik moet geïnstalleerd worden op een server en heeft onderhoud nodig. Beide zaken kun je zelf doen of uitbesteden.
Er zijn meer afwegingen om te kiezen voor Google Analytics of Piwik, zoals het niet delen van gegevens met Google of het wel of niet kunnen meten van andere zaken als Adwords. Wat je kiest hangt af van je voorkeuren of vragen, of je data mag delen met derden en mogelijkheden in de organisatie.
Tips
Beschrijvende documenttitels, bestandsnamen en URL’s
Je zult zien dat je de statistieken veel makkelijker kan analyseren en koppelen aan andere data als je zorgt voor beschrijvende documenttitels, bestandsnamen en beschrijvende URL’s (het internetadres in de browser). Gebruik dus geen bestandsnamen als ‘Microsoft-Word-sjabloon939.pdf‘, documenttitels als ‘Microsoft Word – Besluit‘, en URL’s als ‘www.domeinnnaam.nl/files/8908092_8797a.html‘. Je kan daarmee bij analyse niet makkelijk zien welke documenten het betreft en natuurlijk kan je bezoeker dat ook niet!
Nul keer gedownload
Een document dat nul keer is gedownload vind je niet terug in het overzicht van je statistiekenoverzicht. Met je statistiekenprogramma krijg je dus meestal geen volledig overzicht van alle documenten op een website.
Let op voor dubbelingen
Bij grotere websites zien we vaak dat een pdf meerdere keren is geüpload of onder meerdere dynamische URL’s voorkomt. Het kan dus zijn dat eenzelfde document met andere cijfers in je statistieken staat.
Aan de slag met de cijfers
Het belangrijkste is dat je meet hoe vaak pdf’s worden gedownload. Met deze cijfers kan je onderbouwen waarom bepaalde pdf’s wel of niet op de website zouden moeten staan. En welke pdf’s als eerste verbeterd moeten worden of omgezet worden naar een ander bruikbaarder bestandsformaat.
Bovendien kan je de statistieken matchen met alle pdf’s die op je website staan. Hoe vaak worden pdf’s bijvoorbeeld 0 keer gedownload? Dit soort vergelijkingen moet in een database gebeuren. Dit is specialistisch werk dat vaak door een data-analist wordt gedaan.
En bekijk bijvoorbeeld de top 10, 25 of 50 van meest gedownloade pdf’s. Hoe staat het met de toegankelijkheid? In het artikel In 5 stappen een pdf onderzoeken op toegankelijkheid lees je hoe dit snel kan onderzoeken.
Heb jij aanvullende tips over statistieken voor documenten? Laat het ons weten!
Meer informatie
- Online pdf’s zijn een groot deel van webcontent
Hoeveel pdf’s heb jij op je website staan? - In 5 stappen een pdf onderzoeken op toegankelijkheid
Hoe spoor je snel toegankelijkheidsproblemen op in een pdf-bestand? In dit artikel leer je 5 veelvoorkomende problemen op te sporen en te begrijpen.
Dank
Op 27 mei 2016 is dit artikel aangevuld met het stuk over ‘Je mist nog gegevens’. Met dank aan Bram Duvigneau en David Hulshuis.
Auteur
Dit artikel is geschreven door Saskia Schrijver van Inhoud Telt. Als contentstrateeg adviseert en begeleidt Saskia organisaties bij webprojecten. Daarbij staat voor haar ‘nuttige, bruikbare en toegankelijke content voor de klant’ centraal.
Bart Hermans zegt
Helder artikel, meten = weten! Wij maken bij de gemeente Venlo gebruik van Piwik. Maar als ik bij acties>downloads kijk zie ik slechts een tweetal documenten. Ik krijg de rest van de statistieken van de Pdf’s niet te zien?
Saskia zegt
Dag Bart, dank je compliment! Tja, een lastige vraag omdat we op afstand zo niet kunnen zien wat er aan de hand is. Kan het zijn dat de periode waarover je kijkt heel kort is en dat je daarom maar twee documenten in je resultaten ziet?
Chantal van Melle zegt
Goed artikel dit! Heel inzichtelijk. Sowieso is deze gehele website een bron van interessante en vooral relevante informatie als ik het zo even snel bekijk.. Top zeg!!..Zie dat Siteimprove ook is genoemd waarvoor dank;). Zou graag nog een aanvulling willen doen op onze data opslag. Wij beheren ook ons eigen datacenter namelijk ( voldoen aan de ISO normen) en kunnen mede hierdoor onze klanten in staat stellen ten alle tijden eigenaar te blijven van de data. Siteimprove valt dus niet onder de Patriot Act wat natuurlijk wel het geval is met Google Analytics.
Saskia zegt
Hoi Chantal, wat leuk dat ons gevonden hebt en dat het artikel je aanspreekt! Goed dat je noemt dat bij jullie klanten altijd eigenaar blijven van de data.