Overheden maken vaak gebruik van data om beleid te maken, dienstverlening te verbeteren en maatschappelijke vraagstukken aan te pakken. Maar hoe weet je of die data betrouwbaar is? Volgens een nieuw rapport van het Wetenschappelijk Onderzoek- en Documentatiecentrum (WODC) kan data lineage daarbij helpen.
Data wordt in grote hoeveelheden en soorten aangemaakt, geanalyseerd, rondgestuurd en gebruikt voor uiteenlopende doeleinden. Denk hierbij aan foto’s delen op social media, maar ook aan registratie van persoonsgegevens door overheidsinstanties. Bij gebruik van data is de oorsprong en kwaliteit hiervan niet altijd bekend. Maar ook wanneer data aangemaakt wordt, is er niet altijd zicht op hoe deze data gebruikt gaat worden. Voor een digitaler wordende rechtsstaat is het noodzakelijk om als maatschappij en overheid vertrouwen te kunnen hebben in data en de kwaliteit ervan—data lineage kan daaraan bijdragen, aldus het WODC-rapport.
> LEES OOK: Bedrijven dreigen te verdrinken in datagroei
Wat is data lineage?
Data lineage betekent letterlijk ‘afstamming van data’. Het gaat om het in kaart brengen van de volledige reis die data aflegt: van het moment dat het wordt verzameld (bijvoorbeeld via een formulier), tot aan de verwerking, bewerking en het uiteindelijke gebruik in bijvoorbeeld dashboards of rapportages. Met data lineage kun je nagaan:
- waar de data vandaan komt;
- welke bewerkingen of transformaties zijn toegepast;
- in welke systemen of rapporten de data uiteindelijk terecht komt.
Een voorbeeld van data lineage is dat wanneer iemand een foto maakt op vakantie, dat dan de naam van de fotograaf aan het bestand wordt toegevoegd, evenals de datum en de locatie van de foto. Voordat de foto gedeeld wordt op social media, wordt eerst een fotobewerkingsprogramma gebruikt om in-de-weg-staande toeristen te verwijderen. Ook deze handeling wordt toegevoegd aan de metadata van de foto.
Als iemand dan deze foto bekijkt op social media en metadata opvraagt, dan wordt duidelijk dat de foto bewerkt is. Iemand kan dan zijn eigen overwegingen maken om de foto wel of niet als betrouwbaar te zien. Context speelt hierbij ook een rol. De foto is een geschikte bron om te zien waar iemand op vakantie is geweest, maar niet noodzakelijk om de drukte op deze locatie in te schatten vanwege de bewerkingen.
Data lineage binnen het rechtsstelsel
Data lineage helpt om fouten vroegtijdig te signaleren, risico’s in beeld te brengen en het vertrouwen in beleidsinformatie te vergroten, zowel binnen als buiten de organisatie. Het WODC benadrukt dat data lineage niet alleen een technisch hulpmiddel is, maar ook een stap richting professionalisering van datamanagement binnen de overheid.
Bron: Digitale Overheid
Volg Security Management op LinkedIn