Met de opmars van big data, kunstmatige intelligentie, sensing en het Internet of Things staat data science steeds meer in de belangstelling. Professor Peter de Kock vertelt over de trends, uitdagingen, succesfactoren en best practices.
Lynsey Dubbeld
Wat betekent data science voor de toekomst van onze democratie? Hoe kunnen overheden en bedrijven data gebruiken op een manier die bijdraagt aan de waarden van onze samenleving? Het zijn grote vragen die Peter de Kock adresseert in zijn werk op het terrein van data science. De Kock is Professor of Practice in data science op het gebied van criminaliteitsbestrijding en veiligheid aan Tilburg University, hoofd van de afdeling Data Science in Crime & Safety van de Jheronimus Academy of Data Science (JADS) in ’s-Hertogenbosch, en oprichter en directeur van het bedrijf Pandora Intelligence.
Inhoudsopgave:
– Werelden van overheid, universiteit en bedrijfsleven samenbrengen
– Data veel beter te benutten dan we denken
– Het domste wat je kunt doen
– Discriminatie kan door algoritmes worden uitgeprogrammeerd
– Project Weerbaar bindt door samenvoegen van data de strijd aan tegen ondermijning
– Kennis via data science toegankelijk maken voor de agent op straat
– De professional als succesfactor
– Samenwerking tussen instellingen belangrijke schakel voor inzet science data
– Kunstenaars betrekken in data science projecten
– Ethische aspecten van data sciencen
– De toekomst is mensenwerk
Werelden van overheid, universiteit en bedrijfsleven samenbrengen
“Mijn cri de coeur als Professor of Practice is dat we de werelden van de overheid, de universiteit en het bedrijfsleven moeten samenbrengen om te voorkomen dat de inzet van data science onze democratische waarden in gevaar brengt”, zegt De Kock. De Kock is Nederlands derde Professor of Practice. Een functie die speciaal is ingesteld voor innovatieve bestuurders en ondernemers van internationaal georiënteerde bedrijven. Met praktische kennis en ervaring voegt de Professor of Practice waarde toe aan de academische wereld. Daarmee draagt hij bij aan wetenschappelijk onderzoek en de impact daarvan op de maatschappij.
De grote techbedrijven hebben inmiddels meer data over Nederlanders dan de staat der Nederlanden
“We moeten ons realiseren dat de grote techbedrijven inmiddels meer data hebben over Nederlanders dan de staat der Nederlanden”, licht De Kock zijn hartenkreet toe. “Databedrijven kunnen in essentie ook al betere publieke diensten leveren dan veel van onze democratische instituties. Data science is daarom niet meer vrijblijvend en we moeten heel alert zijn op wat er allemaal met data mogelijk is.”
Volgens Peter de Kock draait de toekomst van data science om mensenwerk. “We moeten de juiste mensen bij elkaar brengen: mensen die snappen wat er gebeurt en die niet bang zijn om de brug te slaan tussen diverse domeinen.”
Data veel beter te benutten dan we denken
Een alerte houding tegenover de impact van (big) data betekent niet dat we bang moeten zijn voor de toepassing van data science, benadrukt De Kock. “Mensen zien dat er van alles gebeurt op het vlak van data analytics en zijn er nogal eens bang voor. Dat maakt terughoudend. Mensen zeggen bijvoorbeeld: laten we er nog maar even mee wachten. Of: zoiets mag niet van de Algemene verordening gegevensbescherming (AVG). Maar zeker als het gaat om wetenschappelijk onderzoek geeft de AVG wel degelijk ruimte om data te verzamelen, delen en analyseren. We kunnen heel veel data veel beter benutten dan we soms denken.”
Het domste wat je kunt doen
De Kock vindt dat in de discussies over data science te veel aandacht uitgaat naar de moeilijkheden en onmogelijkheden. “Neem de initiatieven om het gebruik van algoritmes door de overheid aan banden te leggen. Dat is het domste dat je kunt doen. De overheid gebruikt al heel veel relatief simpele algoritmes, bijvoorbeeld om de toekenning van huurtoeslagen te automatiseren. Het transparant maken daarvan kun je één keer doen, maar daarna heeft het geen meerwaarde meer: het algoritme verwijst simpelweg terug naar de wet- en regelgeving waarop het gebaseerd is.” Ook voor complexe algoritmes is transparantie geen oplossing, omdat de uitleg voor veel mensen onbegrijpelijk zal zijn.
Peter de Kock studeerde aan de Filmacademie van de Amsterdamse Hogeschool voor de Kunsten en reisde vijftien jaar de wereld rond als cameraman en regisseur van films en documentaires. Vervolgens behaalde hij de Master of Criminal Investigation aan de Politieacademie en werkte hij van 2007 tot 2017 bij de nationale politie, onder meer als hoofd van de afdeling Afgeschermde Operaties. In 2014 promoveerde hij aan Tilburg University met een onderzoek naar het voorspellen van criminaliteit met behulp van scenario’s. Hij ontwikkelde hiervoor een methode die nu wordt ingezet bij zijn bedrijf Pandora Intelligence, dat organisaties helpt om data science in te zetten om narratieven te ontdekken in grote hoeveelheden ongestructureerde data en daaruit operationele scenario’s te ontwikkelen voor criminaliteitsbestrijding. Sinds 2019 is De Kock ook Professor of Practice aan Tilburg University, en hoofd van de afdeling Data Science in Crime & Safety van de Jheronimus Academy of Data Science (JADS) in ’s-Hertogenbosch.
Discriminatie kan door algoritmes worden uitgeprogrammeerd
“Wat we juist wél moeten doen, is de output van algoritmes zorgvuldig testen, zodat we zorgen dat mensen niet onterecht worden verdacht of uitgesloten”, voegt De Kock toe. “De essentie van een verantwoorde toepassing van algoritmes is dat discriminatie wordt uitgeprogrammeerd. Dat klinkt misschien ingewikkeld, maar dat werkt bij algoritmes toch een stuk makkelijker dan bij mensen. Algoritmes zijn per definitie niet biased, want ze doen in alle gevallen hetzelfde. De data die je gebruikt kan natuurlijk wel discriminerende aspecten hebben – die moet er dus worden uitgehaald. Maar ook dat is eenvoudiger bij datasets dan bij mensen.”
Kunstmatige intelligentie kan wel een bijdrage leveren aan een transparant en eerlijk systeem
De Kock benadrukt dat data science als zodanig geen oplossing is voor alledaagse issues in bijvoorbeeld de rechtspraak en opsporing. “Ik zou er niet voor willen pleiten om bijvoorbeeld de rechtsgang volledig door algoritmes te laten uitvoeren. Maar kunstmatige intelligentie kan wel een bijdrage leveren aan een transparant en eerlijk systeem. Rechters zijn nu eenmaal mensen met gevoelens, en dat is van invloed op de kwaliteit van de oordeelsvorming. Als een rechter een nacht slecht heeft geslapen, of ruzie heeft gehad met zijn buurman, is de kans aanwezig dat dit doorwerkt in het rechterlijke vonnis.”
Project Weerbaar bindt door samenvoegen van data de strijd aan tegen ondermijning
De Kock noemt Project Weerbaar, dat zich richt op het samenbrengen van informatie uit gesloten en open bronnen om ondermijnende criminaliteit tegen te gaan, als een goed voorbeeld van de voordelen van data science voor criminaliteitsbestrijding en veiligheid. Het project – een samenwerking tussen de politie Oost-Brabant, de gemeente ’s-Hertogenbosch, JADS, Dutch Institute for Technology, Safety & Security (DITSS) en Pandora Intelligence, in opdracht van het ministerie van Justitie en Veiligheid – combineerde testdata van de gemeente ’s-Hertogenbosch met testdata van de Politie Oost-Brabant en data uit open bronnen. De dataset werd geanalyseerd met het scenariomodel van Pandora Intelligence. Het project resulteerde in onder meer een Nationale Open-source Ondermijning Database (NOOD), die informatie deelt over ondermijning en synthetische drugsproductie. Deze dataset kan door geïnteresseerde overheidspartijen worden ingezet in de strijd tegen ondermijnende criminaliteit.
Kennis via data science toegankelijk maken voor de agent op straat
De Kock: “Project Weerbaar laat zien wat de toegevoegde waarde is van de combinatie van politiegegevens en open data voor het werk van politiemensen op straat. Politiemensen die een container ontdekken met helional erin, weten dankzij de informatie uit het project dat deze chemische stof weliswaar niet op lijst van verboden middelen staat, maar wel degelijk een signaal kan zijn van amfetamineproductie. Je kunt niet van politiemensen op straat verwachten dat ze allemaal chemische formules uit het hoofd weten. Maar die kennis kan je met behulp van data science wel toegankelijk maken.” Dat geldt volgens De Kock ook voor bijvoorbeeld de expertise van accountants en financieel deskundigen over verdachte organisatiestructuren en transacties, die in het project is meegenomen.
De professional als succesfactor
Wat is de succesfactor achter een initiatief zoals Project Weerbaar? Volgens De Kock is niet zozeer de techniek, maar de inzet van bevlogen professionals essentieel. “Technisch kan er op het vlak van data science al heel veel – eigenlijk meer dan we ons als mensen kunnen voorstellen. Maar pas als mensen gedreven zijn om informatie te delen en analyseren, kom je tot de juiste resultaten van data science. Het is bijvoorbeeld belangrijk dat je je niet door de eerste tegenslag of uitdaging uit het veld laat jagen.
Er wordt nogal eens gezegd: de politie mag geen data delen. Of: we gaan niet samenwerken met private partijen, want die zijn niet te vertrouwen. Of: we hebben hier hoogopgeleide mensen in dienst, dus de universiteit hoeft niet mee te doen. Maar een intensieve publiek-private samenwerking op het gebeid van data science heeft echt meerwaarde en de juridische kaders scheppen voldoende ruimte voor het samenbrengen van bepaalde soorten data.”
Intensieve publiek-private samenwerking op het gebeid van data science heeft echt meerwaarde
Samenwerking tussen instellingen belangrijke schakel voor inzet science data
Volgens De Kock zijn de ontwikkelingen in data science inmiddels zo complex en veelomvattend, dat ze niet meer kunnen worden geadresseerd door technologie alleen. Samenwerking tussen organisaties is een voorwaarde om data science een verantwoorde en toekomstbestendige plek te geven in onze samenleving.
“Ik ben een groot voorstander van het triple helix model, waarbij kennisinstellingen, overheden en ondernemingen samenwerken. Zoals de Amerikaanse bioloog Edward O. Wilson stelde: we have created a Star Wars civilization, with Stone Age emotions, medieval institutions, and godlike technology. Universiteiten en overheidsinstellingen, zoals de politie en rechtspraak, zijn voorbeelden van de trage instanties waarover Wilson het heeft. Het bedrijfsleven kan er juist voor zorgen dat we kunnen meevaren op de golven van de innovatie: ondernemingen zijn namelijk sneller en adaptiever. Voor ondernemers behoort een open perspectief op nieuwe ontwikkelingen tot het DNA. Als onderzoek, onderwijs en overheid daar geen gebruik van maken, loop je geheid achter de ontwikkelingen aan.”
>> LEES OOK: Marc Salomon: multidisciplinaire samenwerking maakt het verschil
Kunstenaars betrekken in data science projecten
Een samenwerking tussen overheden, onderwijsinstellingen en ondernemingen wordt inmiddels steeds meer erkend als belangrijke schakel om het potentieel van data science optimaal te benutten. Kunst komt in dit rijtje meestal niet terug. Maar volgens De Kock, die zijn loopbaan startte als filmmaker en regisseur, kan juist kunst ons leren de noodzakelijke verbinding te maken tussen data en de bewuste menselijke ervaring. “Kunstenaars zijn als geen ander in staat om – in feite met behulp van data – emoties en ervaringen over te brengen. Daarom zouden we ze ook actief moeten betrekken in data science projecten. Zelfs als dat in eerste instantie misschien ingewikkeld lijkt, omdat ze met een andere blik naar bepaalde situaties en thema’s kijken.”
Ethische aspecten van data science
De Kock vraagt in zijn onderzoek nadrukkelijk aandacht voor de ethische aspecten van data science. “Machines kunnen nog geen emoties ervaren. Het zal ook nog wel even duren voordat ze dat wel kunnen – als het überhaupt ooit gaat gebeuren. Maar emoties zijn zó belangrijk voor ons menselijke bestaan. Daarmee staat data science voor de opgave om de connectie te maken tussen data en het menselijke bewustzijn. Anders ontstaan er systemen die we als mens niet meer kunnen begrijpen, of die niet de nuance kunnen vinden die we belangrijk vinden. Dat is echt een ethisch vraagstuk: hoe willen we als mensen met elkaar omgaan, wat vinden we daarbij belangrijk en hoe willen we dat data en machines daarmee rekening houden?”
De toekomst is mensenwerk
De toekomst van data science draait om mensenwerk, aldus De Kock. “We moeten de juiste mensen bij elkaar brengen: mensen die snappen wat er gebeurt en die niet bang zijn om de brug te slaan tussen diverse domeinen. Data science is technisch gezien niet héél ingewikkeld – de uitdaging ligt vaak juist in de samenwerking tussen de verschillende mensen die erbij betrokken zijn.”
Lynsey Dubbeld is communicatie-adviseur, contentstrateeg, trendanalist en copywriter