Een hele tijd geleden mocht ik mij eens blootstellen aan de verleidingen van Big Data. Een klein clustertje van slechts 10 terabyte. Hadoop was er nog niet, maar toch… Ik paste wat voor de hand liggende algoritmes toe en kon binnen no time indrukwekkende heat maps en clutter graphs produceren. De fusion engine draaide overuren bij het ontdekken van de meest interessante anomalieën. Wauw! Ik voelde me als een kind in de snoepwinkel. Big Data was een soort toverdoos. Je draaide aan wat knoppen en hopla, er kwam een antwoord uit. Nu de vraag nog…
Big data is hot, maar het is ook erg veel een herhaling van de jaren ’80 toen neurale netwerken, kunstmatige intelligentie en expert systems de wereld bestormden door bedrijfjes met foute namen als AIDSS (Artificial Intelligence Decision Support Systems) en obscure programmeertalen als APE (A Programming Expert). En in diezelfde jaren ’80 constateerden onderzoekers al dat er steeds meer informatie werd geproduceerd die geen antwoord is op iemands vraag, maar een antwoord op een vraag die nog bedacht moet worden. Het huidige Big Data vormt daarop geen uitzondering.
>> Lees ook Civis Sollicitus: Camera’s maken ons lui
>> Lees ook Civis Sollicitus: Regels en security
Big data
Maar Big data heeft ook big nadelen. Wie veel data heeft zal straks geacht worden daar iets mee te doen. Ik zie al toekomstige rechtszaken ontstaan waarin data warehouses gedagvaard worden, omdat ze onvoldoende hebben gedaan om iets te voorkomen. Want ze hadden immers alle data en konden het dus wéten.
Het wordt een interessant dilemma: hoe meer data je straks hebt, hoe groter de kans dat je aansprakelijk wordt gesteld als je er niets mee gedaan hebt. Gelooft u dat niet? Let dan eens op recente uitspraken in rechtszaken. Daarin valt een steeds duidelijker tendens van het voorzorgsprincipe en risico(straf)recht te bespeuren. Vroeger veroordeeld omdat je iets had gedaan. Daarna werd je veroordeeld omdat je iets had kunnen doen. Maar nu word je ook veroordeeld wanneer je onvoldoende hebt gedaan om te voorkomen dat iemand anders iets doet.
Big nadelen
Daarom zwijgt iedereen over hoeveel van welke data ze hebben en wat daarmee kan. Zien we hier de eerste tekenen van een zelfregulerend mechanisme? Na ieder incident volgt tegenwoordig al standaard een onderzoek van de Facebook pagina en het Google zoekgedrag waarin uiteraard al de ‘tekenen’ van het naderend ongerief te zien waren. Waarom meldde u dat niet aan ons, beste datawarehousedirecteur?
Toch denk ik dat er voorlopig nog (Big) Data systemen bij zullen komen. Dat verloopt volgens een vast stramien. Eerst moeten ze groeien. Want hoe groter het systeem, hoe groter de kans dat je iets vindt. Daardoor bevestigt het zijn eigen bestaansrecht. Vervolgens wordt de vraag gesteld: ‘Zouden we nog zonder dit systeem kunnen?’ Met andere woorden: als er daarna nog eens iets onaangenaams gebeurt, dan is dat de schuld van degene die het systeem niet wilde. En die verantwoordelijkheid zal niemand durven nemen. Dat durf ik met honderd procent zekerheid te voorspellen. Zonder Big Data.
Dit blog verscheen in Security Management 11/ 2015