Niet alles is waar

We denken al gauw dat alle informatie die gedrukt is of op TV wordt gepresenteerd juist is. Veel van de informatie wordt gebaseerd op een fenomeen dat Big Data heet. Grote hoeveelheden gegevens wordt op een slimme manier geanalyseerd op samenhang en trends. En daaruit worden conclusies getrokken. Naarmate de bron en de bewerking, die op de gegevens wordt losgelaten, ondoorzichtiger is, moet je je afvragen of de voorgespiegelde werkelijkheid ook echt is. Ik ben geneigd om dat steeds meer in twijfel te trekken. Hoeveel mensen zijn nog in staat om complexe processen te overzien? En veel bewerkingen, die op de gegevens worden losgelaten, zijn complex. En dus…….twijfel ik steeds meer.

Big Data

© Scott Adams CartoonHet is maar hoe je gegevens interpreteert. Hoe vaak komt het niet voor dat uit dezelfde set data volstrekt tegenstrijdige conclusies worden getrokken. Iedereen interpreteert gegevens vanuit zijn/haar eigen achtergrond. Dat fenomeen houdt mij al geruime tijd bezig als ik weer eens wordt geconfronteerd met de zoveelste lofzang op het fenomeen Big Data. Het werken met grote hoeveelheden gegevens, waarin wordt gezocht naar patronen en waaruit vervolgens conclusies worden getrokken, is een risicovolle bezigheid. Bepalend is niet alleen de vraag, die je beantwoord wilt hebben, maar ook de manier waarop je tot het antwoord komt. Om een vraag te kunnen beantwoorden moet je je afvragen welke gegevens je nodig hebt. Die gegevens moeten eenduidig, tijdig en betrouwbaar zijn. Ontbreekt een van die elementen dan is het oppassen geblazen.

De Overheid

De overheid baseert haar beleid steeds meer op allerlei statistische gegevens en analyses en steeds minder op feitelijke waarnemingen en lokale kennis en inzicht. Ik beschouw dat als een ernstig gemis. Voor het verwerken van grote hoeveelheden gegevens wordt steeds gebruik gemaakt van geautomatiseerde modellen en systemen.  Steeds minder mensen overzien en begrijpen hoe die verwerking eigenlijk plaatsvindt. Het is het probleem van de schoolverlater die heeft leren rekenen met een calculator en het schatten van uitkomsten van moeilijke rekensommen heeft gemist. De uitkomst die de telmachine geeft is per definitie juist. Dat de komma soms door een tikfout op de verkeerde plek staat, valt pas op wanneer de uitkomst al is verwerkt met soms desastreuze gevolgen. De gemeente Amsterdam kan er over meepraten en mist nog steeds een aanzienlijk bedrag aan ten onrechte uitgekeerde toeslagen.

Waar zijn de specialisten?

Het gebruik van Big Data vraagt om dataspecialisten: mensen die kennis hebben van algoritmen, van de manier waarop je grote hoeveelheden gegevens moet verwerken en analyseren. Veel organisaties die zich met Big Data bezig houden, hebben die specialisten niet. En dat werkt verkeerde interpretaties of nog erger: manipulatie van gegevens, in de hand. Iemand die handig is met Excel kan al snel conclusies onderbouwen die je met je boerenverstand ter discussie zou stellen.

Verkeerde conclusie

Bekend is het voorbeeld van twee jaar geleden toen in een rapport van het Sociaal Cultureel Planbureau werd geconstateerd dat 28% van de niet-westerse jongeren (15-24 jaar) werkloos was tegen 10% van de autochtone jongeren. Daarbij werd achteloos voorbijgegaan aan de stijging van het aantal niet-westerse jongeren dat was ingeschreven op vervolgopleidingen, waardoor de percentages van werkloosheid veel minder verschilden.

Het analyseren van grote hoeveelheden gegevens vereist kennis over en inzicht in de context waarin die gegevens tot stand komen. Dat is complementair aan de data-analyse kennis. Niet–ingewijden zijn daarbij in het nadeel. Grote systeemhuizen spiegelen ons mooie vergezichten voor. We zouden met Big Data veel beter in staat zijn om complexe problemen te doorgronden. Volgens mij is dat maar ten dele waar. Vaak is boerenverstand en soms zelfs ‘gut-feeling’ een even voorspellende en betrouwbare factor als al dat gegoochel met ‘slimme’ algoritmen.

Daarom…

Het gebruiken en analyseren van grote hoeveelheden gegevens, Big Data, heeft absoluut meerwaarde. Maar die waarde is er pas echt wanneer ze worden gebruikt en geïnterpreteerd door mensen die weten waar de gegevens betrekking op hebben: je moet kunnen schatten of een bepaalde uitkomst reëel is en voorstelbaar. Daarom is mijn stelling: Big Data heeft pas echt nut in combinatie met boerenverstand.

H.Timmermans/141212