De statisticus die verdronk – door ir. drs. Jeroen Breen AAG

 

Tijdens het schrijven van deze blog, gaat mijn dochter voor de eerste keer op voor haar praktijk rijexamen. Helaas voor haar is het niet dinsdagochtend 08.55 uur, want dat is volgens het Centraal Bureau Rijvaardigheidsbewijzen (CBR), het moment van de week met de grootste kans op slagen (52,7%). Gelukkig voor haar is het ook niet zaterdag, want afrijden op die dag van de week levert de laagste kans op slagen (45,3%). Helaas voor haar lag haar moment van afrijden tussen 13.00 en 15.00 uur en dat is nou precies het moment van de dag met een lage slagingskans (47,5%).

 

Eigenlijk is het apart en bijzonder dat wanneer je naar de grafiek van slagingspercentages per tijdstip kijkt, dit toch wel erg lijkt op een hele mooie 3e-graadsfunctie met een top bij 08.55 uur en een dal bij 14.00 uur; wiskunde in de praktijk. Volgens het CBR zijn er geen goede redenen voor de verschillen in het aantal geslaagden, maar toch wanneer je naar de grafiek kijkt is af te lezen dat er een correlatie aanwezig is. Vervolgens geeft het CBR aan dat ze geen aanleiding ziet om verder onderzoek te doen naar de onderlinge verschillen; en dat vind ik nou een gemiste kans. Het verzamelen en analyseren van data is namelijk helemaal hot. Al moeten nog wel wat juridische zaken worden opgelost met betrekking tot wat wel mag worden bewaard, hoe lang en wat niet, maar ook van wie de data eigenlijk is.

 

Het analyseren van data is niet nieuw, dat doen we al eeuwen. Wat nieuw is, is de snel toenemende hoeveelheid aan beschikbare data en daarmee allerlei interessante correlaties die daaruit kunnen worden afgeleid. In hoeverre we iets met die correlaties kunnen doen, is dan weer afhankelijk van het wel/niet aanwezige causale verband. En als er dan een causaal verband is, dan wordt het pas leuk. Want hoe kunnen we dit verband omzetten in een behoefte, een product, een preventie of misschien wel een interventie. Natuurlijk realiseer ik me dat het ook tegen individuen kan worden gebruikt en dat is nou precies het maatschappelijke debat wat we met elkaar moeten voeren.

 

En wat betreft die slagingskansen en het tijdstip, het zijn natuurlijk maar cijfers en wat statistiek. We kennen allemaal wel de tegeltjeswijsheid over die statisticus die was verdronken in een sloot die gemiddeld 20 cm diep was. Bijgelovig of niet, wel of geen statisticus, mijn dochter haar herkansing zal zijn op een dinsdag om 08.55 uur.

 

Deze blog is geschreven op persoonlijke titel