Causaliteit of correlatie? Over Wilders en vloerkleden en het gevaar van Big Data - door drs. Margreet Haandrikman AAG

 

Zeker in deze verkiezingstijd worden we regelmatig geconfronteerd met vreemde verbanden, die door politici gelegd worden.

 

 “Kul causaliteit” noemt Sanne Blauw dit in de Correspondent. Een paar kenmerken:

 

De eerste ligt voor de hand: er is helemaal geen verband. Zo laat Sanne een prachtig grafiekje zien van de relatie tussen Wilders en vloerkleden: het aantal zoekopdrachten in google naar “vloerkleed karwei” heeft een heel sterke samenhang tussen de hoogte van de peilingen voor de PVV. Conclusie: door het aantal zoekopdrachten naar “vloerkleed karwei” te stimuleren, loop je het risico dat de PVV meer zetels zal krijgen.

 

Het tweede kenmerk geeft ook te denken: is het niet andersom? Is de lage economische groei nu de oorzaak van de hoge staatschuld of is het andersom. Dat maakt nogal uit in het beleid dat je gaat voeren!

 

Onder Solvency II speelt correlatie ook een belangrijke rol. Verbazingwekkend dat vrijwel niemand de exacte achtergrond weet van de getallen die gehanteerd worden. Impliciet is de aanname dat de correlatie veroorzaakt wordt door:

 

  1. een direct verband waarbij de ene parameter direct de andere beïnvloedt;
  2. een identieke achterliggende oorzaak voor beide parameters.

 

Maar we weten ook dat de correlatiefactoren in extreme omstandigheden niet werken. Dan is er dus geen eenduidige achterliggende oorzaak en ook geen direct verband. Er zijn complexere modellen die het in die omstandigheden iets beter lijken te doen dan het standaardmodel. Misschien een betere inschatting maar nog geen antwoord op de vraag welk beleid beter is. Om dat te weten moeten we terug naar de oorzaak en dat is nu precies waar nog te weinig aandacht aan wordt besteed.

 

De hoeveelheid correlaties en vermeende verbanden neemt exponentieel toe met het gebruik van meer data en daarmee ook het risico op mogelijk onverstandige, zo niet onzinnige, conclusies over het te voeren beleid. Die conclusies trekken actuarissen misschien niet, maar het gevaar ligt op de loer als uitkomsten zo maar de wereld in geslingerd worden. Ik heb echter ook niet de illusie dat we in onze complexe wereld met big data de causaliteit zomaar boven water halen.

 

Wat dan wel? Met meer data en modellen komt ook meer verantwoordelijkheid. Verantwoordelijkheid om aandacht te besteden aan wat we wel en niet kunnen concluderen en wat de risico’s van verkeerde conclusies zijn.

 

Mijn voorstel is om rapporten voortaan te voorzien van een disclaimer? “ De getoonde correlaties tussen risico’s, betekenen niet dat risico’s elkaar beïnvloeden noch dat ze dezelfde oorzaak hebben. Alleen als we dit expliciet noemen mag u deze conclusie trekken.”

 

Deze blog is op persoonlijke titel geschreven.