Er is in Nederland een levendig debat ontstaan over de rol van peilingen en statistiek in de maatschappij. Niet iedere bijdrage daaraan is even productief. In een recent artikel in de Volkskrant maakte de filosoof Hans Schnitzler een grote filosofische redeneerfout en stelde hij een schokkend gebrek aan statistische kennis ten toon.
Schnitzler betoogt het volgende:
Alleen de eerste van deze drie uitspraken is juist.
Schnitzler schrijft dat het in de statistiek draait “om gemiddelden, om normaalverdelingen.” Volgens hem zou statistiek geen oog hebben voor buitengewone fenomenen, zoals de geboorte van zeer intelligente mensen zoals Einstein.
Normaalverdeling
De normaalverdeling en het gemiddelde zijn niet hetzelfde. De normaalverdeling geeft aan hoe waarschijnlijk het is om een waarde te vinden die afwijkt van het gemiddelde. Hoe verder de waarde van het gemiddelde af staat, hoe kleiner de kans. Een belangrijk kenmerk van de normaalverdeling is dat de verdeling symmetrisch om het gemiddelde is: de kans op een hele hoge waarde is gelijk aan de kans op een hele lage waarde. De normaalverdeling beschrijft diversiteit. Het laat zien hoe vaak het gangbare voorkomt en hoe vaak het exceptionele.
De intelligentie van mensen, bijvoorbeeld, is normaal verdeeld. De gemiddelde intelligentie is 100. 68 procent van de mensen heeft een intelligentie die tussen de 85 en 115 ligt. 16 procent van de mensen heeft een intelligentie die hoger is dan 115. 16 procent van de mensen heeft een intelligentie die lager is dan 85. 2.5 procent van de mensen heeft een intelligentie die hoger is dan 130. Uit ieder onderzoek komt dat intelligentie normaal verdeeld is. De kans dat er een heel slim persoon geboren wordt, zoals Einstein, met een IQ van, zeg, 190 wordt door de normaalverdeling beschreven. De kans daarop is ongeveer 1 op 1 miljard. Uitzonderlijk, maar niet buiten de mogelijkheden van de normaalverdeling.
Steekproef
Dat er uitzonderingen bestaan op de regel is voor Schnitzler een reden om de normaalverdeling te verwerpen. Dat statistici er soms naast zitten, komt volgens hem omdat de werkelijkheid zich niet laten beschrijven door statistiek.
Het tegenovergestelde is juist waar. De kern van statistiek is dat we erkennen dat we dingen alleen maar weten met een bepaalde mate van onzekerheid. Als je van iedereen in Nederland een steekproef van 1000 mensen interviewt en 20 procent van hen aangeeft VVD te stemmen dan zegt de statistiek dat we met 95 procent zekerheid kunnen zeggen dat tussen de 18 en de 22 procent van de Nederlanders VVD stemt. Het kan dus best zo zijn dat eigenlijk 30 procent van de Nederlanders VVD stemt. De kans daarop is alleen gezien deze uitslag klein. Een goede statisticus laat altijd zien hoe zeker hij is van zijn schatting. Want hij weet dat als hij 100 statistische testen uitvoert en zijn antwoorden met 95 procent zekerheid presenteert, hij kan verwachten dat hij er met 5 testen naast zit. Een statisticus erkent dat hij met een bepaalde kans faalbaar is. Het is niet het gemiddelde, zoals Schnitzler schrijft, dat de kern is van de statistiek, maar het besef dat we onzeker zijn over wat we weten.
Pragmatisch
En, overigens, iedere statisticus zal erkennen dat bepaalde fenomenen zijn die niet door een normaalverdeling laten beschrijven. Het aantal kinderen in een gezin is bijvoorbeeld niet normaal verdeeld. Een belangrijk kenmerk van de normaalverdeling is dat hij symmetrisch is rond het gemiddelde: een IQ van 110 is net zo waarschijnlijk als een IQ van 90. Het gemiddelde aantal kinderen in Nederland is ongeveer 2. De kans dat een gezin vijf kinderen heeft, is niet gelijk aan de kans dat een gezin -1 kind heeft. Dat kan namelijk niet. Gezinsgrootte is dus blijkbaar niet normaal verdeeld.
Een wetenschapper moet pragmatisch zijn. Hij probeert een model te ontwikkelen dat de werkelijkheid beschrijft. Als de voorspelling daaruit niet waar blijkt te zijn, dan moet hij het model verwerpen en een nieuw model ontwikkelen. De normaalverdeling is tot nu toe bijzonder succesvol geweest om de kansverdeling van een groot aantal natuurlijke fenomenen te beschrijven – maar niet van alle fenomenen.
Na betoogd te hebben dat volgens statistici alleen het gemiddelde bestaat, stelt Schnitzler dat statistici zouden vinden dat alles wat afwijkt van dat gemiddelde problematisch is.
Gemiddelde
Volgens Schnitzler houdt statistiek een streven naar eenvormigheid in. Hoe de wereld in elkaar zit en hoe de wereld in elkaar zou moeten zitten, zijn echter niet noodzakelijkerwijs hetzelfde. Dat we sommige fenomenen kunnen beschrijven aan de hand van een normaalverdeling geeft niet aan dat het per se wenselijk is dat dit zo verdeeld is. De normaalverdeling is geen normatief ideaal is, het is een empirisch gegeven. Het beschrijft een boel natuurlijke en maatschappelijke fenomenen. Het is geen instructie voor hoe de werkelijkheid eruit moet zien. De kans dat iemand statisticus wordt, is niet heel groot. Toch zal geen statisticus het iemand kwalijk als hij of zij voor deze carrière-richting kiest.
Kortom: er bestaat inderdaad zoiets als een gemiddelde. Maar er bestaan in de statistiek ook andere dingen zoals normaalverdelingen. Hiermee kunnen we een boel fenomenen beschrijven, maar niet alle. Statistici weten dat de conclusies van hun onderzoek niet 100 procent zeker zijn. Die onzekerheid is de kern van statistiek. Vervolgens hebben statistici niet per se een mening over hoe de wereld eruit zou moeten zien. Statistiek beschrijft de wereld, zij schrijft niet een wereld voor.
Simon Otjes is politicoloog en filosoof en Erik Woldhuis is theoretisch natuurkundige.
Lees ook: Leve de statistiek!