Kansverdelingen
Waarom gebruiken we theoretische kansverdelingen als model voor empirische kansverdelingen of reële frequentieverdelingen?
Statistisch onderzoek beoogt uitspraken te doen over de kansverdeling van een kenmerk op basis van steekproefgegevens. (Zie steekproefgrootheden) Om de kansverdeling precies te leren kennen zouden grote steekproeven nodig zijn, waardoor het onderzoek tijdrovend en kostbaar zou worden. Als we nu theoretische of practische redenen hebben om aan te nemen, dat de gezochte kansverdeling benaderd kan worden met een theoretische kansverdeling met bekende eigenschappen, kunnen we soms met een kleinere steekproef volstaan.
Voorbeeld. Tellingen, bijvoorbeeld van ongevallen, hebben een theoretische kansverdeling, die de Poisson-verdeling wordt genoemd. De standaardafwijking van de Poisson-verdeling is gelijk aan de wortel van het gemiddelde van de tellingen. In Nederland is het aantal dodelijke verkeersslachtoffers gemiddeld over een aantal jaren 1200. De standaardafwijking kan dus geschat worden op (1200 = 35. Als in een bepaald jaar het aantal verkeersslachtoffers 1235 bedraagt, valt dat binnen de normale toevallige spreiding en is er geen reden om van een opvallende toename te spreken. Als het aantal slachtoffers in een jaar daarentegen 1300 is, is dat wel reden om te spreken van een niet-toevallige toename of misschien zelfs van een trend.
Theoretische kansverdelingen worden gekenmerkt door een wiskundige formule of procedure en door een klein aantal parameters. Door aan te nemen, dat een empirische kansverdeling gemodelleerd kan worden door een theoretische verdeling met bekende mathematische eigenschappen, kunnen we met één enkele of een paar waarnemingen de hele verdeling schatten.