Steekproefgrootheden
De som van n kansvariabelen X1, X2, ... , Xn met gemiddelden m1, m2, ... , mn en varianties s12, s22, ... , sn2,
Sn = X1 + X2 + ... + Xn,
is zelf weer een kansvariabele. De kansverdeling van Sn benadert voor n
de normale verdeling met gemiddelde Smi en variantie Ssi2, ook al zijn de kansverdelingen van de variabelen X1, X2, ... , Xn zelf niet normaal verdeeld. Deze uitspraak staat bekend als de centrale limietstelling.
Als X1, X2, ... , Xn alle dezelfde kansverdeling hebben met gemiddelde m en variantie s2, kunnen zij worden opgevat als de trekking van een steekproef van n waarnemingen uit dezelfde populatie. Sn is dan de som van de waarnemingen in de steekproef met gemiddelde nm en variantie ns2.
Voorbeeld. In een lift hangt een bordje: "10 personen. Maximaal gewicht 800 kg." Hoe groot is de kans, dat dit gewicht wordt overschreden, als het gewicht van de gebruikers normaal verdeeld is met gemiddelde 75 kg en standaardafwijking 9 kg? 10 personen wegen gemiddeld 750 kg met variantie ns2 = 10 x 92 = 810, dus met standaardafwijking
810 = 28.5. De overschrijdingskans van de waarde 800 kg is 0.04.
In deze laatste vorm is de centrale limietstelling de basis van de normale benadering van discrete verdelingen, zoals de binomiale verdeling en de Poisson verdeling. De binomiale verdeling kan bijvoorbeeld worden opgevat als de kansverdeling van het aantal successen in een steekproef van n trekkingen uit een (dichotome) populatie, waarin de proportie successen p is. Bij voldoend grote steekproefomvang, n, is dit aantal volgens de centrale limietstelling dan normaal verdeeld met gemiddelde np en variantie np(1 - p).
Het steekproefgemiddelde van n waarnemingen, X1, X2, ... , Xn, is gelijk aan
= Sn/n. Uit de centrale limietstelling volgt dan, dat de kansverdeling van het steekproefgemiddelde bij voldoend grote steekproef normaal verdeeld is met gemiddelde m en variantie s2/n.
In het algemeen is een steekproefomvang van n = 10 à 20 voldoende groot om de kansverdeling van het steekproefgemiddelde met de normale verdeling te kunnen benaderen. In het geval van de binomiale verdeling gelden de voorwaarden np
5 én n(1 - p)
5. Voor de Poisson-verdeling moet m
5 zijn.
De animatie laat zien, dat de binomiale verdeling (hier met p = 0.2) steeds meer de klokvorm van de normale verdeling aanneemt, als n groter wordt.
