Steekproefomvang en betrouwbaarheidsinterval

Steekproefomvang

Steekproefomvang bij enquêtes

Enquêtes in kleine populaties

De waarnemingen of metingen in een steekproef leveren behalve een puntschatting van het gemiddelde (of van een andere parameter) van de populatie ook een schatting op van het betrouwbaarheidsinterval van de geschatte populatieparameter.

Voorbeeld. In een steekproef van 225 Nederlanders blijkt 20% of 45 personen aan overgewicht te lijden. Het 95% betrouwbaarheidsinterval van deze schatting ligt ongeveer tussen de grenzen 15 en 25%, dat wil zeggen, dat het werkelijke percentage Nederlanders met overgewicht met 95% zekerheid ligt tussen die onder- en bovengrenzen.

Dit betrouwbaarheidsinterval wordt berekend uit de steekproefresultaten en is dus zelf ook weer een schatting. De breedte van het betrouwbaarheidsinterval wordt mede bepaald door de steekproefomvang en omgekeerd kan uit de gewenste breedte van het betrouwbaarheidsinterval de noodzakelijke steekproefomvang worden berekend. Het betrouwbaarheidsinterval van het steekproefgemiddelde is bijvoorbeeld:

waarin de standaardafwijking, s, uit de steekproef wordt berekend, omdat de populatiestandaardafwijking, s, onbekend is. De t-verdeling vervangt dan de standaard normale verdeling. De breedte van het betrouwbaarheidsinterval is de bovengrens minus de ondergrens en dus gelijk aan:

Voorbeeld. In een steekproef van 100 Nederlanders in de leeftijd van 30-40 jaar en een lengte van 1.80 tot 1.84 meter is het gemiddelde lichaamsgewicht 79.3 kg met een standaardafwijking van 8.3 kg. Het 95% betrouwbaarheidsinterval is dan ongeveer = 79.3 1.984 * 8.3/100 = 79.3 1.647. De breedte van het interval is dus 2 x 1.647 = 3.294.

Door de steekproefomvang, n, uit de formule op te lossen kunnen we nu voor iedere gewenste breedte van het betrouwbaarheidsinterval de steekproefomvang berekenen:

Voorbeeld. In het voorbeeld van de lichaamsgewichten willen we het 95% betrouwbaarheidsinterval niet groter dan 1.0 hebben, dus de breedte moet 2.0 zijn. De vereiste steekproefomvang is dus n = 4 * 1.9842 * 8.32 / 2.02 = 271. De kritieke waarde van de t-verdeling in de formule is afhankelijk van het aantal vrijheidsgraden, waarmee de standaardafwijking is geschat. Dat is nu 270, maar herberekening geeft een nauwelijks andere uitkomst: n = 4 * 1.9692 * 8.32 / 2.02 = 267.



Quizz