Steekproefomvang bij enquêtes

Steekproefomvang en betrouwbaarheidsinterval

Bij het opzetten van een enquête zijn de twee belangrijkste methodologische discussiepunten: hoe komt de steekproef tot stand en hoe groot moet de steekproef zijn? Het eerste discussiepunt betreft de representativiteit van de steekproef en wordt uitgebreid behandeld onder steekproeftrekking. Het tweede punt heeft betrekking op de betrouwbaarheid van de enquête-uitkomsten, die vooral wordt bepaald door de steekproefomvang.

De uitkomsten van een enquête zijn in essentie steekproefproporties, p, die de overeenkomstige proporties, π, in de te bevragen populatie schatten. Steekproefproporties hebben de binomiale verdeling en zijn bij voldoend grote steekproeven (zie normale benadering) bij benadering normaal verdeeld met μ = π en σ2 = π(1- π)/n ~ p(1 - p)/n.

Voorbeeld. De voorspelling van de uitslag van een referendum in een steekproef van n = 500 respondenten is 165 stemmen vóór en 335 stemmen tegen het voorstel. De proporties p = 0.33 vóór en 1 - p = 0.67 tegen zijn schattingen van de onbekende proporties π vóór en 1- π tegen in de populatie van alle kiezers. De standaardfout van beide proporties schatten we met de steekproefproporties, p, in plaats van met de (onbekende) populatieproporties, π:

De breedte van het betrouwbaarheidsinterval voor π volgt uit de overeenkomstige formule in steekproefomvang en betrouwbaarheidsinterval:

waarin de t-verdeling is vervangen door de standaard normale verdeling en s2/n door p(1 - p)/n. Gegeven een gewenste breedte van het betrouwbaarheidsinterval kunnen we voor de benodigde steekproefomvang nu gemakkelijk afleiden:

Voorbeeld. De breedte van het 95% betrouwbaarheidsinterval voor de vóórstemmers en de tegenstemmers bij het referendum is dus CI0.95 = 2 x 1.96 x 0.021 = 0.082. Dat is 8.2%, vrij veel, al blijft de voorspelling dat het voorstel zal worden verworpen betrouwbaar. Willen we een kleiner betrouwbaarheidsinterval, bijvoorbeeld met een breedte van 5%, dan is de benodigde steekproefomvang n = 4 x 1.962 x 0.33 x 0.67 / 0.052 = 1359. Een grotere betrouwbaarheid, bijvoorbeeld 99% in plaats van 95% en dezelfde breedte van het betrouwbaarheidsinterval geeft n = 4 x 2.5762 x 0.33 x 0.67 / 0.0822 = 873.

Bij enquêtes in kleine populaties kan de steekproefomvang meestal wat kleiner zijn.