Berekening van het betrouwbaarheidsinterval

Puntschatters en intervalschatters

Eenzijdig betrouwbaarheidsinterval

Uit een populatie met gemiddelde, μ, trekken we achtereenvolgens aselecte steekproeven en berekenen de steekproefgemiddelden als puntschatters van μ.

Als we de waarde van de populatieparameter, μ, kennen, kunnen we uit de kansverdeling van de puntschatter een ondergrens en een bovengrens afleiden, die een interval omsluiten, waarin de puntschatting met een zekere kans (bijvoorbeeld 95%) ligt. Verder kunnen we rondom iedere puntschatting een interval van dezelfde grootte construeren. Als we de waarde van de populatieparameter, μ, niet kennen, weten we toch, dat die in (bijvoorbeeld) 95% van de gevallen in deze intervallen ligt. Deze intervallen worden betrouwbaarheidsintervallen genoemd. In de animatie wordt deze manier om betrouwbaarheidsintervallen te construeren toegelicht.

De grenzen, waartussen 95% van de waarden van X ligt, worden gedefinieerd door de overschrijdingskansen:

P(X > x0.975) = 0.975 en P(X > x0.025) = 0.025

De schatter X ligt dus in 95% van de gevallen tussen de grenswaarden x0.975 en x0.025:

x0.975 < X < x0.025

De grenswaarden x0.975 en x0.025 worden bepaald door de kansverdeling van X. Als de kansverdeling van X bekend is met verwachting μ en standaardfout σ, dan kunnen de grenswaarden door standaardiseren worden omgezet tot z0.975 = (x0.975 - μ)/σ en z0.025 = (x0.025 - μ)/σ, zodat in 95% van de gevallen geldt :

μ + z0.975 σ < X < μ + z0.025 σ

Door herschikking ontstaat hieruit het 95% betrouwbaarheidsinterval:

X - z0.025 σ < μ < X - z0.975 σ

Deze formule spreekt uit, dat in 95% van de gevallen de waarde van μ tussen de aangegeven onder- en bovengrens ligt.

De waarden van de onder- en bovengrenzen van het betrouwbaarheidsinterval kunnen worden berekend uit de waarde van X, zijn standaardfout, σ, en de waarden van z0.975 en z0.025, die afhangen van de kansverdeling van X. Als X bijvoorbeeld de normale verdeling verdeling heeft, kunnen de grenswaarden z0.975 en z0.025 worden opgezocht in de standaard normale verdeling: z0.975 = - 1.96 en z0.025 = 1.96. Als de standaardfout van X onbekend is en moet worden geschat met de steekproefstandaardafwijking, s, worden de grenswaarden z0.975 en z0.025 opgezocht in de t-verdeling.

De algemene berekeningsformule voor het 100(1 - α)% betrouwbaarheidsinterval van de puntschatter X is:

Voor symmeterische verdelingen, zoals de normale verdeling en de t-verdeling, geldt = - , zodat het betrouwbaarheidsinterval dan ook kan worden geschreven als:

Voorbeeld. Een wielrenner heeft bij de start van een klassieker een bloedbezinking van 52%. De standaardfout, σ, van de bepaling van de bloedbezinking is bekend en bedraagt 1%. Als de werkelijke waarde van de bloedbezinking van de wielrenner μ is en de kansverdeling van de puntschatter, X, is normaal, dan is het 95% betrouwbaarheidsinterval X - 1.96 σ < μ < X + 1.96 σ dit is 50.04 < μ < 53.96.

De interpretatie van dit resultaat is niet, dat de wielrenner met 95% waarschijnlijkheid boven de kritische grens van 50% zit. De juiste uitspraak is, dat de bepalingsmethode betrouwbaarheidsintervallen oplevert, die in 95% van de gevallen de werkelijke bloedbezinking van de wielrenner bevatten. Omdat de waarde 50% niet in het gevonden interval ligt, kunnen we erop vertrouwen (zeker weten we het niet), dat de wielrenner boven die grens zit.



Quizz