Chikwadraat-verdeling

Continue kansverdelingen

Overschrijdingskansen van de chikwadraat-verdeling

Als we n onafhankelijke waarnemingen doen in een populatie met de standaard normale verdeling, dan kunnen we de waarnemingen, z1, z2, ... , zn, samenvatten tot een nieuwe grootheid met bekende verdeling. De kansvariabele T = Z12 + Z22 + ... + Zn2 heeft de chikwadraat-verdeling. Z1, Z2, ... , Zn zijn onafhankelijke, standaard normaal verdeelde variabelen. Het aantal vrijheidsgraden van de chikwadraat-verdeling, ν, is gelijk aan het aantal onafhankelijke waarnemingen, in dit geval dus n.

De chi-kwadraat verdeling is dus een van de normale verdeling afgeleide kansverdeling. Het is een rechtsscheve verdeling en de vorm van de kansdichtheidskromme is afhankelijk van het aantal vrijheidsgraden, ν, zie de figuur.

Een chikwadraat verdeelde variabele T met ν = n vrijheidsgraden ontstaat dus, als we n onafhankelijke waarnemingen x1, x2, ... , xn doen in dezelfde normaal verdeelde populatie X ~ N(μ, σ2), de uitkomsten standaardiseren tot z = (x - μ) / σ, kwadrateren en optellen tot t = z12 + z22 + ... + zn2.

Voorbeeld. Gezuiverd afvalwater mag maximaal 10 Coli-bacteriën per 0.1 ml bevatten. In twee controle-monsters vinden we 18 en 8 Coli's. Voldoet het water aan de norm?

De statistische vertaling van de onderzoeksvraag is: hoe waarschijnlijk is het dat monsters van 18 en 8 worden gevonden in water met 10 Coli-bacteriën per 0.1 ml. Als dat erg onwaarschijnlijk is, voldoet het water waarschijnlijk niet aan de norm van 10 Coli's per 0.1 ml.

Voor tellingen geldt de Poisson-verdeling, maar als μ = 10 mag de normale benadering van discrete verdelingen worden toegepast. De tellingen zijn dan normaal verdeeld met μ = 10 en σ = 10 = 3.16. De uitkomsten worden met de Z-transformatie herleid tot z1 = (18 - 10)/3.16 = 2.53 en z2 = (8 - 10)/3.16 = -0.63. De grootheid T = Z12 + Z22 is chikwadraat verdeeld met 2 vrijheidsgraden. De overschrijdingskans van onze uitkomst t = z12 + z22 = 2.532 + (-0.63)2 = 6.80 zoeken we op met het simulatie-programma van de chikwadraat-verdeling en bedraagt P(T 6.80) = 0.033.

De uitkomsten 18 en 8 treden in water dat aan de norm (μ = 10) voldoet slechts in 3% van de gevallen op, zodat we mogen aannemen, dat het water niet meer dan 10 Coli's per 0.1 ml bevat.

In de praktijk zijn veel kansvariabelen (exact of bij benadering) chikwadraat verdeeld. Een ander voorbeeld is de kansverdeling van de steekproefvariantie, s2.