Twee steekproeven, continue variabelen
Aan drie voorwaarden moet zijn voldaan om Student's t-toets voor onafhankelijke steekproeven te mogen toepassen.
De steekproeven moeten onafhankelijk zijn. Dat wil zeggen, dat de uitkomsten in de ene steekproef die in de andere steekproef op geen enkele wijze mogen beïnvloeden. In de praktijk zal aan die voorwaarde meestal voldaan zijn, als de eenheden (bijvoorbeeld proefpersonen) in de steekproeven verschillend zijn, maar ook dan kan door fouten in de proefopzet afhankelijkheid ontstaan. Als steeds twee waarnemingen op dezelfde eenheid worden gedaan, zijn de steekproeven zelden onafhankelijk en wordt de gepaarde t-toets uitgevoerd.
De steekproeven moeten uit populaties met gelijke variantie afkomstig zijn. Of aan deze voorwaarde is voldaan wordt getoetst met de F-toets. Indien aan deze voorwaarde niet is voldaan, kan met de meeste statistische rekenprogramma's een correctie worden uitgevoerd.
De uitkomstvariabelen moeten continu zijn en de steekproefgemiddelden moeten normaal verdeeld zijn. Dit laatste is bij benadering ook het geval, als de aantallen in de steekproeven voldoende groot zijn, zie de centrale limietstelling. Als aan deze voorwaarde niet voldaan is, kan de Mann-Whitney toets voor ordinale kansvariabelen worden uitgevoerd.
Voorbeeld. Heeft stress invloed op de tijd, die mensen nodig hebben om een opdracht uit te voeren? Om deze vraag te beantwoorden worden 2 groepen proefpersonen vergeleken. De ene groep (n1 = 10) voert een opdracht onder stress uit, de andere (contole-)groep (n2 = 12) voert dezelfde opdracht niet onder stress uit. De gemiddelde tijden zijn (in seconden)
= 433 en
= 367, de steekproefstandaardafwijkingen zijn s1 = 65 en s2 = 84.
De steekproeven bevatten verschillende eenheden en zijn dus in beginsel onafhankelijk.
In de F-toets is de verhouding t = s12 / s22 = 842 / 652 = 1.67, met overschrijdingskans p = P(T > 1.67) = 0.20, zie de F-verdeling met 9 en 11 vrijheidsgraden. Bij het gebruikelijke significantieniveau van α = 0.05 wordt de nulhypothese dus niet verworpen en mag worden aangenomen, dat aan de voorwaarde is voldaan.
Tijd is een continue variabele en de uitkomsten in dit soort onderzoek zijn meestal redelijk normaal verdeeld. Bovendien zijn de steekproeven groot genoeg (> 10) om te mogen aannemen, dat de steekproefgemiddelden bij benadering normaal verdeeld zullen zijn.
Opmerking. Als de waarnemingen een rechtsscheve verdeling hebben en het verschil van de steekproefgemiddelden is aanzienlijk, zullen de steekproefvarianties sterk kunnen verschillen. Aan twee van de drie voorwaarden wordt dan niet voldaan, zeker als de steekproeven klein zijn. In die gevallen kan een logarithmische transformatie van de uitkomsten en opnieuw uitvoeren van de toets helpen. De varianties worden meer gelijk en de verdeling symmetrischer. Het resultaat van de toets is in het algemeen geldig.