Forum Statistiek

Vragen & antwoordem over statistiek en methodologie
Het is nu di apr 24, 2018 7:34 pm

Alle tijden zijn GMT + 1 uur




Plaats een nieuw onderwerp Antwoord op onderwerp  [ 2 berichten ] 
Auteur Bericht
BerichtGeplaatst: wo jan 25, 2017 5:22 pm 
Offline

Geregistreerd: wo jan 25, 2017 4:57 pm
Berichten: 1
Ik ben bezig met mijn masterscriptie, en loop helaas vast in mijn analyse.
Ik heb de volgende variabelen:

Afhankelijke var:
- Mening over tbs = continue (totaalscore op vragenlijst)
Onafhankelijke var:
- Drie persoonlijkheidstrekken = alle drie continue (totaalscore op vragenlijst)
- Leeftijd = continue
- Geslacht = dummy man/vrouw
- Opleidingsniveau = dummy laag/hoog
- Politieke voorkeur = ?

Ik heb met bovenstaande variabelen in eerste instantie verschillende testen uitgevoerd, zoals de T-test, Anova en een enkelvoudige lineaire regressie vergelijking.
In mijn feedback kreeg ik te horen dat ik als analyse een meervoudige regressie analyse moet gaan doen, met de backwards methode waarin ik alle factoren als continue variabelen moet invoeren. Ik ga door middel van deze analyse kijken welke factoren de afhankelijke variabele voorspellen.

Ik heb twee vragen:
1. De variabele 'politieke voorkeur' loopt van 0 t/m 10, waarbij 0 = extreem links politiek georiënteerd en 10 = extreem rechts politiek georiënteerd (en 5 zou dus neutraal betekenen).
Hoe kan ik deze het beste invoeren in de analyse? Zoals hij nu is, of zou ik er ook een dummy van kunnen maken, waarbij 0-3 links betekent, 4-6 neutraal en 7-10 rechts? Of op welke manier kan zo'n variabele in een regressie analyse gestopt worden?

2. Ik heb de analyse gedraaid, maar nu is mijn tweede vraag of het laatste model na de backwards methode altijd het beste model is? Ik krijg namelijk uiteindelijk 6 modellen waar telkens een variabele uit verwijderd is, en zie het volgende in SPSS:

R / R2/ Adj R2 / SE / R2Change/ F Change/ df1/ df2/ Sig. F Change
1 ,431a ,185 ,121 7,54090 ,185 2,874 8 101 ,006
2 ,431b ,185 ,130 7,50386 ,000 ,001 1 101 ,981
3 ,430c ,185 ,138 7,46823 ,000 ,024 1 102 ,877
4 ,427d ,183 ,143 7,44461 -,003 ,343 1 103 ,559
5 ,423e ,179 ,148 7,42360 -,003 ,408 1 104 ,524
6 ,407f ,165 ,142 7,45143 -,014 1,796 1 105 ,183
a Predictors: (Constant), polvk_DUMrechts, leeftijd, Extr_Totaal, opleiding, Openh_Totaal, Vriend_Totaal, geslacht, polvk_DUMneutr
b Predictors: (Constant), polvk_DUMrechts, leeftijd, Extr_Totaal, opleiding, Openh_Totaal, Vriend_Totaal, polvk_DUMneutr
c Predictors: (Constant), polvk_DUMrechts, leeftijd, Extr_Totaal, Openh_Totaal, Vriend_Totaal, polvk_DUMneutr
d Predictors: (Constant), polvk_DUMrechts, leeftijd, Openh_Totaal, Vriend_Totaal, polvk_DUMneutr
e Predictors: (Constant), polvk_DUMrechts, Openh_Totaal, Vriend_Totaal, polvk_DUMneutr
f Predictors: (Constant), polvk_DUMrechts, Vriend_Totaal, polvk_DUMneutr
g Dependent Variable: Resoc_Totaal

Tevens is in de andere tabellen te zien dat de Mean Square weer toeneemt bij het laatste model, beide modellen significant <.001 zijn, en dezelfde twee variabelen significant blijven in beide modellen (twee variabelen zijn in dat model niet significant).
Is het niet logisch om hier uit te gaan van het vijfde model, aangezien deze op veel vlakken een beter resultaat heeft?

Alvast heel erg bedankt!
Vriendelijke groet,
Britt


Omhoog
 Profiel  
Antwoord met een citaat  
BerichtGeplaatst: vr jan 27, 2017 7:30 pm 
Offline
Site Admin

Geregistreerd: za okt 30, 2004 4:46 pm
Berichten: 2676
Woonplaats: Amsterdam
Beste Britt

Vraag 1
Politieke voorkeur is geen eendimensionale grootheid. Je kunt sociaaleconomisch links zijn en tegelijkertijd sociaalcultureel rechts (PVV) of juist links (SP). (Ik ben geen politicoloog, dus ik praat de krant na.) Als je dat ook vindt moet je dus 2 variabelen voor politieke voorkeur meten of definieren. Ik zou dan de voorkeur geven aan 2 dummies 0/1, meer dan 2 waarden geeft maar schijnnauwkeurigheid. Als je toch meer waarden wilt, voor de sociaaleconomische variabele is daar wel wat voor te zeggen, doe dat dan volgens het schema in de Kennisbasis Statistiek, Categorische predictoren in het regressie-model. In je huidige model heb je 2 variabelen voor 3 categorieën opgenomen (polvk_DUMrechts, polvk_DUMneutr), ik kan niet beoordelen of je dat juist hebt gedaan: de naamgeving van de variabelen is enigszins misleidend.

Vraag 2
Het laatste model bij een backward procedure, en trouwens ook dat bij forward en stepwise procedures, is zeker niet altijd het 'beste' model, zie Kennisbasis Statistiek, Stapsgewijze regressie. Wat het 'beste' model is, hangt er overigens maar vanaf wat je zo definiëert. Als je alle mogelijke combinaties van de variabelen probeert en die met de grootste R2 of F behoudt, verkrijg je technisch het beste model, maar ook een grote kans op nonsens-correlaties. Het beste in de zin van meest 'valide' model krijg je door het zelf af te leiden uit de theorie en vervolgens te toetsen. Stapsgewijze procedures zitten daar een beetje tussenin. Ze worden meestal gebruikt om in een volgend onderzoek te dienen als vervolghypothese.

Succes, Herman.

_________________
Beheerder/moderator Forum Statistiek en Kennisbasis Statistiek. Voor zakelijke dienstverlening klik WynneConsult.


Omhoog
 Profiel  
Antwoord met een citaat  
Geef de vorige berichten weer:  Sorteer op  
Plaats een nieuw onderwerp Antwoord op onderwerp  [ 2 berichten ] 

Alle tijden zijn GMT + 1 uur


Wie is er online

Gebruikers op dit forum: Geen geregistreerde gebruikers. en 3 gasten


Je mag geen nieuwe onderwerpen in dit forum plaatsen
Je mag niet antwoorden op een onderwerp in dit forum
Je mag je berichten in dit forum niet wijzigen
Je mag je berichten niet uit dit forum verwijderen
Je mag geen bijlagen toevoegen in dit forum

Zoek naar:
Ga naar:  
POWERED_BY
phpBB.nl Vertaling