Hvad en Variabel?
En variabel er den egenskab over hvilken en enhed kan varierer.
Fx kan en enheden ”en vælger” have to egenskaber:
”køn”
”uddannelse”
Egenskaben ”køn” er variabel ”mand/kvinde”
Egenskaben ”uddannelse” kan fx være ”folkeskole/ mellemlang uddannelse / lang uddannelse”.
Variable kan være ”uafhængige”, dvs. de ikke er påvirkede af andre variable i vores model. De kan også være ”afhængige”, dvs. de muligvis påvirkes af andre variable i vores model. Køn vil i samfundsfag f.eks. altid være en uafhængig variabel i samfundsfag. Men det kan i samfundsfag undersøges, hvad menneskers uddannelse afhænger af. Det vil sige, at uddannelse i samfundsfag nogen gange kan opfattes som en afhængig variabel.
Derudover kan der være ”mellemkommende variable”, der påvirker sammenhængen mellem den uafhængige og afhængige. I vores eksempel kunne det være partivalg.
Eks på sammenhæng mellem variable:
Problemformulering: Hvorledes varierer danskernes holdninger til flygtninge og indvandrere?
Hypotese 1: Jo ældre en etnisk dansker er, jo mere forbeholden er han/hun overfor flygtninge og indvandre i det danske samfund.
Hypotese 2: Danskernes uddannelse dvs. type og længde har indflydelse på deres holdninger.
Hvad bruges en regressionsanalyse til?
Regressionsanalysen anvendes til at undersøge for lineær samvarians (korrelation) mellem to variable. Lineær regression er fast inventar til skriftlig eksamen på samfundsfag A.
Korrelation/samvarians betyder at to variable varierer sammen – dvs. når x stiger, falder eller stiger y systematisk.
Pas på! Samvarians er IKKE nødvendigvis ensbetydende med, at der er en kausal sammenhæng mellem den uafhængige og den afhængige variabel.
Fortolkning af tendenslinjen og dens formel
Sammenhængen mellem de to variable kan beskrives i en formel for en ret linje: y= a*x +b
x = den uafhængige variabel (årsagsvariablen)
y = den afhængige variabel (effektvariablen)
a = angiver linjens hældningskoefficient - hvor meget stiger/falder y, når x stiger med én
b = skæringspunktet med y-aksen
Fortolkning af R2-kvadrerert (”Determinationskoefficienten”)
R2 har altid en værdi mellem 0 og 1.
R2-værdien angiver hvor stor en andel af variationen i y-variablen der kan forklares ved variationen i x-variablen.
Jo højere R2, desto stærkere er den uafhængige variabels forklaringskraft.
Rent matematisk fortæller R2-værdien hvor tæt datapunkterne ligger på tendenslinjen.