I international Økonomi er vi meget optaget af at finde kausale sammenhænge, der kan forklare en økonomisk udvikling, nogle bestemte økonomiske forhold, eller noget helt tredje. En kausalsammenhæng findes når ændringer i den uafhængige variable fører til ændringer i den afhængige variable. Dette kan skrives således:
Uafhængig variable (X) -> Afhængig variable (Y)
Bemærk at (X) ligeledes referer til X-aksen i et koordinatsystem, mens (Y) referer til Y-aksen i et koordinatsystem.
Overordnet set taler man om fire krav skal være opfyldt før der findes en kausalsammenhæng:
De fire krav
1) Teoretisk forklaring
2) Tidsrækkefølge
3) Statistisk sammenhæng (Korrelation)
4) Kontrol for tredjevariable
Lineær regression anvendes når vi undersøger om der er en statistisk sammenhæng (Korrelation) mellem to variable. Det er derfor vigtigt at understege at lineær regression ikke i sig selv etablerer kausalitet. Se nedenstående eksempel på en spøjs sammenhæng mellem hvor mange film Nicolas Cage medvirker i og antallet af folk, der drukner i swimmingpools.
Kilde: Tylervigen.com
Fortolkning af lineær regression
Som du kan se i videoen nedenfor er formålet med at lave en lineær regression at finde en R2 - værdi. Denne værdi viser hvor stor en del af variationen på den afhængige variable, vi kan forklare med den uafhængige variable. R2 Kan antage værdier mellem 0 og 1. Værdien 1 betyder, at vi forklarer 100% af variationen i den afhængige variable med vores model. Værdien 0 betyder at vi ikke kan forklare noget som helst.
Der findes ingen gylden standard for R2, og der kan være stor uenighed mellem faggrupper hvad en acceptabel R2 - værdi skal være. Nedenfor findes mine bud på tre intervaller i International Økonomi.
Er R2 -over 0,75 Kan det betegnes som en stærk sammenhæng
Er R2 -mellem 0,74-0,30 Kan det betegnes som en sammenhæng, men også andre faktorer spiller ind
Er R2 -Under 0,30 Kan det betegnes som en svag sammenhæng, og man bør betvivle den og søge andre supplerende forklaringer