I samfundsfag vil vi gerne finde sammenhænge, der kan forklare forskellige samfundsforhold. Det kunne være en sammenhæng mellem:
...og meget andet.
Målet er altså at forklare ændringer i en variabel Y (den afhængige) som en følge af ændringer i en anden variabel X (den uafhængige)
Uafhængig variabel (X) --> afhængig variabel (Y)
Vi vil allerhelst beskrive sammenhængen som en lineær sammenhæng. Til at undersøge, om der er en lineær sammenhæng mellem to variabel foretages en lineær regression.
Lad os tage et eksempel!
I tabellen til højre er der to mål for en række forskellige lande.
I første kolonne ses grad af globalisering. Jo højere et tal på globaliseringsindekset, desto mere globaliseret er et land i forhold til fx handel, turisme med mere. Det ses her, at Danmark scorer højt (89,14), mens fx Kina scorer lavt (64,48).
I næste kolonne ses BNP pr. indbygger. Dette tal siger altså noget om, hvor rigt et land er.
Men hvilken sammenhæng er der mon mellem de to tal? Vi kunne forvente, at jo mere globaliseret et land er, jo rigere er det, da handel med andre lande gør én rigere. Altså:
Grad af globalisering (X) --> BNP pr. indbygger (Y)
I Excel kan man teste denne sammenhæng (se også videoen). Det gør man ved at markere tallene i tabellen, vælge "indsæt" (1) i menuen og herunder vælge "indsæt punkt- eller boblediagram" (2).
Herefter skulle der gerne komme en figur, der ser således ud (se i højre side)
På figuren er hvert af landene nu markeret med en blå prik ud fra de to værdier: globaliseringsgrad (X-aksen) og BNP pr. indbygger (Y-aksen). Der ses allerede en tendens til, at lande med lav grad af globalisering ligger lavere i BNP pr. indbygger end lande med høj grad af globalisering.
Men tendensen kan gøres endnu mere tydelig ved at tilføje en tendenslinje samt en ligning med tilhørende R2 - værdi.
Ved at højre-klikke på et af de blå punkter (1) åbnes en menu, hvor man kan vælge "tilføj tendenslinje" (2)
Denne vælges og der skulle nu gerne åbne sig en ny menu (det kan godt se lidt forskelligt ud alt efter ens computer-model)
I menuen, der åbner sig, skal du vælger følgende:
Herefter skulle figuren gerne se ud som nedenfor med tilføjet ligning og R2 - værdi
Ligningen hedder her: y = 2380x - 153477, hvor det gælder, at:
Det vil altså sige, at for hver gang x stiger med 1, så stiger y med 2380 * 1 = 2380.
Med andre ord: For hvert point et land stiger i globaliseringsindekset, stiger BNP pr. indbygger med 2380 USD. Der er altså den forventede sammenhæng, at jo mere globaliseret et land er, desto rigere er landet.
R2 siger som nævnt noget om forklaringsgraden. I samfundsfag siger vi, at en R2 på 0,7489 betyder, at ca. 75 % af variationen i BNP pr indbygger (den afhængige variabel) kan forklares ved variationen i globaliseringsgraden (den uafhængige variabel).
I samfundsfag gælder følgende tommelfingerregel for R2: