udvalgte beregninger af konfidensinterval
fortolkning af den statistiske usikkerhed (signifikant forskel på to grupper eller meningsmåling og valg)
kommentering på konkrete beregninger (tal)
Statistisk usikkerhed angiver i hvilket interval (konfidensinterval), vi ud fra en stikprøve kan være typisk 95% sikre på, at en procentandel ligger i populationen. Hvis eksempelvis en meningsmåling (stikprøven) viser, at Dansk Folkeparti får 25 % af stemmerne, og usikkerheden beregnes til 2,4 procentpoints, kan vi være 95% sikre på, at Dansk Folkepartis stemmeandel ligger mellem 22,6% og 27,4% i hele populationen (alle vælgere i Danmark). Denne usikkerhed hænger blandt andet sammen med stikprøvens størrelse og hvilket konfidensniveau, man opererer med (normalt 95%). Jo større stikprøve, jo mindre statistisk usikkerhed. Den statistiske usikkerhed (konfidensintervallet) beregnes ved et konfidensniveau på 95% som
±1,96 √(p (100-p)/n)
hvor p er andelens størrelse og n er stikprøvens størrelse.
Du skal med brug af lommeregner fx på din PC eller ved anvendelse af Excel kunne beregne den statistiske usikkerhed og tolke på resultaterne heraf (man kan også bruge denne beregningsmodel i Excel - skal downloades).
Der konkluderes fx for partier, om frem- eller tilbagegangen i stikprøven er stor nok til, at vi kan være 95% sikre på, at der er frem- eller tilbagegang for partiet i blandt alle vælgere (populationen). Du kan desuden bruge udtryk som, at frem- eller tilbagegangen for et parti er signifikant eller ikke-signifikant.
Statistisk usikkerhed kan også bruges til at undersøge forskelle i en tabel med en baggrundsvariabels betydning for holdninger eller adfærd. Kan vi fx være 95 % sikre på, at der er forskel i populationen på holdninger hos mennesker med en kort og en lang uddannelse? Eller på forskel mellem valg af parti hos kvinder og mænd? Du skal kunne beregne statistisk usikkerhed for procentandele i en tabel og afgøre om forskellene er store nok til, at vi kan være 95 % sikre på, at der er forskel i populationen. Det kan også udtrykkes som, om der er signifikant forskel på holdningerne. I disse tilfælde vil n være lig med andelen af kvinder/mænd eller kort/lang uddannelse.
I eksemplet nedenfor er delmængden her antallet, der har stemt på hhv. Socialdemokratiet og Liberal Alliance. Og det kunne her være interessant at undersøge om forskellen mellem kvinder og mænds valgadfærd er statistisk signifikant for de to partiers vælgere.
I tabellen får vi at vide at 53,2 % (=p) af Socialdemokratiets vælgere var kvinder. Det er 6,4 procentpoint flere end andellen af mænd. Er det en statistisk signifikant forskel? Og vi får at vide at der var 530 (=n), der stemte på Socialdemokratiet. For at undersøge om der er statistisk signifikant forskel på andelen af mænd og kvinder kan man så indsætte værdierne i formlen og så om konfidensintervallet for andelen af kvinder overlapper med 50 %, hvis konfidensintervallet ikke overlapper de 50 % vil man kunne sige at kvinder med et signifikansniveau på 95 er mere end 50 % af socialdemokraternes vælgere.
Andre kilder til usikkerhed ved meningsmålinger kan være forbundet med repræsentativiteten af en given stikprøve, hvorvidt respondenter i meningsmålinger svarer oprigtigt og spørgsmålenes udformning.
Eksempel på figur der kan beregnes statistisk usikkerhed på:
I figuren ovenfor er angivet hvor stor procentvis andel, der ville stemme på de enkelte politiske partier. I dette tilfælde ved en meningsmåling d. 26. januar 2018 (søjlerne til venstre for hvert parti). Fx kunne det være relevant at undersøge om forskelle mellem partierne og mellem de enkelte partiers tilslutning sammenlignet med tilslutningen ved Folketingsvalget 2015 (højre søjle).
Fx har vi informationen om at 28,3 % (=p) af respondenterne i meningsmålingen ville stemme på Socialdemokratiet. Af hjemmesiden, hvor figuren er hentet fra, fremgår at der var 1762 respondenter (=n) i meningsmålingen. De to værdier kan nu indsættes i formlen ovenfor. Og på baggrund af det udregnes, der en usikkerhed på 2,1 procentpoint. Derfor er der 95 % sikkerhed for at Socialdemokratiet ville få mellem 30,4 % og 26,2 % af den samlede population (=valgberettigede danskere der ville deltage ved et Folketingsvalg). Dermed er resultatet som Socialdemokratiet fik ved Folketingsvalget 2015 (26,3 %) indenfor den statistiske usikkerhed. Hvis man beregnede Venstre og Dansk Folkepartis ville man komme frem til, at de to partiers konfidensintervaller overlapper meget. Og det derfor er usikkert hvilket parti, der reelt ville blive det største, hvis der var Folketingsvalg d. 26. januar 2018.