Det er en krydstabel med to variabler henholdsvis i forspalten (venstre side) og hovedspalten (for oven) - se forsiden til matematik-delen for vejledning i tabellæsning.
kommenter på krydstabellens variabler og den formodede årsagssammenhæng (evt. ved inddragelse af faglige viden)
kommenter på tendensen i data i tabellen og hav konkrete nedslag i tabellen
kommenter på nul-hypotese og alternativ hypotese
kommenter på p-værdien - husk signifikansniveau
dissse forskellige elementer giver en samlet vurdering af hvad der kan udledes af chi2-testen. Husk at en lav p-værdi ikke er det samme som kausalitet/årsagssammenhæng.
Testen leverer et resultatet som kaldes p og som betyder sandsynlighed. P er et mål for nulhypotesens troværdighed. Værdien er sandsynligheden for, at få en χ2 -værdi som er mindst lige så ekstrem som den observerede, hvis H0 er sand.
For at kunne forkaste nulhypotesen skal sandsynligheden p, normalt være mindre end 0,05 (5% signifikansniveau) – altså mindre end 5 %.
Hvis p = 0,5823 i et eksempel hvor nulhypotesen (H0) er: ”Der er ingen forskel på mænd og kvinders lyst til at shoppe for fornøjelsens skyld” (se eksempel nedenfor). Så er sandsynligheden så stor, at det er meget troværdigt at holdningen til skat ikke hænger sammen med køn (og at man derfor ikke kan forkaste nulhypotesen). I en test hvor p-værdien er mindre end 0,05, fx for sammenhængen mellem køn og partivalg, skriver man sammenhængen mellem køn og partivalg er signifikant med et signifikantniveau på 0.05. Hvis det var under 0,01 så kan man sætte signifikantniveauet på 0,01. Påstanden om at der ikke er nogen sammenhæng (nulhypotesen) er derfor meget utroværdig. Eller skrevet på en anden måde:
Hvis p-værdien er mindre end 0,05 siges sammenhængen at være signifikant på et 5%-signifikans-niveau, hvilket vil sige at der er mindre end 5%’s sandsynlighed for at sammenhængen skyldes en statistisk tilfældighed. Sammenhængen er altså meget sikker.
Hvis p-værdien er mindre end 0,01 siges sammenhængen at være signifikant på et 1%-signifikans-niveau, hvilket vil sige at der er mindre end 1%’s sandsynligheden for at sammenhængen skyldes en statistisk tilfældighed. Her er sikkerheden for at samvariationen ikke blot skyldes en statistisk tilfældighed altså endnu bedre. Jo mindre p-værdi, jo større statistisk sikkerhed, jo mere signifikant sammenhæng mellem to variable.
Hvis du finder en p-værdi der forkaster nulhypotesen har du vist at der sandsynligvis er en forskel mellem de to grupper. Husk at falsifikationstesten har hverken bevist eller verificeret at der er forskel, men man kan nu opfatte det som mere sandsynligt end før testen. Efterfølgende skal man så tilbage til tabellen over de observerede værdier og forsøge at konkludere, hvilken forskel det er.
A) Der er en hypotese om en sammenhæng og en hypotese for det modsatte (nulhypotese)
B) Jo større forskel mellem observeret værdi og forventet værdi, jo større χ2 og dermed jo lavere p-værdi og dermed lavere troværdighed for nulhypotesen, hvilket gør det nemmere at retfærdiggøre at vi vælger at betragte sammenhængen som signifikant
Hvis p < 0.05 forkastes nulhypotesen på signifikansniveauet 0.05, dvs. 5%.
Hvis p < 0.01 forkastes nulhypotesen på signifikansniveauet 0.01, dvs. 1%
Tabellen til højre her er en krydstabel med køn i forspalten og svarkategori på spørgsmålet "Hvor ofte shopper du for fornøjelsens skyld?" i hovedspalten. Der er foretaget en udregning af rækkeprocent, så man kan få et overblik af fordelingen af svarene for hhv. mænd og kvinder Giver det mening at teste for afhængighed mellem hvilket køn man har og hvorvidt man shopper for "fornøjelsens skyld"? Ja man kunne forestille sig, at der er nogle forskelle i shopping-mønstre mellem mænd og kvinder. Vi har dog ikke sociologisk teori (indenfor almindeligt pensum), der nærmer beskriver sådanne forskelle mellem mænd og kvinder. Og må derfor nøjes med vores almindelige sunde fornuft.