Betragt eksperimentet vist i figur 15.5.1.1 hvor et kast med 12 terninger har givet os fem 6'ere. At kaste 12 terninger på én gang kan betragtes som at kaste en terning 12 gange, fordi terningerne er uafhængige af hinanden. Eksperimentet kan derfor betragtes som et binomialfordelt stokastisk eksperiment med n = 12 og p = 1/6. Dermed viser figur 15.5.1.1 os langt flere 6’ere, end middelværdien giver os anledning til at forvente, idet middelværdien beregnes til
E(X) = n ∙ p = 12 ∙ 1/6 = 2
Med et sådan kast ville vi nok føle os heldige. Måske ville vi endda føle os så heldige, at vi ville blive i tvivl, om terningerne faktisk ikke var symmetriske. Altså om der var snydt med terningerne, så sandsynligheden for at få 6 øjne er større end 1/6.
Figur 15.5.1.1. Er der grund til at tro at der er snydt med terningerne?
Når man i matematik undersøger eller tester om der er snyd med i spillet, starter man med at opstille en såkaldt nulhypotese, som har symbolet H0. Man vælger en nulhypotese, som man kan sætte en sandsynlighed på. I dette tilfælde bliver vores nulhypotese, at terningen har en sandsynlighed på 1/6 for at vise 6 øjne. Det skrives kort
H0: p = 1/6
Hvis det viser sig, at vores nulhypotese ikke holder stik, skal vi have en alternativ hypotese at falde tilbage på. Den alternative hypotese har symbolet H1. Da vi fik fem 6’ere ud af 12 terninger, er vores alternative hypotese, at terningen har en sandsynlighed på mere end 1/6 for at vise 6 øjne. Det skrives kort
H1: p > 1/6
Da vi skal bruge vores hypoteser til at teste de fem succeser, kaldes tallet 5 for teststørrelsen.
For at afgøre om vi tror på H0 eller H1, skal vi have et matematisk objektivt kriterium, der kan afgøre valget for os. Kriteriet kaldes for et signifikansniveau. Normalt benyttes et signifikansniveau på 5%. Det betyder, at vi accepterer, at matematikken i højest 5% af tilfældene træffer det forkerte valg for os. Hvis matematikken i dette tilfælde fortæller os, at H0 er korrekt, kan vi altså være sikre på det med mindst 95% sikkerhed.
For at kunne arbejde videre med signifikansniveauet har vi brug for den kumulerede sandsynlighed. At kumulere sandsynligheder betyder at lægge sandsynligheder for udfald ved siden af hinanden sammen.
På figur 15.5.1.2 vises sandsynlighedsfordelingen for eksperimentet med de 12 terninger. I figurens tabel ser vi at P(X = 0) = 0,112 = 11,2% og at P(X = 1) = 0,269 = 26,9%. Den samlede sandsynlighed for at få nul 6’ere eller en 6’er fås ved at lægge de to sandsynligheder sammen (eller ved at kumulere sandsynlighederne). Det giver en sandsynlighed på 11,2% + 26,9% = 38,1%. Man skriver det kort
P(X ≤ 1) = P(X = 0) + P(X = 1) = 38,1%
Tilsvarende kan man beregne
P(X ≤ 2) = P(X = 0) + P(X = 1) + P(X = 2)
= 11,2% + 26,9% + 29,6% = 67,7%
I forhold til signifikansniveauet på 5% gælder det nu om at kumulere sandsynlighederne, indtil man lige netop når op over 95%. De resterende punktsandsynligheder vil herefter udgøre højest 5%, altså højest signifikansniveauet.
Figur 15.5.1.2. Sandsynlighedsfordelingen for eksperimentet med de 12 terninger.
Vi kumulerer videre, og får
P(X ≤ 3) = P(X = 0) + P(X = 1) + P(X = 2) + P(X = 3) = 87,5%
P(X ≤ 4) = P(X = 0) + P(X = 1) + P(X = 2) + P(X = 3) + P(X = 4) = 96,4%
Da vi med udfaldet på de 4 succeser når op over 95%, stopper vi med at kumulere sandsynligheder.
GeoGebra
I GeoGebras binomialfordelingsværktøj indtastet n = 12 og p = 1/6. Herefter trykkes på knappen med klammen, som peger mod venstre. Man kan nu enten indtaste forskellige tal i feltet nederst i vinduet og få beregnet den tilhørende kumulerede sandsynlighed. Eller man kan klikke og trække på felterne i tabellen til højre. På figur 15.5.1.3 ser man, at sandsynligheden for at få 4 eller et færre antal 6'ere med de 12 terninger er 96,36%.
Man kan også få GeoGebra til at beregne sandsynligheden for at få 5 eller et højere antal 6'ere med de 12 terninger. For at kumulere sandsynligheder for et antal succeser, der er højere end eller lig med et bestemt tal, trykker man på knappen med klammen, som peger mod højre, som figur 15.5.1.4 viser.
De to kumulerede sandsynligheder giver som forventet 100%
P(X ≤ 4) + P(X ≥ 5) = 96,36% + 3,64% = 100%
Figur 15.5.1.3. P(X ≤ 4) = 96,36%.
Figur 10.5.1.4. P(X ≥ 5) = 3,64%.
Excelark i WordMat
I WordMats Excelark indtaster man p = 1/6 og n = 12 på fanebladet [Binomialfordeling]. Herefter kan man indskrive 4 i celle E2 og i celle G2 få beregnet, at sandsynligheden for at få 4 eller et færre antal 6'ere er
P(X ≤ 4) = 96,36%
Ønsker man at få beregnet sandsynligheden for at få 5 eller et højere antal 6'ere, skal man indtaste 5 i celle E3 og 12 i celle G3, da det højeste antal mulige 6'ere i dette tilfælde er 12
P(X ≥ 5) = P(5 ≤ X ≤ 12) = 3,64%
Figur 15.5.1.5 viser indtastningerne i Excelarket.
Figur 15.5.1.5. P(X ≤ 4) = 96,36% og P(X ≥ 5) = 3,64%.
Når vi er færdige med at kumulere sandsynligheder, opdeler vi antallet af succeser i to mængder: Acceptmængden og den kritiske mængde. I forhold til eksemplet med de 12 terninger vil vi nu beskrive, hvordan vi skal forstå de to mængder.
Acceptmængden sættes til at udgøres af det antal succeser, som netop får den kumulerede sandsynlighed op på 95% (eller lige over 95%). I dette tilfælde består acceptmængden af følgende antal succeser
A = {0, 1, 2, 3, 4}
Acceptmængden angiver det antal 6’ere, som vi vil acceptere, at de 12 terninger med rimelighed kan vise, såfremt de er symmetriske. Hvis vi får et antal 6'ere fra denne mængde, accepterer vi altså at nulhypotesen er sand.
Den kritiske mængde sættes til at udgøres af det resterende antal succeser. I dette tilfælde består den kritiske mængde af følgende antal succeser
K = {5, 6, 7, 8, 9, 10, 11, 12}
Den kritiske mængde angiver det antal 6’ere, som er så usandsynligt, at vi bliver kritisk overfor vores nulhypotese. Hvis vi får et antal 6'ere fra denne mængde, forkaster vi vores nulhypotese og tror i stedet for på vores alternative hypotese.
I dette tilfælde er teststørrelsen 5, fordi kastet med de 12 terninger gav os fem 6'ere. Da teststørrelsen tilhører den kritiske mængde, forkaster vi vores nulhypotese og tror i stedet for på den alternative hypotese. Dvs. at vi tror, at sandsynligheden for at få 6 med terningerne er større end 1/6. Der må altså være snydt med terningerne.
Hypotesetest i GeoGebra
Vi opstiller en nulhypotese, der beskriver, at 4,7% af byttehandlerne giver en ender-perle.
H0: p = 4,7%
Da Dream byttede sig til ender-perler med en større sandsynlighed, vil det være vores alternative hypotese.
H1: p > 4,7%
I GeoGebra indtastes n = 262 og p = 0,047 og knappen med klammen, som peger mod højre, vælges. Vi leder nu efter det tal, som deler acceptmængden fra den kritiske mængde. Da vi benytter et signifikansniveau på 5%, indtastes 0,05 i feltet, hvor den beregnede kumulerede sandsynlighed skal stå. Det er vist på figur 15.5.1.6.
Som figur 15.5.1.7 viser, returnerer GeoGebra det antal succeser, hvor den kumulerede sandsynlighed er mindst 5%. I dette tilfælde fås 18, og vores indtastede 5% ændres til den kumulerede sandsynlighed, der svarer til
P(18 ≤ X) = 7,1%
Hvis vi vælger, at 18 skal være det sidste tal i acceptmængden, udgør acceptmængden kun 92,9%. Da acceptmængden skal indeholde mindst 95%, bliver vi nødt til at medtage tallet 19 i acceptmængden. Herved kommer den kritiske mængde til at indeholde 4,2%, som vist på figur 15.5.1.8, og acceptmængden derfor 95,8%.
Figur 15.5.1.6.
Figur 15.5.1.7.
Figur 15.5.1.8.
Vi har altså acceptmængden
A = {0, 1, 2, ..., 17, 18, 19}
og den kritiske mængde
K = {20, 21, 22, ..., 260, 261, 262}
Da teststørrelsen (Dreams antal succesfulde byttehandler på 42) ligger i den kritiske mængde, forkaster vi nulhypotesen til fordel for den alternative hypotese. Vi konkluderer, at sandsynligheden for at få en ender-perle i byttehandlerne har været større end 4,7%.
Hypotesetest vha. Excel i WordMat
Vi opstiller en nulhypotese, der beskriver, at 50% af Blaze-drabene giver en blaze-stang.
H0: p = 50%
Da Dream fik blaze-stænger med en større sandsynlighed, vil det være vores alternative hypotese.
H1: p > 50%
I WordMats Excelark indtaster man p = 0,50 og n = 305 på fanebladet [Binomialtest]. Desuden sikrer man sig, at signifikansniveauet er sat til 5%, og så sætter man et "x" i cellen ud for "højresidet test". Det er vist på figur 15.5.1.9.
Figur 10.5.1.9.
Excelarket returnerer to kritiske værdier k1 = -1 og k2 = 168. I tilfældet med et højresidet test skal vi bruge k2-værdien, som angiver, at den kritiske mængde starter ved 168.
Vi har altså acceptmængden
A = {0, 1, 2, ..., 165, 166, 167}
og den kritiske mængde
K = {168, 169, 170, ..., 303, 304, 305}
Da teststørrelsen (Dreams antal succesfulde drab på 211) ligger i den kritiske mængde, forkaster vi nulhypotesen til fordel for den alternative hypotese. Vi konkluderer, at sandsynligheden for at få en blaze-stang ved drab af en Blaze har været større end 50%.