Binomialfordelingen er en matematisk model, der beskriver en situation, hvor en stokastisk variabel kan have to udfald.
En stokastisk variabel er en variabel, der kun kan antage bestemte diskrete værdier. Den stokastiske variabel kunne f.eks. være ”Øjentallet på en terning”. Her er udfaldsrummet, dvs. de diskrete værdier som den stokastiske variabel kan antage:
U = {1, 2, 3, 4, 5, 6}.
En binomialfordelt stokastisk variabel kunne f.eks. være ”Er øjentallet på terningen 6?”. Her er udfaldsrummet:
U = {ja, nej}.
Udfaldsrum som {ja, nej} er kendetegnet for en binomialfordelt stokastisk variabel. Ofte angiver man også udfaldsrummet som
U = {succes, fiasko}.
I Dreams speedrun indgår der to forskellige binomialfordelte stokastiske variable.
Den ene er ”Der fås en ender-perle”, som har udfaldet {succes, fiasko}.
Den anden er ”Der fås en blaze-stang”, som også har udfaldet {succes, fiasko}.
Man kan opstille en sandsynlighedsfordeling i binomialfordelingen, dvs. en oversigt over hvor sandsynligt det er at få et vist antal succeser i et givet antal forsøg, når man kender sandsynligheden for at få succes i et enkelt forsøg. Det enkelte forsøg kalder man for basisforsøget eller basiseksperimentet.
Antallet af forsøg kalder man for antalsparameteren, hvortil man bruger symbolet n. Sandsynligheden for at få succes i basisforsøget kalder man for sandsynlighedsparameteren, hvortil man bruger symbolet p.
Som eksempel vil vi regne på den binomialfordelt stokastisk variabel X, hvor
” X angiver antallet af gange øjentallet på en terning viser 6 ”
Sandsynligheden for at få en 6’er i et kast er 1/6. Derfor er sandsynlighedsparameteren p = 1/6.
De efterfølgende beregninger afhænger af antallet af gange terningen kastes. Vi kigger på 1 til 3 kast.
Vi betragter først et enkelt kast med terningen, dvs. at antalsparameteren n = 1. Vi kan nu stille spørgsmålet:
” Hvad er sandsynligheden for at få nul 6’er? ”
som også kan formuleres
” Hvad er sandsynligheden for en fiasko? ”
Vi skriver det kort som P(X = 0). P står for sandsynligheden (probability). (X = 0) står for, at den stokastiske variabel X skal vise nul 6'ere.
Sandsynligheden beregnes med formel (177) i formelsamlingen
Sandsynlighed = (antal gunstige udfald) / (antal mulige udfald)
Da udfaldsrummet er U = {1, 2, 3, 4, 5, 6} er
P(X = 0) = 5/6 = 0,833 = 83,3%.
Der er altså en sandsynlighed på 83,3% for at få fiasko.
Vi kan også stille spørgsmålet
” Hvad er sandsynligheden for at få en 6’er? ”
som også kan formuleres
” Hvad er sandsynligheden for en succes? ”
Vi skriver det kort som P(X = 1).
Sandsynligheden beregnes med samme formel som før.
P(X = 1) = 1/6 = 0,167 = 16,7%
Der er altså en sandsynlighed på 16,7% for at få succes.
Den samlede sandsynlighed for enten at få fiasko eller succes, når terningen kastes en gang, er
P(X = 0) + P(X = 1) = 83,3% + 16,7% = 100%
Vi betragter nu to kast med terningen, dvs. at antalsparameteren n = 2. Vi stiller spørgsmålet:
” Hvad er sandsynligheden for at få nul 6’ere? ”
dvs.
” Hvad er sandsynligheden for to fiaskoer? ”
Da de to kast med terningen er uafhængige, beregnes sandsynligheden for to fiaskoer som produktet mellem sandsynligheden for en fiasko og sandsynligheden for endnu en fiasko. Formel (178) i formelsamlingen
P(X = 0) = P(fiasko) ∙ P(fiasko) = 5/6 ∙ 5/6 = (5/6)2 = 0,694 = 69,4%
Vi stiller nu spørgsmålet:
” Hvad er sandsynligheden for at få to 6’ere? ”
dvs.
” Hvad er sandsynligheden for to succeser? ”
På samme måde som før er de to kast med terningen uafhængige. Sandsynligheden for to succeser er derfor
P(X = 2) = P(succes) ∙ P(succes) = 1/6 ∙ 1/6 = (1/6)2 = 0,028 = 2,8%
Vi kan også stille spørgsmålet
” Hvad er sandsynligheden for at få en 6’er og en ikke-6’er? ”
dvs.
” Hvad er sandsynligheden for en succes og en fiasko? ”
Da dette spørgsmål opfyldes, hvis 6'eren kommer i det første kast og ikke i det andet kast eller omvendt, og da første og andet kast er uafhængige, kan vi bruge additionsprincippet til svaret. Sandsynligheden for en succes findes derfor med formel (179) i formelsamlingen
P(X = 1) = P(succes) ∙ P(fiasko) + P(fiasko) ∙ P(succes) = 1/6 ∙ 5/6 + 5/6 ∙ 1/6 = 0,278 = 27,8%
Bemærk. Senere bliver det en fordel hvis vi opskriver beregningen, hvor leddene er trukket sammen
P(X = 1) = 1/6 ∙ 5/6 + 1/6 ∙ 5/6 = 2 ∙ 1/6 ∙ 5/6
Den samlede sandsynlighed, når terningen kastes to gange, er
P(X = 0) + P(X = 1) + P(X = 2) = 69,4% + 2,8% + 27,8% = 100%
Vi betragter nu tre kast med terningen, dvs. at antalsparameteren n = 3. Vi beregner sandsynlighederne, der hører til de forskellige spørgsmål, vi kan stille med hensyn til antallet af succeser:
P(X = 0) = P(fiasko) ∙ P(fiasko) ∙ P(fiasko) = 5/6 ∙ 5/6 ∙ 5/6 = (5/6)3 = 0,579 = 57,9%
P(X = 1) = P(succes i første kast) + P(succes i andet kast) + P(succes i tredje kast)
= P(succes) ∙ P(fiasko) ∙ P(fiasko)
+ P(fiasko) ∙ P(succes) ∙ P(fiasko)
+ P(fiasko) ∙ P(fiasko) ∙ P(succes)
= 3 ∙ 1/6 ∙ 5/6 ∙ 5/6 = 3 ∙ 1/6 ∙ (5/6)2 = 0,347 = 34,7%
P(X = 2) = P(succes i 1. og 2. kast) + P(succes i 1. og 3.kast) + P(succes i 2. og 3. kast)
= P(succes) ∙ P(succes) ∙ P(fiasko)
+ P(succes) ∙ P(fiasko) ∙ P(succes)
+ P(fiasko) ∙ P(succes) ∙ P(succes)
= 3 ∙ 1/6 ∙ 1/6 ∙ 5/6 = 3 ∙ (1/6)2 ∙ 5/6 = 0,069 = 6,9%
P(X = 3) = P(succes) ∙ P(succes) ∙ P(succes) = 1/6 ∙ 1/6 ∙ 1/6 = (1/6)3 = 0,005 = 0,5%
Den samlede sandsynlighed, når terningen kastes tre gange, er
P(X = 0) + P(X = 1) + P(X = 2) + P(X = 3) = 57,9% + 34,7% + 6,9% + 0,5% = 100%
Figur 15.2.1 viser en tabel over de beregnede sandsynligheder, som vi kalder for punktsandsynligheder.
Hvis vi øger antallet af kast, bliver beregningerne af de tilhørende punktsandsynligheder flere og mere uoverskuelige. For at gøre beregningerne mere overskuelige generaliserer vi de hidtidige beregninger til en formel.
Figur 15.2.1. Punktsandsynligheder for binomialfordeling med p = 1/6 og n = 1, 2, 3.
I sandsynlighedsberegningerne ovenfor ganges der med 1/6 og med 5/6 det antal gange, hvor der hhv. er succes og fiasko. Hvis vi bruger r som symbol for antallet af succeser, kan denne del af beregningerne generalisere med udtrykket
(1/6)r ∙ (5/6)n-r
Hvor der er nul succeser, dvs. r = 0 bliver udtrykket til
(1/6)0 ∙ (5/6)n-0 = 1 ∙ (5/6)n = (5/6)n
hvilket passer med alle P(X = 0)-beregningerne ovenfor.
Hvor der er lige så mange succeser som kast, dvs. r = n bliver udtrykket til
(1/6)n ∙ (5/6)r-r = (1/6)n ∙ (5/6)0 = (1/6)n ∙ 1 = (1/6)n
hvilket passer med alle P(X = n)-beregningerne ovenfor.
I nogle af sandsynlighedsberegningerne ganges der yderligere med et tal. Vi kan få alle beregninger til at indeholde et tal, hvis vi bare ganger med 1, hvor tallet mangler. Det viser sig, at 1-tallet kommer til at stå der, hvor man beregner sandsynligheden for kun at få fiaskoer P(X = 0) eller kun at få succeser P(X = n). 1-tallet svarer til, at det kun på 1 måde kan lade sig gøre, at alle kast bliver fiaskoer, eller at alle kast bliver succeser.
Tilsvarende ganges der med 2 ved P(X = 1) når n = 2, fordi man på 2 måder kan få en fiasko og en succes. Der ganges med 3 ved P(X = 1) når n = 3, fordi man på 3 måder kan få to fiaskoer og en succes. Der ganges med 3 ved P(X = 2) når n = 3, fordi man på 3 måder kan få en fiasko og to succeser.
Bemærk at der ikke ganges med hhv. 2 og 3 fordi n = 2 hhv. n = 3. Det kan man se, hvis man betragter situationen med fire kast, n = 4, og beregner sandsynligheden for at få to succeser P(X = 2).
P(X = 2)
= P(succes) ∙ P(succes) ∙ P(fiasko) ∙ P(fiasko)
+ P(succes) ∙ P(fiasko) ∙ P(succes) ∙ P(fiasko)
+ P(succes) ∙ P(fiasko) ∙ P(fiasko) ∙ P(succes)
+ P(fiasko) ∙ P(succes) ∙ P(succes) ∙ P(fiasko)
+ P(fiasko) ∙ P(succes) ∙ P(fiasko) ∙ P(succes)
+ P(fiasko) ∙ P(fiasko) ∙ P(succes) ∙ P(succes)
I denne situation er der altså 6 måder, hvorpå man kan få to succeser og fiaskoer.
Ovenstående beregninger af sandsynligheder i binomialfordelingen kan generaliseres til binomialformlen.
For en binomialfordelt stokastisk variabel med antalsparameter n og sandsynlighedsparameter p, skrevet på kort form som X ~ bi(n,p), kan punktsandsynlighederne, hvor r er antal succeser, beregnes som
P(X = r) = K(n,r) ∙ pr ∙ (1 - p)n-r
I formlen er K(n,r) kombinationsformlen (også kaldt binomialkoefficienten) som blev præsenteret i kapitel 9.5. Ved hjælp af denne faktor tager formlen højde for antallet af måder, hvorpå et bestemt antal succeser kan fremkomme.
Bemærk i øvrigt at "sandsynligheden for at få fiasko i et enkelt kast" er skrevet som "1 minus sandsynligheden for succes i et enkelt kast", som også er "1 minus sandsynlighedsparameteren". Denne sammenhæng gælder, fordi vi jo betragter en stokastisk variabel med kun to udfald.
P(fiasko) = 1 - P(succes) = 1 - p