En stokastisk variabel er en variabel, der angiver udfaldet af et stokastisk eksperiment. Et stokastisk eksperiment er et eksperiment, hvor vi på forhånd kender de mulige udfald. Oftest angives en stokastisk variabel med X, men man ser også andre bogstaver anvendt f.eks. Y og Z.
For at få et overblik over resultatet af et stokastisk eksperiment opstiller man en tabel over udfaldene for den stokastiske variabel. Vi illustrerer en stokastisk variabel vha. eksempler.
Eksempel 13 - Summen af to terninger
Hvis man kaster to symmetriske 6-sidet terninger og lader den stokastiske variabel X angive summen af øjentallene, kan man få overblik over udfaldene vha. tabellen vist i figur 9.7.1
X: Summen af øjentallene på terning 1 og terning 2.
Vha. figur 9.7.1 kan vi bestemme hyppigheden af de enkelte udfald. F.eks. forekommer udfaldet "Summen af øjentallene på terning 1 og terning 2 er lig med 5" fire gange. Dvs. hyp(X = 5) = 4.
Figur 9.7.1a. To terninger kastes. Den stokastiske variabel X angiver summen af øjentallene.
Figur 9.7.1b. De gule felter angiver de mulige udfald for den stokastiske variabel X.
En hyppighedstabel over den stokastiske variabels udfald er vist i figur 9.7.2. Når vi kender udfaldenes hyppighed, kan vi beregne sandsynligheden for de enkelte udfald vha. sandsynlighedsformlen:
P( X = 5 ) = "Antal gunstige udfald" / "Antal mulige udfald" = 4 / 36 = 1 / 9
De beregnede sandsynligheder er også vist i figur 9.7.2. Oversigten over de enkelte udfalds sandsynlighed kalder vi for sandsynlighedsfordelingen for den stokastiske variabel X. Læg i øvrigt mærke til at summen af alle sandsynlighederne giver 36 / 36 = 1, som jo skal gælde for et sandsynlighedsfelt.
Figur 9.7.2. Sandsynlighedsfordelingen for X repræsenteret ved en tabel.
Man kan lave en grafisk repræsentation af sandsynlighedsfordelingen vha. et søjlediagram på præcis samme måde, som da vi lavede et søjlediagram over ugrupperede observationer i afsnit 6.2. På figur 9.7.3 ser vi sandsynlighedsfordelingen for X vha. et søjlediagram. Jo højere søjlen er, jo mere sandsynligt er udfaldet.
Vi har bestemt sandsynlighedsfordelingen i dette eksempel vha. objektive sandsynligheder. I stedet for at lægge teoretiske overvejelser til grund for sandsynlighedsfordelingen kunne man have valgt at kaste de to terninger mange gange og anvende frekventielle sandsynligheder.
Figur 9.7.3. Sandsynlighedsfordelingen for X repræsenteret ved en graf.
Middelværdien for en stokastisk variabel beregnes stort set på samme måde som middelværdien for et observationssæt, når denne beregnes vha. frekvensen. Ved en stokastisk ganger man bare det enkelte udfald med udfaldets sandsynlighed i stedet for med frekvensen.
Som symbol for middelværdien af den stokastiske variabel X bruges E(X).
Middelværdien for en stokastisk variabel beregnes med formlen i figur 9.7.4.
Figur 9.7.4. Middelværdiformlen for stokastisk variabel.
Eksempel 14 - Middelværdien af to terningers sum
Vha. formlen i figur 9.7.4 beregnes middelværdien for X fra eksempel 13. For hvert udfald ganges udfaldets værdi med udfaldets sandsynlighed. Herefter lægges alle beregningerne sammen
E(X) = 2 ∙ P( X = 2) + 3 ∙ P( X = 3) + 4 ∙ P( X = 4) + ... + 12 ∙ P( X = 12)
E(X) = 2 ∙ 1/36 + 3 ∙ 2/36 + 4 ∙ 3/36 + ... + 12 ∙ 1/36
E(X) = 7
Vi har beregnet, at middelværdien for to terningers sum er 7, hvilket også er det vi forventer, idet "7" er det oftest forekommende udfald (typetallet) for to terningers sum. Det kan ses på figur 9.7.3, idet udfaldet "7" har den højest søjle. Grunden til symbolet E(X) ligger i denne forventning, idet E'et kommer fra det engelske "expected".
Bemærk dog at det langt fra altid gælder, at middelværdien er lig med typetallet - altså det vi forventer.
Variansen for en stokastisk variabel beregnes stort set på samme måde som variansen af et ugrupperet observationssæt, man benytter dog sandsynlighederne for de enkelte udfald i stedet for frekvenserne for de enkelte observationer.
Variansen for en stokastisk variabel beregnes med formlen i figur 9.7.5.
Figur 9.7.5. Variansformlen for stokastisk variabel.
Eksempel 15 - Variansen af to terningers sum
Vha. formlen i figur 9.7.5 beregnes variansen for X fra eksempel 13. For hvert udfald trækkes middelværdien fra udfaldets, som herefter kvadreres. Så ganges der med udfaldets sandsynlighed, og til sidst lægges alle beregningerne sammen.
Var(X) = (x1 - E(X))2 ∙ P( X = x1 ) + (x2 - E(X))2 ∙ P( X = x2 ) + ... + (x12 - E(X))2 ∙ P( X = x12 )
Var(X) = (2 - 7)2 ∙ 1/36 + (3 - 7)2 ∙ 2/36 + (4 - 7)2 ∙ 3/36 + (5 - 7)2 ∙ 4/36 + (6 - 7)2 ∙ 5/36 + (7 - 7)2 ∙ 6/36
+ (8 - 7)2 ∙ 5/36 + (9 - 7)2 ∙ 4/36 + (10 - 7)2 ∙ 3/36 + (11 - 7)2 ∙ 2/36 + (12 - 7)2 ∙ 1/36
Var(X) = 6,2286
Spredningen af en stokastisk variabel beregnes på sammen måde som spredningen af et observationssæt i afsnit 6.2.4. Man bestemmer variansen og beregner derefter kvadratroden af den.
Spredningen for en stokastisk variabel beregnes med formlen i figur 9.7.6.
Figur 9.7.6. Spredningsformlen for stokastisk variabel.
Eksempel 16 - Spredning af to terningers sum
Vha. formlen i figur 9.7.6 beregnes spredningen for X fra eksempel 13.
σ(X) = √(Var(X)) = √(6,2286) = 2,45
Man bruger spredningen til at angive om et udfald er normalt eller exceptionelt i forhold til følgende definition.
Et udfald kaldes normalt hvis den ligger op til to spredninger fra middelværdien
xi er normal hvis E(X) - 2σ < xi < E(X) + 2σ
Et udfald kaldes exceptionelt hvis den ligger mere end tre spredninger fra middelværdien
xi er exceptionel hvis xi < E(X) - 3σ eller xi > E(X) + 3σ
Eksempel 17
For at undersøge hvilke udfald der er normale i eksempel 13, beregnes
E(X) - 2σ = 7 - 2 ∙ 2,45 = 2,1
E(X) + 2σ = 7 + 2 ∙ 2,45 = 11,9
Næsten alle udfald er normale. Udfaldene "2" og "12" er lige netop ikke normale.