Grafieken
In dit hoofdstuk komen verschillende lijngrafieken aan de orde. Let goed op de verschillen ertussen!!
Frequentiepolygoon met aparte getallen [punt tekenen boven getal]. Begint en eindigt op horizontale as (hier geen punt tekenen)
Frequentiepolygoon met klassen [punt tekenen boven klassemidden]. Begint en eindigt op horizontale as (hier geen punt tekenen)
Cumulatief frequentiepolygoon met klassen [punt tekenen boven de rechtergrens van iedere klasse] Begint op hor. as en eindigt bovenaan. Op hor as geen punt.
Boxplot
Met een boxplot kunnen we aangeven wat het maximum en minimum is van een dataset alsmede de mediaan (middelste getal van klein naar groot gerangschikt).
In de boxplot zien we behalve minimum, maximum en mediaan nog twee waarden, namelijk het eerste en derde kwartiel (eerste en derde kwart van alle waarden). De mediaan is feitelijk het tweede kwartiel
Hieronder zie je hoe uit een cumulatieve relatieve polygoon de boxplot wordt geconstrueerd.
Je begint telkens met de percentages op de verticale as.
Teken een (stippel)lijntje van het percentage horizontaal naar de polygoon. Bij het snijpunt ga je loodrecht naar beneden en lees je de bijbehorende waarde op de horizontale as af.
Dus bij 50% ga je vanaf het polygoon naar beneden en lees je de waarde van de mediaan af.
Galton bord (paragraaf 9.5)
In de vitrinekast zie je ook een Galton bord. Bovenin laat je balletjes rollen die bij ieder spijkertje/hindernis naar links of rechts vallen. uiteindelijk komen ze onderin en tref je aan het eind een verdeling aan, zoals in het boek weergegeven. Je kunt zelf uitrekenen (!!!) welk percentage in ieder bakje moet komen. Dat heb je in klas 4 geleerd bij combinatoriek (hfd 2). Je hebt achterin dit hoofdstuk geleerd te berekenen wat het aantal kortste wegen is naar ieder punt.
Stel dat er 10 keer "gekozen" moet worden tussen links of rechts, dan kun je zeggen dat de afgelegde weg lengte 10 heeft. Op hoeveel manieren kun je nu 3 keer links en 7 keer rechts gaan? Dit kan op combinatie_3 uit_10 (of 10 boven 3) = 120 manieren. Hoeveel kortste wegen van lengte 10 zijn er? Antw: 2^10 = 1024.
Dus volgens de kansdefinitief van Laplace is de kans op 3 keer links bij een weg met lengte 10, gelijk aan 120/1024= 0,117.
De verdeling die hier wordt weergegeven is de binomiale verdeling. Als het aantal balletjes erg groot is, benadert dit de normale verdeling.
Zie voor demonstraties op YouTube:
Normaal Waarschijnlijkheids Papier (NWP)
Hieronder vind je een pdf document met een uitwerking van opg 64.
Van de frequentietabel maak je eerst een cumulatieve relatieve frequentie tabel.
Dan teken je de punten op het NWP.
Op de horizontale as zet je de rechtergrenzen neer van klassen (in de getoonde grafiek staat 18 en eronder staat +0,5 omdat het hele getal teveel plaats zou innemen).
Op de verticale as is het percentage afgelezen, beginnend onderaan bij 0,01%.
Vervolgens is een rechte lijn getrokken die redelijk goed past bij alle punten.
Merk op dat het laatste punt met 100% niet gebruikt is.
Door vanaf de rechter kantlijn bij 50% een horizontale lijn naar de rechte lijn te trekken, vinden we het punt waar een cumulatief percentage van 50% bij hoort. Lees nu op de horizontale as af welke waarde daarbij hoort. (in de grafiek weergegeven met een verticale lijn naar beneden).
De standaardafwijking kun je afschatten door te kijken wat de afstand op de horizontale as is tussen de punten met 50% en 85% cumulatief. Uiterard kun je ook kijken tussen 16% en 50% of tussen 2,5% en 50% en het resultaat door 2 delen (nu zitten er immers 2 standaardafwijkingen tussen)
Het beste is om te meten tussen 2,5% en 97,5% en het resultaat te delen door 4; want nu zitten er 4 standaardafwijkingen tussen.
Waarom is het laatste geval het nauwkeurigst?
Eenvoudig, je meet in alle gevallen waarden die horen bij dezelfde rechte lijn. De horizontale afstand is in het laatste geval het grootst, zodat een eventuele afleesfout (nauwkeurigheid) hier door 4 gedeeld wordt en daarmee dus kleiner is.
Een Galton bord kun je zelf ook maken. Door de spijkertjes te vervangen door bijvoorbeeld driehoekjes kun je spelen met de kansen. Door de punt van de driehoek te draaien veranderen de kansen. Als de doorgang 1 cm is en door de driehoek te draaien verandert dit van 0,5+0,5 in 0,4+0,6 dan is de kans dat het balletje naar links valt 0,4 en de kans dat het balletje naar rechts valt wordt 0,6.
Hiernaast zie je een Galton bord. De groene rondjes stellen de spijkertjes voor. De kans is 0,5 dat het balletje naar links gaat en dus ook 0,5 dat hij naar rechts gaat. Door voldoende balletjes door dit circuit te laten rollen krijg je een verdeling: de binomiale verdeling. Voor grote aantallen lijkt deze echter op de normale verdeling.
Zoals je ziet is er een afwijking van een rechte lijn; de getekende punten liggen er links of rechts iets naast. Afhankelijk van de grootte van de dataset zou je kunnen beslissen dat deze punten toevallige afwijkingen hebben en dat dus aangenomen mag worden dat de dataset uit een normaal verdeeld populatie komt.
Hiernaast staat een plot op Normaal Waarschijnlijkheids Papier.
Op de lange zijde staan hier de percentages en de waarden op de verticale as.