Centrummaten en spreidingsmaten

Nu ken je verschillende wijzen om gegevens voor te stellen. Deze zijn handig om je gegevens overzichtelijk te maken, zodat je er conclusies uit kan trekken.

Soms is dit echter niet genoeg en wil je meer maten om de verdeling van je gegevens te bekijken. Hiervoor gebruik je centrummaten en spreidingsmaten, zoals het gemiddelde, de mediaan, de modus en de variatiebreedte. Met deze gegevens kan je kijken waar het midden van je reeks ongeveer ligt en hoe breed je reeks is.

In dit deel leer je hoe je het rekenkundig gemiddelde, de mediaan, de modus en de variatiebreedte berekent. Je ziet waar je ze moet gebruiken en wanneer welke maat minder nuttig is.

CENTRUMMATEN: HET REKENKUNDIG GEMIDDELDE

Je hebt waarschijnlijk al wel eens gehoord van "het gemiddelde". Er bestaat een grote kans dat je het zelf al eens gebruikt hebt. In de statistiek is dit ook een veelvoorkomend gegeven. Het gemiddelde gebruik je om een overzicht te krijgen van je gegevens, vaak probeert men zo te zien wat "normaal" is.

Je berekent het gemiddelde van een reeks getallen door al die getallen bij elkaar op te tellen en de som te delen door het aantal getallen. De regel is dat je het gemiddelde op één cijfer na de komma meer afrondt, dan de oorspronkelijke waarden.

Het gemiddelde noemen we een centrummaat, omdat het een schatting is naar het centrum van een hoeveelheid gegevens.


Bijvoorbeeld: Wat is het gemiddelde van de volgende getallen: 5, 7, 18, 6, 9?

Antwoord: 5 + 7 + 18 + 6 + 9 = 45. Je hebt 5 getallen, dus je gemiddelde is 45 / 5 = 9,0 of gewoon 9.

Wanneer je werkt met numerieke gegevens, kan je een gemiddelde berekenen. In deze tabel staan de resultaten van mijn onderzoek naar het aantal kinderen - zonen of dochters - dat elke leerkracht op mijn school heeft.

Het gemiddelde van deze reeks berekenen doe je door het aantal kinderen in elke rij te vermenigvuldigen met het aantal leerkrachten dat dit aantal kinderen heeft. Hiervan neem je weer de som, en dit deel je door het totaal aantal leerkrachten. Dus:

  • Er zijn twee leerkrachten zonder kinderen: 0 . 2.

  • Er zijn drie leerkrachten met één kind: 1 . 3.

  • Er zijn vijf leerkrachten met twee kinderen: 2 . 5.

  • Er zijn geen leerkrachten met drie kinderen: 0 . 3.

  • Er is één leerkracht met vier kinderen: 4 . 1.

Het gemiddelde is: (0 . 2 + 1 . 3 + 2 . 5 + 3 . 0 + 4 . 1) / 11 = 1,5.

In gevallen zoals dit is het natuurlijk niet logisch om te zeggen "De gemiddelde leerkracht in mijn school heeft anderhalf kind.". Daarom rond je dit af, waardoor je kan besluiten: "De gemiddelde leerkracht in mijn school heeft twee kinderen.".


Wanneer je werkt met categorische gegevens kan je geen gemiddelde berekenen. In de tabel hiernaast is het bijvoorbeeld niet mogelijk om te gaan kijken wat het gemiddeld favoriete stuk fruit is.

Ook bij RAL-kleuren kan je geen gemiddelde bepalen.


Opdracht 1: In de tabel staat hoe lang iedere speler van de eerste ploeg van basketclub "B.C. de Besten" vorige match heeft gespeeld. Bereken de gemiddelde speeltijd in minuten (rond af).

Antwoord: Er zijn dertien spelers; het is belangrijk om de eerste niet te vergeten, ook al heeft zij niet op het veld gestaan deze match!

Je gemiddelde bereken je met de volgende bewerking:

(0 + 12 + 12 + 10 + 15 30 + 32 + 16
+ 18 + 20 + 11 + 6 + 24) / 13 = 15,8.

Je moet nog wel afronden naar minuten, dus de gemiddelde speeltijd is 16 minuten.



Bij extreme maten kan het gemiddelde soms een vertekend beeld geven.

Bijvoorbeeld: Wat is het gemiddelde van 5, 4, 3, 6 en 1003?

Antwoord: Het rekenkundig gemiddelde is 204,2. Dit getal ligt echter heel ver van elk gegeven uit de reeks en is dus niet echt bruikbaar.

Wanneer je een reeks gegevens hebt met extremen - uitschieters, getallen die veel groter of kleiner zijn dan de meeste getallen uit je reeks - is het vaak nuttig om niet naar het gemiddelde te kijken, maar naar de mediaan.

CENTRUMMATEN: DE MEDIAAN

De mediaan is, vrij letterlijk, het centrum of het midden van een reeks geordende getallen. Hierdoor wordt het minder beïnvloed door extreme waarden. Het is een alternatief voor het gemiddelde

Je bepaalt de mediaan door je gegevens van klein naar groot te rangschikken en dan het middelste getal te bepalen, bij een oneven aantal gegevens. Bij een even aantal getallen, neem je het rekenkundig gemiddelde van de twee middelste getallen.


Bijvoorbeeld: Wat is de mediaan van de volgende reeks getallen: 5, 7, 18, 6, 9?

Antwoord: Eerst moeten we de reeks ordenen, van klein naar groot. We krijgen dan 5, 6, 7, 9, 18.

Dan nemen we het middelste getal van de reeks, 7. Dit is de mediaan. Er liggen even veel getallen voor, als na de mediaan.

Bijvoorbeeld: Wat is de mediaan van de volgende reeks getallen: 5, 7, 18, 6, 9, 15

Antwoord: Eerst moeten we de reeks weer ordenen van groot naar klein. Zo krijgen we 5, 6, 7, 9, 15, 18.

De getallen 7 en 9 zijn de twee middelste getallen. De mediaan is dan (7 + 9) / 2 = 8.

In een frequentietabel heb je (minstens) twee kolommen: één met je gegevens, en één waarin staat hoe vaak die gegevens voorkomen. Om de mediaan van een frequentietabel te bepalen, moet je dus elk gegeven in de rangschikking zetten. Het aantal keer dat dit gegeven in de rangschikking staat, is gelijk aan de frequentie van dat gegeven.

Bijvoorbeeld: Ik vraag aan mijn vrienden hoe veel broers en/of zussen ze hebben. Twee vrienden hebben één broer of zus en drie vrienden hebben er twee.

Als ik dit in een reeks wil zetten, moet ik dus kijken hoe vaak elk gegeven voorkomt. "Geen broers of zussen" komt niet voor, dus "0" moet niet in mijn reeks staan. Twee van mijn vrienden hebben één broer of zus, dus ik moet "1" twee keer in mijn reeks zetten: 1 - 1.

Drie van mijn vrienden hebben twee broers en/of zussen. "2" moet dus drie keer in mijn reeks komen: 2 - 2 - 2.

Mijn reeks wordt dan: 1 - 1 - 2 - 2 - 2. Wat is de mediaan dan van mijn reeks?

Antwoord: De reeks is al geordend van klein naar groot. Het middelste getal is 2. Dit is de mediaan

Opdracht 2: Wat is de mediaan in deze reeks?

Antwoord: Net zoals hierboven, moet je elk gegeven een aantal keer in de reeks zetten, gelijk aan zijn frequentie.

Dan krijg je:

  • Twee leerkrachten zonder kinderen: 0 - 0.

  • Drie leerkrachten met één kind: 1 - 1 - 1.

  • Vijf leerkrachten met twee kinderen: 2 - 2 - 2 - 2 - 2.

  • Geen leerkracht met drie kinderen: ...

  • Een leerkracht met vier kinderen (misschien wel een vierling!): 4.

Als je dit samen zet in een geordende reeks, krijg je:

0 - 0 - 1 - 1 - 1 - 2 - 2 - 2 - 2 - 2 - 4

2 is het middelste getal in de geordende reeks en dus de mediaan.


Opdracht 3: Bereken de mediaan van de speeltijden, in minuten (rond af), die de spelers van B.C. de Besten vorige match hebben gespeeld.

Antwoord: Je moet de reeks eerst ordenen van klein naar groot (of van groot naar klein). Je krijgt dan de volgende reeks:

0 - 6 - 10 - 11 - 12 - 12 - 15 - 16 - 18 - 20 - 24 - 30 - 32

Er zijn dertien spelers, dus de mediaan is het zevende getal. De mediaan is dus 15 minuten.


Soms wil je meer maten gebruiken voor je een conclusie stelt. Naast het rekenkundig gemiddelde en de mediaan, kan je ook nog de modus van een reeks bepalen.

CENTRUMMATEN: DE MODUS

Naast de mediaan is er nog een maat die niet zo hard wordt beïnvloed door extreme waarden: de modus.

Bij de modus ga je kijken welke waarde het meeste voorkomt. Hier heb je dus wel een frequentietabel nodig.


Bijvoorbeeld: Je ouders geven je €10 zakgeld. Jij wil meer en hebt een onderzoek uitgevoerd: je hebt aan al je vrienden gaan vragen hoe veel zakgeld zij krijgen.

Uit je onderzoek blijkt de volgende reeks:

0 - 0 - 0 - 0 - 0 - 5 - 5 - 5 - 5 - 10 - 20 - 20 - 20 - 20 - 20 - 20 - 20

Bereken het gemiddelde, de mediaan en de modus van deze reeks. Welke maat kan je best gebruiken als je je ouders wil overtuigen om je zakgeld te verhogen?

Antwoord:

Het gemiddelde is 10. Dat kan je dus niet gebruiken, want je hebt al €10 zakgeld.

De mediaan is 5. Nog erger, want daarmee hebben je ouders een excuus om je zakgeld te verlagen!

De modus is 20, want dit is het getal dat het meeste voorkomt bij je vrienden. Je kan dus naar je ouders gaan en zeggen "Als ik naar het zakgeld van mijn vrienden kijk, komt €20 het meeste voor. Daarom wil ik dus ook meer zakgeld krijgen!". Als dat niet werkt, dan weet ik het ook niet meer...

Opdracht 4: Wat is de modus in deze reeks?

Antwoord: Leerkrachten met twee kinderen komt het meeste voor. De modus is dus twee.


Wanneer je werkt met categorische gegevens kan je wél een modus bepalen. Kijk maar eens naar deze tabel. Er kan geen gemiddelde of mediaan worden bepaald, maar je ziet wel duidelijk welk gegeven het meeste voorkomt.

De modus van deze tabel is dus de appel, die komt tien keer voor.


Opdracht 5: Bereken de mediaan van de speeltijden, in minuten (rond af), die de spelers van B.C. de Besten vorige match hebben gespeeld.

Antwoord: Er is maar één getal dat meer dan één keer voorkomt, namelijk 12. Dat is dus de modus.

Bij de vorige maten hebben we het centrum van je gegevens proberen te bepalen. Extreme maten wil je dan zo veel mogelijk vermijden of wegcijferen. Soms kan het echter nuttig zijn om deze juist eens onder de loep te nemen. Wanneer je wil zien hoe ver je gegevens uit elkaar liggen, gebruik je de variatiebreedte.

SPREIDINGSMAAT: DE VARIATIEBREEDTE

Met de variatiebreedte ga je kijken hoe verspreid je gegevens liggen. Ze is dus heel gevoelig aan extreme waarden.

De variatiebreedte bereken je door je kleinste waarde van je hoogste waarde af te trekken. Je berekent dus hoe "breed" je gegevens zijn (zie de foto hieronder).


De uiterste waarden zijn 1 en 2,1. De variatiebreedte is dan 2,1 - 1 = 1,1.

Opdracht 6: Bereken de variatiebreedte van de speeltijden, in minuten (rond af), die de spelers van B.C. de Besten vorige match hebben gespeeld.

Antwoord: Je kleinste gegeven is nul. Je grootste gegeven is 32 . Het verschil van deze twee is je variatiebreedte.

Dus: de variatiebreedte is 32 minuten.