Data beschrijven in tabellen, diagrammen en kentallen
Zodra je hebt bepaald met welke soort variabele je te maken hebt, kun je de data beschrijven door middel van tabellen, diagrammen of kentallen. Elk van deze wordt hierna besproken.
Tabellen: frequentietabel
Via tabellen kun je zowel kwalitatieve variabelen als kwantitatieve variabelen beschrijven. Er zijn twee soorten tabellen die je moet kennen: de frequentietabel en de kruistabel.
De frequentietabel geeft aan hoe vaak elke waarde voorkomt. Het voorbeeld hieronder komt uit de dataset die je in een eerdere paragraaf hebt gezien en is gemaakt het met programma VUstat. Het is belangrijk dat je goed begrijpt hoe zo’n frequentietabel en de verschillende kolommen ontstaan, zodat je de juiste conclusies uit de tabel kunt trekken.
Linksboven zie je over welke variabele de tabel gaat, in dit geval over vriendencontact. Rechts naast Totaal zie je dat er 69339 participanten waren bij het onderzoek. Via deze tabel kun je aflezen hoeveel respondenten hebben gekozen voor een bepaalde antwoordmogelijkheid. Deze hoeveelheid wordt de frequentie genoemd. De antwoordmogelijkheden worden ook wel waarden genoemd; het zijn de verschillende waarden die de variabele Vriendencontact kan aannemen.
De eerste kolom geeft de absolute frequentie weer, dat betekent dat de werkelijke aantallen zijn weergegeven. Je kunt bijvoorbeeld aflezen dat 8670 respondenten het antwoord ‘vaker dan 1 keer per maand’ hebben gekozen. Als je alle frequenties bij elkaar optelt, kom je op het totaal aantal respondenten van 69339 uit.
De tweede kolom heeft de relatieve frequentie weer, waarbij de aantallen zijn weergegeven als percentage van het geheel. Je kunt bijvoorbeeld aflezen dat ongeveer 2,3% van de respondenten aangeeft zijn vrienden minder dan 1 keer per maand te zien.
De derde kolom is de absolute cumulatieve frequentie, ook wel gewoon de cumulatieve frequentie genoemd. Cumulatief betekent ook wel ‘opstapelen’ en het betekent dat de frequenties van boven naar beneden steeds bij elkaar op worden geteld. De tweede waarde kun je zelf uitrekenen door de eerste twee waarden van de absolute frequentie bij elkaar op te tellen: 54808 + 8670 = 63478. De derde waarde kun je uitrekenen door de eerste drie waarden van de absolute frequentie bij elkaar op te tellen: 54808 + 8670 + 2699 = 66177. Zo gaat het door, tot je bij de laatste waarde automatisch uitkomt op het totaal, dat is namelijk alle vijf de waarden bij elkaar opgeteld. Hieruit kun je concluderen dat 66177 respondenten aangeven hun vrienden 1 keer per maand of vaker te zien.
In de vierde kolom staat de relatieve cumulatieve frequentie. Deze kun je vinden door de cumulatieve frequenties in percentages van het totaal om te zetten (kolom 3 gebruiken), of door de relatieve frequenties bij elkaar op te tellen (kolom 2 gebruiken). Uit deze kolom kun je aflezen dat ongeveer 91,6% van de respondenten aangeven hun vrienden vaker dan 1 keer per maand of minstens 1 keer per week te zien.
Hieronder staat een frequentietabel met klassenindeling. Tabellen zijn door het beperkt aantal rijen eigenlijk alleen geschikt om kwalitatieve variabelen weer te geven. Op het moment dat je de respondenten hebt gevraagd naar het aantal uren dat zij sporten per week (een kwantitatieve variabele), ga je niet voor elke hoeveelheid een rij maken: ‘1 uur’, ‘2 uur’, et cetera. Op die manier zou je een enorm grote tabel krijgen. Door categorieën te maken voor de aantallen, kun je een kwantitatieve variabele op een kwalitatieve manier weergeven. De variabele wordt daarmee ordinaal. Hieronder zie je dat er categorieën zijn gemaakt van het aantal uur sporten: 0 tot 5 uur, 5 tot 10 uur, et cetera. De categorieën worden klassen genoemd en deze klassen hebben een klassenbreedte van 5 uur. De klassen zijn altijd allemaal even breed. Het teken -< bij 20-<25 betekent dat 25 niet meetelt in die klasse, maar bij de klasse 25-<30 genomen wordt.
De kolommen kun je op dezelfde manier aflezen als bij de gewone frequentietabel Je kunt bijvoorbeeld aflezen dat ongeveer 7,8% van de respondenten tussen de 10 en 15 uur per week sport. Ook kun je aflezen dat 96,5% van de respondenten minder dan 20 uur per week sport.
In de frequentietabellen hierboven is telkens één variabele weergegeven, Vriendencontact of Sport. Je kunt in een frequentietabel ook twee variabelen tegelijk weergeven. Dat doe je door de tabel te splitsen voor een andere variabele. De tabel hieronder gaat over de variabele Opleiding en is gesplitst op de variabele Geslacht.
De frequenties voor de verschillende waarden zijn nu gesplitst tussen man en vrouw. Je kunt bijvoorbeeld aflezen dat 9484 vrouwelijke respondenten hbo of universiteit hebben afgerond. Ook kun je onderin aflezen hoeveel mannen en hoeveel vrouwen er in totaal aan het onderzoek hebben meegedaan. Je ziet dat in deze tabel alleen de absolute frequenties zijn weergegeven. Je kunt dit uitbreiden met relatieve of cumulatieve frequenties, maar daarmee wordt de tabel wel een stuk groter en minder overzichtelijk.