Clusteranalyse = data groeperen (vorm van datareductie)
OPGELET: zeer subjectieve methode: onderzoeker interpreteert en kiest zelf het aantal clusters!
Doelen
1. Clusteren van variabelen
Cfr. PCA:
Kan ik variabelen/items groeperen in enkele dimensies?
Dus: Welke variabelen horen samen?
Meest gebruikt PCA, maar kan ook via hiërarchische clustering!
2. Clusteren van cases
Kan ik de respondenten/krantenartikels/ advententies/… uit mijn onderzoek in groepen verdelen op basis van een aantal kenmerken (= variabelen)
Kan zowel via hiërarchische clustering als via K-means clustering
Opgelet: tweede stap = PROFILERING (beschrijven)
Voorwaarden
Methodes
A. Hiërarchische clustering
= Zowel gebruikt om cases als om variabelen te clusteren!
NIET VERGETEN: aanduiden of het gaat om clusteren van CASES of VARIABELEN
Grafische voorstelling: dendrogram (= boomstructuur)
Opgelet: altijd oplossing!
Indien variabelen clusteren: nadien interne consistentie items testen per cluster via Chronbach’s Alpha
Indien cases clusteren: hiërarchische clustering wordt meestal ter voorbereiding gebruikt om te bekijken welke clusteroplossingen mogelijk zijn (aantal clusters). Nadien kan men dan een K-Means clustering uitvoeren waarbij op voorhand moet ingegeven worden hoeveel clusters je wil.
B. K-means clustering
= Enkel gebruikt om cases te clusteren (GEEN variabelen!)
Aantal clusters moet op voorhand gespecifieerd worden:
Volgende stap: Profilering!
= Beschrijven van je clusters aan de hand van de andere variabelen in je dataset
= Wie zit er in mijn clusters?
Adhv. verschillende toetsen afhankelijk van meetniveau afhankelijke variabele: