For grupperede observationer findes kvartilsættet ved aflæsning på en sumkurve. For at lave en sumkurve skal vi bruge de kumulerede frekvenser.
Den kumulerede frekvens for et interval fås ved at lægge alle intervalfrekvenserne for de lavere intervaller sammen med intervalfrekvensen for det aktuelle interval. I figur 6.3.1.1 er de kumulerede frekvenser for eksemplet med reaktionstiderne beregnet. Vi bruger symbolet F for den kumulerede frekvens.
F.eks. beregnes den kumulerede frekvens for intervallet "260-300" som summen af alle frekvenserne i intervallerne under ”300”
F(300) = f(100-140) + f(140-180) + f(180-220) + f(220-260) + f(260-300)
= 0,8% + 0% + 0% + 12,5% + 61,7% = 75%
Her har man altså udregnet hvor mange procent af målingerne, der ligger på 300 millisekunder eller derunder. Altså vil reaktionstiden være 300 millisekunder eller hurtigere i 75% af forsøgene.
De kumulerede frekvenser fortæller, hvor mange procent af observationerne der er lig med eller mindre end højre endepunkt i det givne interval.
Figur 6.3.1.1. De kumulerede frekvenser for observationssættet.
En sumkurve er en stykvis lineær kurve mellem en række punkter. Det første punkts første koordinat er lig med venstre endepunkt i det første interval, mens dets anden koordinat er lig med 0. For de øvrige punkter gælder der, at punkternes første koordinat udgøres af intervallernes højre endepunkt, mens punkternes anden koordinat udgøres af den kumulerede frekvens.
I dette eksempel indsættes punkterne
(100 ; 0), (140 ; 0,8), (180 ; 0,8), (220 ; 0,8), (260 ; 13,3), (300 ; 75,0), (340 ; 95,8), (380 ; 97,5), (420 ; 99,2) , (460 ; 100)
Figur 6.3.1.2 viser sumkurven for eksemplet med reaktionstiderne.
Figur 6.3.1.2. Sumkurven over reaktionstiden.
Kvartilsættet for grupperede observationer aflæses på sumkurven.
Den nedre kvartil, Q 1 , er den x-værdi, der svarer til en kumuleret frekvens på 25%.
Medianen, m, er den x-værdi, der svarer til en kumuleret frekvens på 50%.
Den øvre kvartil, Q 3 , er den x-værdi, der svarer til en kumuleret frekvens på 75%.
Figur 6.3.1.3 viser hvordan kvartilsættet aflæses med udgangspunkt i den kumulerede frekvens afsat på y-aksen. Kvartilsættet bliver
Den nedre kvartil: Q 1 = 267,6 millisekunder.
Medianen: m = 283,8 millisekunder.
Den øvre kvartil: Q 3 = 300,0 millisekunder.
Figur 6.3.1.3. Aflæsning af kvartilsættet for reaktionstiden målt i millisekunder.
Det udvidede kvartilsæt kan illustreres med et boksplot. Når observationerne er grupperede, angiver boksplottets yderpunkter hhv. det første intervals venstre endepunkt og det sidste intervals højre endepunkt. På boksplottet er det altså ikke muligt at aflæse observationssættets mindste værdi og største værdi, som man kan, når observationerne er ugrupperede. Boksplottet over reaktionstiden er vist på figur 6.3.1.4.
Figur 6.3.1.4. Boksplot over reaktionstiden målt i millisekunder.
Man kan også opdele et observationssæt i andre procentdele end dem, som udgør kvartilsættet. I det tilfælde kalder man deskriptorerne for fraktiler.
Hvis man f.eks. er interesseret i de nederste 10 % af observationerne, taler man om 10%-fraktilen. Figur 6.3.1.5. viser hvordan 10%-fraktilen aflæses til 249,3 millisekunder.
Figur 6.3.1.5. Aflæsning af 10%-fraktilen.
Der kan også aflæses omvendt på sumkurven. Man kan finde den fraktil, der hører til en bestemt observation, ved at starte på x-aksen og via sumkurven ende på y-aksen. Figur 6.3.1.6 viser, at den fraktil, der hører til observationen "350", er 96,3%-fraktilen.
Det betyder i denne sammenhæng, at 96,3% af reaktionstiderne ligger under 350 millisekunder.
Figur 6.3.1.6. Aflæsning af den fraktil der hører til observationen "350".