Man taler om, at dyr og mennesker kan have en talsans. Talsans er evnen til at kunne overskue et antal uden at tælle. Fx kan visse fuglearter overskue antal op til fire. Hvis der i en rede ligger 6 æg, kan man godt fjerne det ene, for det vil fuglen ikke lægge mærke til. Men ligger der kun fire æg, vil fuglen opdage, hvis der pludselig manglede et æg, og den vil så forlade reden. Så fugle kan kende forskel på antal op til omkring 4 uden at kunne tælle.
Psykologiske eksperimenter har vist, at mennesker kun kan skelne op til 3-4 genstande, hvis de ikke får lov til at tælle. For at undersøge talsansen hos mennesker kan man udføre forsøg, hvor et hvidt stykke papir med et vist antal sorte prikker tilfældigt fordelt, vises i et kort tidsrum (max 1 sekund, så man ikke kan nå at tælle prikkerne). Alle elever i en klasse blev præsenteret for dette billede.
Derefter skulle eleverne skrive det antal prikker, som de vurderede var på papiret. Resultatet var følgende svar:
15, 17, 13, 12, 14, 14, 10, 19, 15, 17, 11, 12, 13, 11, 18,
17, 15, 16, 15, 10, 20, 14, 16, 13, 17, 12, 15, 14, 13, 11
Disse tal kaldes for selve observationssættet. Det er de rå data, som vi vil arbejde ud fra. Vi har 30 svar, og det svarer til 30 elever på matematikholdet. Dette kaldes for observationssættets størrelse, n. Så her er: n = 30.
Det første man kan gøre, er at lave et prikdiagram. Her sætter man en prik for hver observation. Resultatet ses her:
Prikdiagrammet viser, at 5 elever har vurderet antallet af prikker til at være 15. Vi siger, at hyppigheden af observationen ”15” er 5, og vi skriver det således: h(15) = 5.
Det rigtige antal er 14 prikker, og det har 4 elever haft som svar. Så hyppigheden af observationen ”14” er 4, h(14) = 4. Der er to elever, der kun har vurderet antallet til at være 10, mens en elev har troet, at der var 20 prikker på papiret.
Definition:
Hyppigheden af en observation fortæller, hvor mange gange observationen forekommer.
Hvis vi ville sammenligne denne klasses resultater med en anden klasse, ville hyppighederne for de to klasser kun kunne sammenlignes, hvis de to klasser var lige store. Derfor angiver man oftest, hvor mange procent hver observation udgør af alle observationerne. Fx har 5 ud af 30 elever svaret ”15” prikker, og det svarer til
Dette tal kaldes for frekvensen af observationen ”15”, og vi skriver det således: f(15) = 16,7%
Definition:
Frekvensen udregnes som hyppigheden divideret med observationssættets størrelse (evt. omsat til procent).
Her ses et skema med de forskellige observationer og deres hyppigheder og frekvenser:
Man kan illustrere observationerne med et pindediagram (stolpediagram), hvor højden af hver pind angiver enten hyppigheden eller frekvensen af den pågældende måling.
Hvis vi stiller alle observationerne op i rækkefølge, får vi denne talrække:
10, 10, 11, 11, 11, 12, 12, 12, 13, 13, 13, 13, 14, 14, 14,
14, 15, 15, 15, 15, 15, 16, 16, 17, 17, 17, 17, 18, 19, 20
Observationerne falder i to lige store grupper. Den halvdel, der er mindst, går fra 10 til 14, og den halvdel, der er størst, går fra 14 til 20. Tallet 14, der adskiller de to halvdele, kaldes for medianen. Halvdelen med de mindste observationer indeholder 15 tal, og her er den 8’ende observation i midten. Det er observationen 12. Dette tal kaldes for første kvartil. Endelig er den midterste observation i den anden halvdel af observationerne tallet 16, og dette tal kaldes for tredje kvartil. Medianen kaldes også for anden kvartil. De tre tal (12, 15, 16) kaldes for kvartilsættet for observationssættet.
Kvartilsættet fortæller sammen med den mindste observation, nemlig 10, og den største observation, nemlig 20, om fordelingen af elevernes vurdering. Det viser nemlig, at en fjerdedel af eleverne vurderede antallet af prikker på papiret til at være mellem 10 og 12. En fjerdedel vurderede antallet til at være mellem 12 og 14, En fjerdedel vurderede det til at være mellem 14 og 16, og endelig vurderede en fjerdedel af eleverne antallet til af være mellem 16 og 20 prikker.
Dette kan illustreres ved et boksplot, der giver et hurtigt overblik over fordelingen af elevernes svar.
Her er de to midterste fjerdedele af elevsvarene angivet med to kasser, mens de to yderste fjerdedele er angivet med vandrette streger. Det hele afgrænses af den mindste og den største observation, der er markeret ved to korte lodrette streger.
Man kan også udregne middeltallet af alle observationerne. Her lægger man simpelt hen alle observationerne sammen og dividerer med deres antal.
Her kan vi skyde en genvej, fordi vi ved, at der er 2 observationer på ”10”, 3 observationer på ”11”, så derfor kan vi skrive 2·10 for ”10”-tallerne og 3·11 for ”11”-tallerne. Således kan vi fortsætte og middeltallet bliver:
= 14,3
Middeltallet:
Formel for middeltallet:
hvor x1, x2, … , xn er alle de n observationer.
eller:
hvor x1, x2, … , xm her er de forskellige observationer i observationssættet med størrelsen n, og h angiver hyppighederne.
Eksempel 8.2.1
Med færre prikker er det nemmere at bedømme antallet. Samme klasse skulle bedømme antallet af prikker på dette stykke papir:
Resultatet er her angivet i denne tabel:
Middeltallet bliver 7,2
Stolpediagrammet, der illustrerer observationssættet, ses her:
Hvis vi sammenligner søjlediagrammerne for de to observationssæt, så ser vi, at observationerne for forsøget med 7 prikker ligger meget mere tæt på hinanden end i forsøget med de 14 prikker.
Dette betyder, at eleverne har meget nemmere ved at vurdere 7 prikker end de ved at vurdere 14 prikker tilfældigt sat på et stykke papir. Dette er ikke nogen overraskelse.
Man kan godt se, at observationerne ved de 14 prikker ligger mere spredt, og man har faktisk et mål for, hvor stor spredningen er. Det udregnes ved først at udregne variansen, v, som er gennemsnittet af observationernes afstand til middelværdien i anden potens. Den første observation er ”10”. For denne udregnes tallet:
(10 – 14,3)2 = 18,49
fordi middelværdien er 14,3 ,og da hyppigheden af ”10” er 2 ganges med tallet 2:
2·(10 – 14,3)2 = 36,98
Dette er første observations bidrag til variansen. På samme måde udregnes alle de andre observationers bidrag.
Dette gøres i dette skema:
Summen af alle bidragene bliver 198,3 og dette divideres med det samlede antal observationer (observationssættets størrelse, her 30) for at udregne variansen, v:
v = = 6,61 Spredningen, s, udregnes som kvadratroden til variansen:
s =
Derfor vil vi sige, at observationerne i forsøget med de 14 prikker ligger med en spredning på 2,57.
For det andet observationssæt ser udregningerne sådan ud:
Variansen bliver derfor:
og spredningen:
Altså som forventet en væsentlig mindre spredning.
Variansen, v, beregnes ved:
Spredningen, s, beregnes som: