Middelværdien af observationerne kaldes også middeltallet eller gennemsnittet. Man beregner middelværdien ved at lægge alle observationerne sammen og dividerer med deres antal. Symbolet, der angiver middelværdien for en stikprøve, skrives som et x med en streg over og kaldes "x-bar".
Beregningen af middelværdien for observationssættet med de 30 observationer i figur 6.2.2 er
Den generelle formlen for ovenstående beregning kan skrives som vist i figur 6.2.3.1 hvor x1 , x2 , ... , xn er alle de n observationer. I eksemplet er n = 30, fordi der er 30 observationer.
Rækken af x'er der skal lægges sammen, kan skrives kort med symbolet Σ (stort sigma). Efter Σ skrives xi , der står for alle de forskellige x-værdier, der skal lægges sammen. De værdier, som i'et kan være, indikeres under og over Σ. Under Σ skrives i'ets startværdi, mens slutværdien skrives over Σ. Det er underforstået, at i'ets værdi vokser med 1, for hvert nyt led i summen.
Figur 6.2.3.1. Formler for middelværdien.
Da mange af observationerne har samme værdi, kan man udtrykke middelværdien mere kompakt vha. hyppighederne.
Da der er 2 observationer på ”10” kan vi skrive 2 · 10 i stedet for 10 + 10.
Da der er 3 observationer på ”11” kan vi skrive 3 · 11 i stedet for 11 + 11 + 11.
Således kan vi fortsætte, og middelværdien kan beregnes mere overskueligt som
Når vi anvender hyppighederne, kan formlerne for middelværdien skrives som vist i figur 6.2.3.2, hvor x1 , x2 , ... , xm er alle de m forskellige observationer.
Figur 6.2.3.2. Formler for middelværdien vha. hyppigheder.
Man kan også omskrive formlen på en anden måde, hvis man starter med dividere n op i alle m led i tælleren, og derefter bruger definitionen på frekvens
Figur 6.2.3.3. Formler for middelværdien vha. frekvenser.
Middelværdien på 14,43 er fundet på baggrund af de data, der er i stikprøven. Hvis vi var interesseret i at undersøge den gennemsnitlige talsans hos alle mennesker, ville den beregnede middelværdi kun være et estimat på den virkelige middelværdi i hele populationen. Den virkelige middelværdi er ukendt. Som symbol for den virkelige middelværdi bruges det græske bogstav µ (my).
Når man skal udtrykke sig om observationernes fordeling, anvender man begreberne venstre-skæv, ikke-skæv eller symmetrisk og højre-skæv.
Fordelingen af observationerne i et observationssæt er
venstre-skæv, når middelværdien er mindre end medianen
ikke-skæv eller symmetrisk, når middelværdien er lig med medianen
højre-skæv, når middelværdien er større end medianen
Figur 6.2.3.4a. Venstre-skæv fordeling.
Figur 6.2.3.4b. Ikke-skæv eller symmetrisk fordeling.
Figur 6.2.3.4c. Højre-skæv fordeling.
I eksemplet har vi en middelværdi på 14,43 og en median på 14. Det er illustreret på figur 6.2.3.5.
Da 14,43 > 14 kan vi vha. figur 6.2.3.4c konkludere, at vi har at gøre med et højre-skævt observationssæt.
Figur 6.2.3.5. Et højre-skævt observationssæt.