Gemiddelde schatten
Het gemiddelde van een populatie schatten gaat ongeveer net als bij de proportie met een betrouwbaarheidsinterval.
Je doet bijvoorbeeld onderzoek naar het gemiddelde aantal volgers van 17-jarige Instagramgebruikers. Je neemt een steekproef van 250 17-jarigen met een Instagramaccount. Het gemiddelde aantal volgers van deze steekproef blijkt 96 volgers, met een standaardafwijking van 53 volgers.
Je zou nu simpelweg kunnen zeggen dat het gemiddelde aantal volgers van 17-jarige Instagramgebruikers in Nederland rond de 96 ligt. Maar dat gemiddelde kan daar natuurlijk erg van af wijken. Je hebt een steekproef van 250 17-jarigen genomen en in Nederland zijn er véél meer 17-jarigen. Misschien hebben de 17-jarigen in jouw steekproef toevallig veel meer of juist veel minder volgers. Hoe groter je steekproef is, hoe betrouwbaarder het gemiddelde zal zijn. Om de betrouwbaarheid van het gemiddelde aan te geven, kun je daarom gebruik maken van het betrouwbaarheidsinterval.
De formule is iets simpeler dan bij de proportie en hoeft daarom niet te worden opgesplitst in twee stappen. Het 95-betrouwbaarheidsinterval kun je bepalen met de volgende formule:
De standaardafwijking van de populatie wordt nu benaderd door de standaardafwijking van de steekproef (S) te delen door de wortel van de omvang van de steekproef (n). De grenzen van het betrouwbaarheidsinterval zijn dan de schatting van het gemiddelde plus en min deze standaardafwijking, op dezelfde manier als bij de proportie.
We bepalen nu het 95%-betrouwbaarheidsinterval bij het voorbeeld met de Instagramgebruikers hierboven. Het steekproefgemiddelde is 96 volgers, de standaardafwijking van de steekproef is 53 en de omvang van de steekproef is 250. Met deze gegevens kunnen we de grenzen bepalen:
Het 95%-betrouwbaarheidsinterval is dan:
Met een steekproefgemiddelde van 96, een steekproefstandaardafwijking van 53 en een steekproefomvang van 250 hebben we nu een interval voor het populatiegemiddelde bepaald. We kunnen met 95% zekerheid zeggen dat het populatiegemiddelde tussen 89 en 103 ligt.
Het berekenen van een betrouwbaarheidsinterval is dus ook een manier om met behulp van een steekproefgemiddelde, -standaardafwijking en steekproefomvang iets te zeggen over het gemiddelde van de hele populatie.
Ook de formule hierboven hoef je niet te onthouden. Op het formuleblad die je bij het eindexamen mag gebruiken krijg je de volgende formule: