Steekproefomvang bepalen
De formules voor het betrouwbaarheidsinterval kun je ook op een andere manier gebruiken. Als gegeven is wat de breedte van het interval zou moeten zijn, kun je terugrekenen wat de omvang van de steekproef moet zijn om die breedte te krijgen. Hieronder volgen voorbeelden bij de formules voor de betrouwbaarheidsintervallen van de populatieproportie en het populatiegemiddelde.
Populatieproportie
Stel je doet onderzoek naar de proportie smartphonebezitters in Nederland. Je opdrachtgever wil dat het 95%-betrouwbaarheidsinterval maximaal 0.04 breed is. Je denkt dat de proportie smartphonegebruikers in de populatie ongeveer 0.8 zal zijn. Met behulp van deze gegevens kun je dan bepalen hoeveel Nederlanders je moet ondervragen, oftewel hoe groot je steekproef moet zijn.
De formule voor het 95%-betrouwbaarheidsinterval van de populatieproportie is:
Dat betekent dat het interval in totaal altijd 4σ breed is ( onder de steekproefproportie en boven de steekproefproportie). De opdrachtgever wil dat het interval maximaal 0.04 breed is. Dus 4σ moet in dit geval gelijk zijn aan 0.04:
Door aan beide kanten te delen door 4, krijg je:
Je standaardafwijking moet dus maximaal 0.01 zijn.
Daarnaast heb je een schatting gemaakt van de populatieproportie: je denkt dat die ongeveer 0.8 is. Je kan dan zeggen dat je steekproefproportie ook ongeveer 0.8 zal zijn. Dan heb je:
Nu heb je een waarde voor σ en een waarde voor p̂. De volgende stap is om de andere formule te gebruiken:
Je vult de beide waarden die je hebt in. Dan krijg je:
Dat kun je vereenvoudigen tot:
Dit is een vergelijking met één onbekende, namelijk de steekproefomvang n. Zo’n vergelijking kun je oplossen met de hand of met je grafische rekenmachine, door twee grafieken te maken en het snijpunt te bepalen, of door nSolve te gebruiken (TI Nspire).
Je komt dan uit op n = 1600. Dat betekent dat je steekproef uit minimaal 1600 participanten moet bestaan.
Populatiegemiddelde
Nu een voorbeeld met de formule voor het betrouwbaarheidsinterval van het populatiegemiddelde.
Stel je doet onderzoek naar de gemiddelde kosten van het telefoonabonnement van Nederlanders. Je opdrachtgever wil dat het 95%-betrouwbaarheidsinterval maximaal 6 breed is. Je denkt dat de standaardafwijking in je steekproef ongeveer 9 zal zijn. Met behulp van deze gegevens kun je dan bepalen hoeveel Nederlanders je moet ondervragen, oftewel hoe groot je steekproef moet zijn.
De formule voor het 95%-betrouwbaarheidsinterval van het populatiegemiddelde is:
Dat betekent dat het interval in totaal 4 keer S/wortel(n) breed is (2 keer S/wortel(n) onder het steekproefgemiddelde en 2 keer S/wortel(n) boven het steekproefgemiddelde). De opdrachtgever wil dat het interval maximaal 6 breed is. Dus 4 keer S/wortel(n) moet in dit geval gelijk zijn aan 6:
In deze vergelijking staan nog twee onbekenden (S en n), maar je hebt ook een schatting van de standaardafwijking van je steekproef, namelijk 9. Die vul je ook in:
Nu heb je een vergelijking met één onbekende. Zo’n vergelijking kun je oplossen met de hand of met je grafische rekenmachine, door twee grafieken te maken en het snijpunt te bepalen, of door nSolve te gebruiken (TI Nspire).
Je komt dan uit op n = 36. Dat betekent dat je steekproef uit minimaal 36 participanten moet bestaan.
Formules
Als je alles wat hierboven staat begrijpt, dan zou je zou gebruik kunnen maken van onderstaande formules om snel de steekproefomvang te berekenen.