Partiamo da un messaggio che potresti aver letto da qualche parte:
Indagine condotta con tecnica mista CATI-CAMI-CAWI su un campione di 1200 soggetti maggiorenni residenti in Italia tra il giorno X e il giorno Y 2021. Il campione è stratificato per zona e prevede quote per età e sesso. I dati sono stati ponderati al fine di garantire la rappresentatività rispetto ai parametri di zona, sesso, età, livello scolare e partito votato alle ultime elezioni. Il margine di errore statistico dei dati riportati è del 2,8% a un intervallo di confidenza del 95%.
Passiamo subito alla faccia che potresti fare in questo momento:
«Numeri da far girare la testa», come avrebbe detto l’ingegner Cane di Mai dire gol!
Ora torniamo al messaggio iniziale. Quella scritta accompagna i sondaggi politici proposti ogni lunedì dal TGLa7 e realizzati dall’Istituto di ricerca SWG. Per capirne il significato fino in fondo servirebbe un corso di statistica, ma qui ci limitiamo a scomporre il messaggio e a ricavare le informazioni essenziali da trasmettere agli studenti.
Vediamo un pezzo alla volta:
Indagine condotta con tecnica mista CATI-CAMI-CAWI
Il metodo seguito per fare questo sondaggio ha tenuto conto di tre tecniche diverse, ovvero CATI (Computer-Assisted Telephone Interviewing), CAMI (Computer Assisted Mobile Interviewing) e CAWI (Computer Assisted Web Interviewing) ovvero interviste via telefono fisso, smartphone e computer. Le tecniche vengono ben descritte in questa pagina.
su un campione di 1200 soggetti maggiorenni residenti in Italia tra il giorno X e il giorno Y 2021
Il campione statistico è il gruppo di persone che viene intervistato e la sua dimensione dipende dalla precisione del dato che si vuole raggiungere.
Il campione è stratificato per zona e prevede quote per età e sesso
Le caratteristiche delle persone selezionate rendono verosimili i risultati perché si trovano membri di tutti gli “strati” della popolazione, ovvero persone di età diversa, residenti in zone diverse, sia maschi sia femmine.
I dati sono stati ponderati
Il risultato non è soltanto una media aritmetica delle risposte, ma una media ponderata, ovvero tiene conto della stratificazione di cui si parlava nella frase precedente. Se per esempio in un campione ci sono 22 over 60 a favore dell’energia nucleare e 5 under 20 contro l’energia nucleare, il peso delle loro risposte viene calcolato in modo relativo e quindi l’opinione di quel campione sull’energia nucleare non sarà dato dalla media matematica semplice.
al fine di garantire la rappresentatività rispetto ai parametri di zona, sesso, età, livello scolare e partito votato alle ultime elezioni
Lo scopo di un sondaggio è raccogliere l’opinione di un piccolo gruppo di persone per poi estenderlo a tutta la popolazione, per cui il campione scelto deve avere delle caratteristiche che rappresentino quelle della popolazione più grande.
Il margine di errore statistico dei dati riportati è del 2,8%
Il margine di errore è l’intervallo entro il quale si trova la risposta giusta: al termine del sondaggio viene registrato un valore e a questo va applicato il margine di errore in più e in meno. Se per esempio diciamo che il campione è a favore dell’energia nucleare al 54% con un margine di errore del 2,8%, stiamo dicendo che la percentuale di popolazione a favore si aggira tra il 51,2 e il 56,8%. Più è ampio il margine di errore e meno è preciso il risultato.
a un intervallo di confidenza del 95%.
L’intervallo di confidenza esprime la certezza che abbiamo del risultato: se ripetessimo il sondaggio nelle stesse condizioni avremmo una probabilità del 95% di ottenere gli stessi risultati. Più è basso l’intervallo di confidenza e meno è attendibile il risultato. In genere un intervallo di confidenza del 95% è il minimo che ci si debba aspettare da uno studio scientifico.
Insomma, un messaggio scritto piccolo piccolo sotto a un sondaggio richiede una quantità di conoscenze molto elevate per essere compreso. Soprattutto perché una volta capito questa messaggio occorre interpretare i risultati del sondaggio vero e proprio.
Come puoi cominciare la prossima lezione? Cerchiamo delle frasi scritte sulle etichette dei prodotti o nelle pubblicità dei farmaci e proponiamole agli e alle studenti, in modo che le analizzino e capiscano davvero il loro significato.