Stimare la probabilità di qualcosa che non è ancora accaduto

Seguo Endeavour, il blog di John D. Cook, perché ha degli articoli interessanti sulla statistica e sulla programmazione.
Questa è una mia traduzione in italiano del suo articolo Estimating the chances of something that hasn’t happened yet

Supponi di correggere le bozze di un libro. Se hai letto 20 pagine e trovato 7 refusi allora potresti ragionevolmente stimare che la probabilità che una pagina abbia un refuso sia 7/20. Ma cosa puoi dire se hai letto 20 pagine e non hai trovato refusi? Diresti che le probabilità che una pagina abbia un refuso siano 0/20 concludendo quindi che le bozze non hanno nessun errore?

Facciamo un altro esempio, supponi di dover verificare quanti bambini abbiano il cosiddetto "orecchio assoluto". Fino ad ora hai controllato 100 bambini ma nessuno di loro ha un orecchio assoluto. Puoi concludere che i bambini non hanno l'orecchio assoluto? Tu sai che qualche bambino ha questa dote perché ne hai già sentito parlare. Però i tuoi dati suggeriscono che l'orecchio assoluto nei bambini è piuttosto raro. Ma quanto raro?

La regola del tre dà un modo rapido di stimare questo tipo di probabilità. La regola dice che se fino ad ora hai controllato N casi e non hai ancora trovato quello che stai cercando, allora una stima ragionevole è che la probabilità sia inferiore a 3/N. Così nel nostro esempio del correttore di bozze se non hai trovato refusi in 20 pagine puoi stimare che la probabilità che una pagina contenga un refuso sia meno del 15%. Nell'esempio dell'orecchio assoluto puoi concludere che meno del 3% dei bambini è dotato dell'orecchio assoluto.

Nota che la regola del tre dice the la tua stima della probabilità decresce in proporzione al numero dei casi che hai controllato. Se controlli 200 pagine senza trovare un refuso la tua stima cala dal 15% all'1.5%. Ma non va direttamente a zero. Immagino che nella maggior parte delle persone si farebbe strada il sospetto che ci siano refusi anche se non ne hanno ancora visti leggendo le prime pagine. Ma ad un certo punto potrebbero dire "ho già letto così tante pagine senza trovare errori che per forza non ce ne devono essere". La situazione è un poco diversa nell'esempio dell'orecchio assoluto perché comunque puoi sapere a priori che la probabilità non possa essere zero.

Se ti spaventano i dettagli matematici puoi terminare qui la lettura. Semplicemente ricorda che se dopo N osservazioni non hai ancora visto accadere quello che aspetti allora una buona stima della probabilità che accada è inferiore a 3/N.

Perché la regola del tre funziona? Supponi che la probabilità che stai cercando sia p. Se vogliamo un intervallo di confidenza del 95% allora dobbiamo trovare la più grande p tale che la probabilità di nessun successo dopo n casi sia 0.05, dobbiamo cioè risolvere in p l'equazione (1-p)n = 0.05. Facendo il logaritmo naturale di ambo i membri abbiamo n log(1-p) = log(0.05) ≈ -3. Siccome log(1-p) è approssimabile con -p per piccoli valori di p alla fine abbiamo che p è circa uguale a 3/n.

La spiegazione qui sopra è il punto di vista dei frequentisti. Vediamo adesso la spiegazione Bayesiana dello stesso risultato. Dopo potrai dire senza timore che "p è probabilmente inferiore a 3/N" siccome ai Bayesiani è consentito fare affermazioni di questo tipo.

Supponi di partire con p a priori distribuita uniformemente. La ditribuzione a posteriori di p dopo aver visto 0 successi e N fallimenti è una distribuzione beta(1,N+1). Se calcoli la probabilità a posteriori che p sia inferiore a 3/N ottieni una espressione che converge ad 1 – exp(-3) al crescere di N, e 1 – exp(-3) ≈ 0.95.

Fine della traduzione.


Osservazione

In R è disponibile la funzione prop.test per calcolare l'intervallo di confidenza di una proporzione. Per esempio prop.test(0,10) calcola l'intervallo di confidenza del rapporto che si può inferire dall'osservazione di 0 successi in 10 tentativi. L'intervallo di confidenza prop.test(0,n) ha l'estremo inferiore pari a 0 e l'estremo superiore pari ad un valore maggiore di zero e via via decrescente al crescere di n
Il grafico qui sotto mostra con i pallini rossi l'estremo superiore dell'intervallo di confidenza di prop.test(0,n) al crescere di n, (con n che va da 10 a N=100), mostra poi le due iperboli 3/n (in verde) e 4/n (in blu): l'iperbole verde è quella che si ottiene applicando la regola del tre descritta nella traduzione, l'iperbole blu invece si ottiene applicando quella che potremmo chiamare la "regola del quattro": invece di considerare tre casi se ne considerano quattro.
Sembra che la regola del quattro si adatti meglio, rispetto alla regola del tre, agli intervalli di confidenza calcolati da prop.test di R.
L'andamento dei pallini rossi sembra effettivamente assomigliare a quello di una iperbole, ho provato allora a calcolare l'iperbole che meglio descrive la curva dei pallini rossi (con il comando lm( upper ~ I(1/n)-1 )) per vari valori crescenti di N ed ho ottenuto la curva del grafico seguente.

Per esempio i pallini rossi del grafico precedente che ha N=100 sono descritti bene da una iperbole del tipo 3.95/n: il coefficiente 3.95 è il valore del pallino ad ascissa circa 100 nel grafico qui sopra.
Il coefficiente sembra convergere a un valore prossimo a quattro.

L'"Osservazione" è © Alessandro Gentilini 2012 - 21 marzo 2012

Comments