SEZIONE 2: NORD VS CENTRO-SUD ITALIA, COSA CI DICONO I DATI UFFICIALI DELLA PANDEMIA COVID-19
Di seguito, prima di introdurre la nostra nuova metodologia, vorremmo discutere i dati ufficiali rilasciati dalla Protezione Civile Italiana fino al 2 aprile 2020(GitHub 2020), ovvero il giorno in cui abbiamo interrotto la nostra analisi. Fino al 2 aprile il rapporto ufficiale affermava che in Italia c'erano 115252 casi totali di contagiati e 13915 persone decedute a causa del COVID-19. Tuttavia, diversi studi recenti hanno dimostrato che i dati ufficiali sottostimano il numero corretto di persone infette. Nel rif. (Pinotti et al. 2020) è stato dimostrato che almeno il 60% delle persone infette non mostra quasi alcun sintomo e quindi questo tipo di infezione non viene solitamente individuato. In effetti, le strategie di sperimentazione adottate in Italia hanno generalmente consistito nel testare solo le persone che manifestano sintomi gravi e in particolare le persone di età superiore ai 65 anni. Per questo motivo i dati giornalieri segnalati ufficialmente dipendono in larga misura dal numero di test effettuati sulla popolazione e si traducono in un campione parziale nei pazienti anziani.
Un'evidenza a favore di questo fatto è mostrata in Fig. 1, presa dal rapporto ISPI (Villa 2020), dove è riportato il tasso apparente di mortalità (cioè il rapporto tra il numero di pazienti deceduti e il totale di contagiati trovato) registrato in Italia . Il valore medio è il più alto del mondo con un valore intorno al 10%. In Cina, dove è iniziata l'epidemia, il valore medio è del 4%. Tale sproporzione potrebbe anche essere dovuta, in parte, al fatto che in Cina l'età media della popolazione è di 38 anni contro un valore per l'Italia pari a 47 (l'Italia è il paese con la popolazione più anziana dopo il Giappone (Worldometer 2020 )). Tuttavia, il motivo principale è probabilmente legato al fatto che il numero reale di persone infette potrebbe essere molto maggiore di quanto ci dicono i dati ufficiali.
È interessante notare che la letalità sembra variare molto anche da una regione italiana all'altra. Nel riquadro di destra di Fig. 2, ripreso da (Villa 2020), mostriamo che il tasso apparente di mortalità registrato nelle varie regioni d'Italia differisce molto quando si va dalle regioni settentrionali dell'Italia a quelle centrali e meridionali. Più in dettaglio, secondo i dati ufficiali italiani COVID-19, come riportato in rif. (Villa 2020), al momento abbiamo un tasso di mortalità apparente intorno al 13,6% in Lombardia e intorno al 2,4%, cioè quasi sei volte meno, in Sicilia.
Ancora una volta, un tale aumento della mortalità nel nord rispetto al centro e al sud dell'Italia, potrebbe essere correlato al numero di test: come mostrato in Fig.3, il rapporto ISPI (Villa 2020) ha trovato una correlazione interessante tra l'apparente tasso di mortalità e il rapporto tra il numero di persone infette e il numero di test effettuati. Se i test vengono eseguiti solo su pazienti ospedalizzati gravi e anziani, come è stato fatto nella maggior parte delle regioni italiane ad eccezione del Veneto, la mortalità ovviamente aumenta. Una stima realistica plausibile del tasso di mortalità medio italiano, secondo il rapporto ISPI, può essere fatta attraverso il confronto con altri paesi e dovrebbe aggirarsi intorno all'1,14%.
Sulla base di questi dati, è possibile effettuare una stima più realistica del numero effettivo di persone contagiate in Italia, che secondo il rapporto ISPI dovrebbe essere circa dieci volte quello riportato dai dati ufficiali. L'evoluzione temporale di questo numero più plausibile di persone realmente infette in Italia è riportata in Fig. 4. Un recente studio dell'Imperial College (Flaxman et al. 2020) va ancora più avanti su questa linea, stimando che circa il 10% dell'italiano la popolazione (cioè circa 6 milioni di persone) è stata infettata da COVID-19 il 28 marzo, contro il numero ufficiale di circa 92500 persone alla stessa data.
A fronte di stime così incerte, al fine di avere un indicatore più affidabile dei danni attribuibili a SARS-CoV-2, è conveniente guardare alla mortalità totale media registrata nelle varie regioni. In un recente rapporto del Ministero della Salute italiano (MS 2020), l'eccesso di decessi giornalieri registrati (di ogni tipo) osservato negli ultimi mesi è stato confrontato con il numero medio giornaliero calcolato, durante lo stesso periodo, negli anni precedenti. Il rapporto mostra un eccesso di decessi nelle ultime settimane (oltre un sigma) che in alcuni casi è addirittura 4 volte superiore ai dati ufficiali COVID-19. Ciò può essere spiegato con il fatto che molti anziani, specialmente nel nord Italia, muoiono nelle loro case o nei loro ospizi senza la possibilità di essere ricoverati e sottoposti a test.
Ma ci sono altre informazioni importanti che possiamo estrarre da questi dati. In Fig.5, tratta da (MS 2020), il rapporto mostra i dati precedenti sulla mortalità disaggregati tra la parte settentrionale e centro-meridionale dell'Italia: mentre per le regioni settentrionali (pannello superiore) è chiaramente visibile l'eccesso di mortalità, che rappresenta il contributo relativo alle epidemie di coronavirus, nella parte centrale e meridionale del Paese (pannello inferiore) i dati non rivelano (al 31 marzo) una discrepanza così forte rispetto alla media annuale.
Riassumendo, possiamo concludere che, in generale, i dati ufficiali italiani sul nostro scoppio COVID-19 che sono attualmente disponibili sottovalutano pesantemente quelli corretti, ma non sappiamo quanto lo facciano e quanto siano condizionati dai pazienti (più anziani) che presentano sintomi più gravi.
D'altra parte, se i dati ufficiali sull'epidemia COVID-19 in Italia non forniscono uno scenario chiaro dell'impatto effettivo dell'epidemia sul paese, ciò implica anche che è molto improbabile che, utilizzando modelli standard basati su i valori assoluti di questi dati, si possa prevedere in modo accurato il picco dell'epidemia o la sua fine (si veda ad esempio Magdon-Ismail 2020). L'unica cosa che emerge chiaramente senza alcun dubbio dai dati che abbiamo mostrato, e in particolare da quelli della figura 5, è che l'impatto dell'epidemia nelle regioni settentrionali dell'Italia è sicuramente molto più drammatico rispetto al resto del nazione. Questo è certamente strano se si considera che, come già chiarito nell'introduzione, in Italia abbiamo avuto almeno due punti di partenza ufficiali dell'epidemia COVID-19, uno nella parte centrale (alla fine di gennaio) e uno nella parte settentrionale (alla fine di febbraio) (Giovanetti et al. 2020), con diverse ondate di centinaia di migliaia di persone che hanno lasciato le aree settentrionali per tornare alle regioni in arrivo originarie delle aree centrali e meridionali prima del blocco del paese a marzo 9 (Pepe 2020). Pertanto, con altissima probabilità, il contagio ha abbastanza tempo per diffondersi in modo quasi omogeneo in tutte le regioni, già prima di qualsiasi restrizione di mobilità. Tuttavia, sembra che, per qualche motivo, gli effetti dell'epidemia - sia in termini di casi totali che di decessi - siano stati amplificati in un numero limitato di regioni. Riteniamo che, se si mantiene un approccio aggregato a livello di gruppi di regioni, nonostante le limitazioni e la sottovalutazione sottolineate sopra, i dati ufficiali COVID-19 contengono ancora informazioni utili per spiegare questa anomalia.
Nelle sezioni che seguono proponiamo una metodologia data-driven in grado di valutare il livello di rischio a-priori che caratterizza le diverse regioni italiane rispetto a un'epidemia influenzale generica con alcune caratteristiche in comune con quelle del COVID-19. Utilizzando i dati ufficiali COVID-19 (disponibili fino al 2 aprile 2020), mostreremo che questa analisi generale è già in grado, ad un ottimo livello di approssimazione, di spiegare la diffusione asimmetrica e l'impatto dell'epidemia COVID-19 in Italia. Un'analisi simile potrebbe essere replicata per qualsiasi altro paese al mondo, al fine di verificare se la classificazione del rischio a-priori di diverse regioni corrisponda alla classificazione dei danni osservata per il COVID-19.
Figura 1: tasso di mortalità apparente nei vari paesi, dati tratti dal rapporto ISPI (Villa 2020).
Figura 2: tasso di mortalità apparente nelle varie regioni d'Italia (pannello di destra), dati tratti dal rapporto ISPI (Villa 2020). Una mappa geografica dell'Italia è anche mostrata per il confronto (riquadro a sinistra).
Figura 3: tasso di mortalità apparente nelle varie regioni d'Italia rispetto al rapporto tra i casi totali con i test effettuati, dati ricavati dal rapporto ISPI (Villa 2020)
Figura 4: L'evoluzione temporale della stima realistica del numero di persone italiane contagiate (linea nera) rispetto a quella dei dati ufficiali (linea rossa) secondo il rapporto ISPI (Villa 2020).
Figura 5: Mortalità giornaliera media (linea intera) nel nord (pannello superiore) e nel centro e sud (pannello inferiore) d'Italia, dal 25/09/2019 al 31/03/2020, rispetto alla mortalità giornaliera media registrata nello stesso periodo degli anni precedenti (linea tratteggiata); vedi rif. (MS 2020).