INTRODUZIONE
La previsione dei futuri sviluppi di un fenomeno naturale è uno dei principali obiettivi degli scienziati. La previsione scientifica si basa sulla comprensione degli ingredienti chiave che caratterizzano i fenomeni naturali osservati. Il metodo scientifico che utilizziamo, da Galileo Galilei in poi, si basa sull'osservazione dettagliata del fenomeno in studio, sulla formulazione di una teoria ragionevole che dovrebbe fare nuove previsioni. Questi sono a loro volta confrontati con osservazioni sperimentali. Se le previsioni teoriche non concordano con le osservazioni, la teoria viene adattata o modificata per tenere conto delle nuove prove sperimentali. Il processo viene ripetuto fino a quando non si raggiunge la convergenza e si minimizzano le discrepanze tra teoria ed esperimento.
Con l'avvento dei big data, dei potenti computer e dell'intelligenza artificiale, molti hanno iniziato a pensare che i modelli teorici non siano necessari e che le previsioni possano essere effettuate elaborando direttamente i dati esistenti. In diversi campi questo approccio ha dimostrato di essere efficace, ma la mera previsione sganciata dalla comprensione delle principali cause di un fenomeno è limitata e alquanto pericolosa. Molto spesso può emergere una correlazione spuria ed è difficile discriminare una vera causa da una pura coincidenza. In ogni caso, prevedere il futuro rimane sempre una grande sfida, specialmente quando il fenomeno che si sta osservando coinvolge persone che possono avere una reazione di feedback sulle quantità osservate che caratterizzano il fenomeno. Ciò è particolarmente vero nel caso delle epidemie, in particolare con l'epidemia COVID-19 che il mondo sta soffrendo in questo periodo.
COVID-19 (SARS-CoV-2) è un nuovo coronavirus inizialmente annunciato come agente causale di una polmonite di eziologia sconosciuta nella città di Wuhan, in Cina. Le sequenze del genoma sono correlate a una specie virale correlata alla sindrome respiratoria acuta grave (SARS). Queste specie virali comprendono anche alcuni virus rilevati nel pipistrello rinolofide in Europa e in Asia (Zhang 2019, Peiris 2003). Una proteina specifica (proteina S) della superficie del virus facilita l'ingresso virale nelle cellule bersaglio da parte del recettore dell'enzima di conversione dell'angiotensina (ACE2), ma i meccanismi di risposta immunologica all'infezione da virus sono incompleti (Hoffman et al. 2020). La maggior parte delle infezioni da coronavirus sono lievi e autotrattate, pertanto stimare la diffusione delle segnalazioni dell'ospedale e del medico generico può essere fuorviante nelle prime fasi dell'evoluzione della malattia. Questo è il motivo per cui la maggior parte dei paesi sta effettivamente contando i report e non quante persone hanno il virus. Tali report variano in base alla modalità di misurazione dei numeri, essendo il numero di test correlato al numero di pazienti sintomatici.
Indubbiamente è stata ed è ancora forte, per gli scienziati, la tentazione di utilizzare la grande mole di dati ufficiali che sono stati resi pubblici in queste ultime settimane (GitHub 2020), e che vengono aggiornati giorno dopo giorno, allo scopo di elaborare modelli predittivi. Molti sono stati, di conseguenza, gli studi pubblicati o messi in rete che vanno in questa direzione (vedere ad esempio Castorina et al. 2020, Lanteri et al. 2020, Fanelli et al. 2020, Magdon-Ismail 2020, Zlatic et al. 2020). Purtroppo però, a causa della complessità del processo di diffusione epidemica in un mondo globalizzato come quello attuale e delle limitazioni intrinseche dei dati ufficiali, di cui ci occuperemo nella prossima sezione, molti dei tentativi di prevedere il futuro sviluppo della pandemia, il suo picco e la sua fine hanno prodotto risultati poco soddisfacenti. A tal proposito, calza a pennello una famosa citazione attribuita a Niels Bohr, che ci avverte che "Le previsioni sono molto difficili, soprattutto se riguardano il futuro". Ecco perché in questo articolo vorremmo presentare una prospettiva diversa al fine di comprendere e contenere la diffusione della pandemia COVID-19, ma anche di aiutare la pianificazione strategica per prevenire o contenere future epidemie.
L'epidemia COVID-19 è iniziata ufficialmente in Cina nel gennaio 2020, anche se il virus probabilmente era già in circolazione nel paese dalla fine di ottobre 2019 secondo un recente rapporto (Giovanetti et al. 2020). In Italia il primo paziente infetto è stato ufficialmente individuato nella notte del 20 febbraio a Codogno (Lombardia), ma un paio di turisti cinesi sono stati ricoverati in ospedale a Roma (Lazio) già alla fine di gennaio dopo il test di conferma dell'infezione. Quindi in Italia abbiamo avuto almeno due punti di partenza ufficiali dell'epidemia COVID-19: uno nel nord Italia e uno nella parte centrale (Giovanetti et al. 2020). Quest'ultimo è stato individuato anche 20 giorni prima, quindi la domanda è: perché l'epidemia si è diffusa così rapidamente nelle regioni settentrionali dell'Italia piuttosto che in quelle centrali? La domanda è ancora irrisolta e molti pensano che sia stata semplicemente per caso. Tuttavia, ispirato a un recente position paper (Setti et al. 2020) sulla correlazione tra diffusione dell'epidemia e inquinamento atmosferico, riteniamo di poter fornire alcune ragioni plausibili per questa diversa diffusione e impatto dell'epidemia considerando diversi cofattori che differenziano le regioni d'Italia sotto vari aspetti. In questo articolo abbiamo proposto una nuova metodologia basata sul triangolo di Crichton (Crichton 1999, Kron 2002), per eseguire la valutazione del rischio epidemico delle varie regioni italiane in termini di inquinamento atmosferico, mobilità delle persone, media delle temperature invernali, concentrazione abitativa, addensamento delle strutture sanitarie, e frazione della popolazione in età avanzata.