Analýza vývoje COVID, Evropa

Hlavní část zpracování: Eliška Dvořáková, NMgr. Demografie

Tento projekt si kladl za cíl usnadnění práce s velmi rozsáhlou databází COVerAGE-DB tak, aby každý uživatel mohl získat uspořádané informace o vybrané zemi či více zemích pomocí jasně stanovených kódů, které budou vést k přehledným výstupům. Samozřejmostí je výpočet základních ukazatelů při práci s daty za zemřelé a potvrzené případy onemocnění COVID-19. Projekt se zakládá na souhrnných výstupech do excelu a mimo jiné také přináší grafická zobrazení pro lepší vizuální představu vývoje počtu zemřelých a potvrzených případů v čase.


Data

Výchozím souborem tohoto projektu je celosvětová databáze potvrzených případů a úmrtí na COVID‑19 COVerAGE-DB obsahující data tříděná do pětiletých věkových skupin. Pro následné analýzy byly dále využity počty obyvatel (střední stavy) v jednotlivých zemích, které byly čerpány z databáze United Nations. Veškeré analýzy byly zpracovávány v softwarovém prostředí SAS 9.4 a SAS Graphics Designer.

Údaje za jednotlivé země o potvrzených případech a úmrtích na onemocnění COVID-19 jsou v souboru zaznamenávány kumulativně za necelé roční období. Zpracování v rámci tohoto projektu obsahovalo analýzy pro vybrané evropské státy (+ USA), jako základní příklad je využíváno Švédsko,. Jednotlivé SAS-kódy jsou vytvořeny tak, aby si uživatel mohl zvolit samostatně jednu či více zemívstupujících do zpracování.


Řešení a výstupy

Základní deskriptivní statistika byla vytvořena pomocí procedur means a sql.


Tabulka 1

V Tab. 1 jsou vyobrazeny nejvyšší denní nárůsty potvrzených případů a úmrtí ve Švédsku přehledně dle věkových kategorií. Je třeba si povšimnout, že zatímco nejvyšší hodnoty nově potvrzených případů jsou kumulovány ve věkové skupině 20–55 let, nejvyšší počty nových případů úmrtí nalezneme ve věkové kategorii 80 a 85 let (Tabulka 1).

Inkubační doba onemocnění COVID-19 dle WHO (2020) může dosahovat až 14 dnů, proto bylo potřeba vypočítat 7denní a 14denní klouzavé průměry, aby zde došlo k vyhlazení získaných dat a ke zvýraznění trendu. Je také potřeba zmínit, že data ve vstupním souboru označené jako Cases, tedy počet potvrzených nakažených, nevypovídá o reálném počtu nakažených, nýbrž o potvrzených případech, proto tato hodnota bude ovlivněna systémem testování a vykazování v jednotlivých zemích.

Obrázek 1: Ukázka kódu procedury Expand

K výpočtu klouzavého průměru v SAS slouží procedura expand, ve které se přímo určí velikost posunu (movave). Před samotnou procedurou expand však musí dojít k vytvoření nového souboru (name2) seřazeného podle věku (age) a data (date) pomocí procedury sort. Procedura expand poté pracuje s tímto novým souborem (name2), ze kterého vytvoří další soubor (name3), ve kterém bude výsledný klouzavý průměr (MA). V tomto případě 14denní klouzavý průměr z proměnné potvrzených případů za Švédsko (výběr státu lze změnit). Švédsko bylo vybráno příkazem where, příkaz id označuje časovou řadu (date) a příkaz by určuje podle jaké proměnné proběhne třídění (age). V příkazu convert jsou uvedeny proměnné, které mají být zpracovány (casesn). Metoda byla zvolená none, díky které nedojde k interpolaci a je běžně používána ve spojení s volbou transformout (zkráceně transout).

Data o potvrzených případech a úmrtích společně s celkovými počty obyvatel k 1. 7. dala mnoho možností pro dopočítávání nových proměnných, příkladem je míra úmrtnosti a prevalence. Oba tyto ukazatelé byly vypočítány jak pro celkovou populaci, tak také věkově specificky pro jednotlivé skupiny. Dále incidence, která se od prevalence liší tím, že do výpočtu vstupují pouze nové potvrzené případy ku celkovému počtu obyvatel. V neposlední řadě byly také vypočítány poměry osob s potvrzenou infekcí či zemřelí starší 65 a 85 let ku celkovému počtu osob starších 65 či 85 let.

Tabulka 2: Výstup procedury Summary pro vybrané evropské státy k 29. 12. 2020

Následující tabulka (Tab. 2) je příkladem výstupu procedury summary, díky které lze přehledně pozorovat celkové počty potvrzených případů (CASESn), zemřelých (DEATHSn), počtu obyvatel v tisících (Population), míru úmrtnosti (Morrate) a prevalenci (Preval) za vybrané evropské státy k 29. 12. 2020. Toto datum bylo vybráno z toho důvodu, že u většiny vybraných zemích se jedná o poslední den, který byl zanesen do záznamu v roce 2020. Uživatel si však jednoduše sám může navolit libovolné datum.

Zároveň byly vytvořeny dva pohyblivé histogramy znázorňující potvrzené případy a zemřelé spolu s novými denními počty potvrzených případů či zemřelých ve Švédsku, kde lze názorně pozorovat narůstající počty a měnící se věkovou strukturu.

Závěr

Tento projekt si kladl za cíl vytvořit přehledné a automatizované kódy, které usnadní práci s rozsáhlou celosvětovou databází COVerAGE-DB. Dále je využíván datový soubor počtu obyvatel k 1. 7. 2020, který byl speciálně vytvořen z databáze United Nations za účelem propojení databází v tomto projektu a následných analýz.