Projekt COVID-19:
Demografická analýza v SAS

Klára Hulíková, Katedra demografie a geodemografie

Jedná se o neformální projekt reagující na aktuální potřebu demografické a epidemiologické analýzy tématu pandemie COVID-19. Specificky se věnuje možnostem využití statistického software SAS a automatizačních možností zpracování dat. Práce zařazení v tomto projektu probíhaly již během roku 2020. Epidemiologická situace znemožnila realizovat plánované odborné stáže studentů katedry demografie a geodemografie ve firmách mimo fakultu, proto byl pro realizaci stáží využit tento odborný projekt, v němž byly vytvořeny tři samostatně řešené problémové úkoly. Jejich vyřešení značně napomohlo zrychlení a zefektivnění analytického přístupu.

Tato stránka představuje vybrané výstupy vzniklé v rámci tohoto projektu a realizovaných odborných stáží.


Data

Pracováno je z daty ze dvou hlavních zdrojů. Prvním z nich je celosvětová databáze potvrzených případů a úmrtí na COVID‑19 COVerAGE-DB obsahující data za potvrzené případy nákazy a úmrtí tříděná do pětiletých věkových skupin. Především se analýza zaměřuje na Česko a pracuje s daty vykazovanými ÚZIS (https://onemocneni-aktualne.mzcr.cz/covid-19). Doplňkově se využívají data za věkovou a pohlavní strukturu populace z databáze OSN a ČSÚ.


Postupy zpracování v SAS

Ve všech částech kódu je nejprve třeba základní organizace a agregace vstupních dat. Z nástrojů SAS se tedy využívá DATA step a procedura SQL apod. Následuje deskriptivní a základní třídící analýza, ve většině případů za využití procedur FREQ, TABULATE apod. Pro výpočty klouzavých průměrů a agregace užíváme proceduru EXPAND nebo SUMMARY. U analýzy hospitalizací je využívána logistická regrese (procedura LOGISTIC), další práce jsou založeny především na vizualizacích - věkových pyramidách, základních grafech a mapách. Důležitým výstupem jsou animované věkové pyramidy a grafy (procedury GMAP, SGRENDER, GPLOT apod.). Automatizace a animace výstupů je založena na efektivním využití maker a makro-proměnných.



Závěr

Ve velmi krátké době se podařilo ze základů kódů k dílčím analýzám vytvořit samostatné analytické nástroje, které umožní efektivně a obratem využívat data publikovaná často na denní bázi. To je klíčové při poskytování opory rozhodování, hodnocení vývoje i pro interpretaci probíhajících trendů. Některé výstupy jsou publikovány veřejně, jsou k dispozici členům Mezioborové skupiny pro epidemické situace (MeSES).