Analýza počtu hospitalizovaných COVID+, Česko
Hlavní část zpracování: Kateřina Martínková, NMgr. Demografie

Cílem tohoto projektu bylo vytvořit SAS kód, který bude produkovat základní statistickou analýzu pro tento typ datového souboru. Cílem také bylo, aby tento kód byl automatizovaný, tedy aby bylo možné využít přímo stažený soubor, bez nutnosti dalších změn.


Data

V projektu byla využita data z ÚZIS za hospitalizované pacienty s Covid-19 z jednoho dne (COVID‑19: Datové sady pro prediktivní modelování, https://onemocneni-aktualne.mzcr.cz/api/v2/covid-19). Při tvorbě tohoto SAS kódu bylo využito několik denních datových souborů za hospitalizované od začátku listopadu roku 2020 až po polovinu února roku 2021. Kód je však vytvářen tak, aby mohla být jednoduše využita data i za jiné dny. V popisu na této stránce je kód využit na novější data.

Jednalo se o agregovaná data, která v sobě obsahovala podrobnější charakteristiky pacientů. Kromě pohlaví a věkové skupiny zde bylo uvedeno, zda měl pacient komplikace či nikoliv, za byl umístěn na jednotku intenzivní péče (JIP), jaká zdravotní péče mu byla poskytnuta (kyslík, UPV, ECMO) nebo jak dlouho byl v nemocnici hospitalizován (1 den, 2 dny, 3─7 dní, 8─14 dní nebo 15+). V datovém souboru bylo také uvedeno, kolik pacientů bylo do daného dne z nemocnice propuštěno, kolik jich bylo aktuálně hospitalizováno a kolik jich do daného dne zemřelo (proměnná stav). Data byla také rozdělena podle ORP a okresů, tudíž je bylo možno využít také pro vytváření mapových výstupů.


Řešení a výstupy

První část kódu se věnuje třídícím tabulkám. Z dat jsou vytvářeny základní přehledy a struktury založené na různých charakteristikách. Využíváno je především třídění podle věku pacienta a délky hospitalizace.


Tabulka 1

V Tab. 1 (data k 20. 3. 2021) je zobrazen počet a podíl pacientů podle věkové skupiny a jeho stavu, tedy zda byl do daného dne propuštěn, zemřel nebo je v daný den aktuálně hospitalizován.

Nejvíce pacientů bylo evidováno ve věku 65 let a více, jednalo se o téměř 70 % ze všech pacientů. Do daného dne 19,5 % hospitalizovaných pacientů zemřelo, většina byla ve věku 65 a více let. Pacientů ve věku do 20 let bylo relativně velmi málo, zemřeli z nich 4, k danému dni je 40 hospitalizováno.

Tabulka 2

V Tab. 2 jsou zobrazeny počty aktuálně hospitalizovaných pacientů (k 20. 3. 2021) podle věkových skupin, poskytnutého typu léčby a aktuální délky hospitalizace.

Tabulka 3

V Tab. 3 jsou zobrazeny počty aktuálně hospitalizovaných pacientů (k 20. 3. 2021) podle věkových kategorií a výskytu komplikací. V tabulce je uveden jak počet, tak podíl pacientů v dané skupině. Vypočítána jsou řádková procenta (podíly pacientů dle výskytu komplikací v dané věkové skupině) a sloupcová procenta (podíly pacientů s nebo bez komplikací dle věku).

Patrné je, že z aktuálně hospitalizovaných pacientů do 20 let jsou u 6 zaznamenány komplikace. Jedná se o 15 % z aktuálně hospitalizovaných v tomto věku. Ve věkové kategorii 20–64 let jsou komplikace zaznamenány u 38,8 % aktuálně hospitalizovaných, ve věku 65 a více let je to u 28,1 %.

Ze všech pacientů s komplikacemi je aktuálně 0,2 % ve věku do 20 let, 37,9 % ve věku 20–64 let a 61,9 % ve věku 65 a více let.

Nejčastěji se v analyzovaném dnu můžeme setkat s pacientem ve věku 65 a více let bez komplikací - těchto pacientů je 49,6 % ze všech aktuálně hospitalizovaných.

Jako jeden z dalších výstupů byl využit skládaný graf. Na Obr. 1 je touto formou zobrazen počet aktuálně hospitalizovaných pacientů podle věkových skupin a délky hospitalizace. Na tomto obrázku je názorně ukázán růst zastoupení nejstarších pacientů spolu s rostoucí délkou hospitalizace (kromě hospitalizovaných 1. den). Naopak podíl pacientů ve věku 20─64 let při delší hospitalizaci klesá. Zastoupení nejmladších pacientů je ve všech délkách hospitalizace zanedbatelné.

Pro analýzu datového souboru byla využita také logistická regrese. Zde je ukázka jednoho z použitých kódů. Jako závisle proměnná je uvažován stav (kategorie "Propuštěn" a "Zemřel") s referenční kategorií „Propuštěn“.

Ukázka kódu

Jako nezávisle proměnné jsou zde branné pohlaví, věkové kategorie, hospitalizace na JIP, podání kyslíku, využití UPV a ECMO a délka hospitalizace (u každé z těchto proměnných je také definována referenční kategorie).

Pro každou nezávisle proměnnou je samostatně exportován odhad poměru šancí (rizika úmrtí vs. pravděpodobnosti ukončení hospitalizace propuštěním). Při analýze se neberou v úvahu aktuálně hospitalizovaní pacienti, tedy analýza probíhá na ukončených hospitalizacích. Uvažováni nejsou také pacienti s neudaným věkem (příkaz where).

Celkem k 20. 3. 2021 vstoupilo do analýzy 102 778 hospitalizovaných pacientů, jejichž hospitalizace byla ukončena propuštěním (80 935 případů) nebo úmrtím (21 843 případů). V modelu se všechny uvažované vysvětlující proměnné potvrdily jako statisticky významné na uvažované 5% hladině významnosti.


Tabulka 4

Jeden z výstupů logistické regrese jsou již zmiňované poměry šancí (Tab. 4). V tomto případě se jedná o poměr šancí (pravděpodobností) úmrtí a propuštění (referenční kategorie).

Pacienti ve věku 65+ tak měli 8,5x vyšší riziko zemřít (v porovnání s pravděpodobností propuštění) než pacienti ve věku 20─64 let (referenční kategorie proměnné věk). Zajímavé výsledky lze vidět i u délky hospitalizace (referenční kategorií je hospitalizace 1. den). Nejnižší riziko úmrtí v porovnání s pravděpodobností propuštění měli pacienti, kteří byli hospitalizovaní 8─14 dní a 15 a více dní. Naopak nejvyšší riziko úmrtí měli pacienti hospitalizovaní 1 nebo 2 dny. Tedy dalo by se říct, že čím déle byl pacient hospitalizován, tím měl menší riziko úmrtí a větší šanci být propuštěn.


Poměry šancí z Tab. 4 graficky

Kromě uvedeného se potvrzuje menší riziko úmrtí místo propuštění u žen v porovnání s muži, očekávatelně je také velmi nízké riziko úmrtí u nejmladší věkové skupiny, nižší riziko úmrtí je také ve skupině 20–64letých v porovnáním se skupinou osob ve věku 65 a více let.

Pokud byla analyzovaná osoba hospitalizována na JIP, pak riziko úmrtí v porovnání s propuštěním bylo zhruba 3x větší, než u osob, které na JIP hospitalizovány nebyly. Při využití kyslíkové terapie bylo riziko úmrtí 2,2x vyšší než bez využití této léčby, využití UPV zvyšovalo riziko úmrtí na 5,1 a ECMO na 2,4násobek.

Díky tomu, že byly k dispozici data za více časových úseků (více dní), bylo možné provést i analýzu změn v čase. Pro analýzu byl vypočítán základní ukazatel: index změny mezi dvěma časovými úseky (počítán jako podíl dvou hodnot). Změna je počítána vždy ke stejnému výchozímu datu (období jedna). V tomto případě se jedná o 6. 2. 2021. Další období jsou pak 13. 2. 2021 (období 2), 19. 2. 2021 (období 3), 27. 2. 2021 (období 4), 6. 3. 2021 (období 5), 13. 3. 2021 (období 6) a 20. 3. 2021 (období 7). Kromě těchto bazických indexů byly spočítány i indexy řetězové, tedy poměr vždy k předchozímu období. Uživatel si sám může nadefinovat, co bude zobrazeno v tabulkách nebo mapových výstupech.

Jak již bylo zmíněno, tak datový soubor obsahuje také příslušnost k okresu či ORP. Na základě toho bylo možné některé ukazatele zobrazit také pomocí mapy.

Mapa 1

V mapovém výstupu jsou indexy změny počtu aktuálně hospitalizovaných mezi prvním a sedmým obdobím, tedy mezi 6. 2. 2021 a 20. 3. 2021.

Ve většině okresů je počet aktuálně hospitalizovaných přibližně stejný jako ve výchozím období (pokles je patrný okolo Prahy, v Karlovarském kraji a v některých okresech na severu republiky. Naopak nárůst na dvoj až čtyřnásobek je zřejmý v některých krajích na jihu Čech a okresech (Děčín, Litoměřice, Mělník, Mladá Boleslav, Nymburk a Kolín) a také na jihu Moravy, Jeseníku a v Bruntálu.

Je také možné zobrazení extrémních hodnot indexu změny, zde minima a maxima indexu změny počtu zemřelých mezi 6. 2. 2021 a 20. 3. 2021.

Zvýšení jen o 11,6 % je dosaženo v Kroměříži (CZ 721), maxima jsou dosažena v okresech Klatovy (CZ 322), Rokycany (CZ 326) a Tachov (CZ 327) - ve všech třech okresech se od 6. 2. 2021 dosud zaznamenaný počet hospitalizovaných zemřelých osob více než zdvojnásobil.

Mapa 2

V mapovém výstupu jsou indexy změny počtu zemřelých mezi prvním a sedmým obdobím, tedy mezi 6. 2. 2021 a 20. 3. 2021.

Extrémní hodnoty změny počtu aktuálně hospitalizovaných za poslední týden, tedy od 13. 3. 2021 do 20. 3. 2021. Maxima dosahují Strakonice, Jeseník a České Budějovice. Obecně nárůst zaznamenává především Jihočeský kraj.

Mapa 3

V mapovém výstupu jsou indexy změny počtu aktuálně hospitalizovaných mezi šestým a sedmým obdobím, tedy mezi 13. 3. 2021 a 20. 3. 2021. Jde fakticky o změnu za poslední týden.

Poslední mapový výstup se opět vztahuje k poslednímu období (20. 3. 2021) a využívá výše uvedenou logistickou regresní analýzu. Jsou modelovány poměry pravděpodobností zemřít vs. být propuštěn a to pro věkové kategorie 65 a více let proti kategorii 20–64 let. Výsledky jsou standardizovány na všechny další výše uvedené vysvětlující proměnné (způsob léčby apod.). Výpočet probíhal samostatně podle okresů.

Největší poměr pravděpodobností je zaznamenán v Uherském Hradišti (CZ 722) - osoby ve věku 65 a více let zaznamenaly v tomto okrese 17,5x větší pravděpodobnost úmrtí než propuštění v porovnání s osobami ve věku 20–64 let. Nejmenší je tento poměr ve Znojmě (4,4x)

Mapa 4


Závěr

Byl vytvořen SAS kód, který poskytuje tabulkové, grafické i mapové výstupy, zpracovává základní deskriptivní statistiky, statistickou analýzu (logistickou regresní analýzu) i základní analýzu prostorových specifik. Jeho možnosti tak lze využít pro další analýzy datových souborů tohoto typu s možností snadného rozšíření o sofistikovanější přístupy a výstupy.