O podacima

Podaci o slučajevima za Republiku Hrvatsku

Možda će nekome upasti u oči da podaci o oboljelim osobama prikazani na izvještajima nisu baš u skladu s podacima o stanju pandemije koje dnevno objavljuje Stožer CZ RH. Razlog tomu je što podatke o slučajevima (pozitivnim PCR testovima) ova stranica preuzima iz baze strojno čitljivih podataka na stranici koronavirus.hr (pa da ne pišem previše, na linkanoj stranici nalazi se jedan dio objašnjenja navedenih razlika).

Ono što tamo ne piše je da se strojno čitljivi podaci nadopunjuju i unazad pa će ponekad trebati i više od tjedan dana da se poneki zaostali podatak pojavi u toj javno dostupnoj bazi. Također, jedna važna razlika između tih podataka i dnevnih objava je da se oni evidentiraju prema datumu testiranja, a ne prema datumu objave. Konačni rezultat je da se brojka koju stožer objavljuje npr. na 28. ožujka 2021. godine o 1.321 novozaraženoj osobi u bazi na kojoj se temelje izvještaji na ovoj stranici pojavljuje kao 1.352 novozaražene osobe za datum 27. ožujka 2021. godine dok ju je HZJZ u svom tjednom izvješću objavljenom 30. ožujka 2021. godine objavio kao 1.350 osoba za 27. ožujka 2021. godine. Sve u svemu - to ispada dosta konfuzno. Kako bih bar jedan dio problema umanjio, javno dostupan podatak iz baze o novozaraženim osobama za posljednji dostupni datum ne uzimam u obzir jer je u pravilu sasvim nepotpun. Npr. 2. travnja 2021. godine u 18:38 kad pišem ovaj tekst posljednji zapisi u strojno čitljivim podacima o zaraženim osobama na koronavirus.hr odnose se na 31. ožujka 2021. godine i ima ih samo 267 iako je stvarna brojka bliže 2.422 zaražene osobe (koliko je stožer objavio 1. travnja 2021. godine za prethodna 24 sata).

Konačno, ta javno dostupna baza podataka povremeno, zbog tehničkih ili administrativnih problema ne bude ažurirana i po više dana (što točno utječe na to nije mi poznato). Power BI skup podataka za ovo web mjesto automatski povlači podatke s koronavirus.hr 3 puta dnevno - u 03:00, u 12:30 i 15:00. Zato je moguće da se podaci u izvješćima i tijekom dana promijene ukoliko je u međuvremenu ažuriran njihov izvor na koronavirus.hr.

Nadopuna 7. travnja 2021. godine

Obzirom da prema više različitih izvora ni na svijetu pa ni u Republici Hrvatskoj u 2020. i 2021. godini nije bilo osoba starih 120 ili više godina, iz podataka o slučajevima su isključeni zapisi s godištem ranijim od 1901. što se u trenutku pisanja ove nadopune odnosi na 4 zapisa (3 muškarca 1900. godište i 1 muškarac 1899. godište).

Nadopuna 27. studenoga 2022. godine

Već dulje vrijeme objavljeni strojno čitljivi podaci o slučajevima ne sadrže podatak o županiji pozitivne osobe. Iz tog razloga izvještaji na Koroniki koji se oslanjaju na podatak o županiji mogu se prikazati samo na razini Republike Hrvatske, ukoliko je to izvještajem predviđeno.

Podaci o preminulima za Republiku Hrvatsku

Izvor podataka o preminulima su u najvećoj mjeri objave na Twitter računu @koronavirus_hr iz kojih su oni ručno prekucani u Excel tablicu u kojoj ih nastojim dnevno ažurirati. Ne znam zašto ti podaci dosad nisu objavljeni u obliku strojno čitljivih podataka ni zašto se makar na Twitteru ne objavljuju u nekoj dosljednoj strukturi koju bi se onda moglo propustiti kroz neku skriptu i izvući podatke. Kako za neke preminule osobe podaci nikad nisu niti objavljeni ukupni broj preminulih koji dnevno objavljuje stožer kontinuirano je malo veći od broja koji će se pojavljivati na ovoj stranici. A ukoliko ja neki dan neću imati vremena ručno ažurirati Excel tablicu - podaci u izvješćima kasnit će i dodatno.

Nužno moram napomenuti i da se podaci o županiji u kojoj je evidentirana smrt odnose na županiju u kojoj se nalazi bolnica koja je tu smrt prijavila, jer podatak o županiji prebivališta preminulog nije dostupan (tako npr. ispada da u Zagrebačkoj županiji uopće nema preminulih). O tome je potrebno voditi računa ukoliko netko namjerava uspoređivati podatke o oboljelima i preminulima po županijama na temelju ovih izvora.

Zbirni podaci o učinjenim testovima, pozitivnim osobama, hospitalizacijama i preminulima za Republiku Hrvatsku

Izvor ovih podataka je Excel tablica koju u sklopu svog COVID-19 izvješća jednom tjedno objavljuje HZJZ. Podaci obuhvaćaju razdoblje od 15. travnja 2020. godine do kraja posljednjeg završenog tjedna. Pri tome se izvješće za protekli tjedan u pravilu objavljuje utorkom pa bi podaci na ovoj stranici od srijede nadalje trebali uključivati i protekli tjedan. Podaci o pozitivnim osobama u ovoj tablici podudaraju se s objavljenim strojno čitljivim detaljnim podacima o slučajevima u trenutku objave tablice.

Podaci o tjednoj procijepljenosti po dobnim skupinama

Ovi podaci pripremljeni su temeljem dnevnih izvješća o cijepljenju HZJZ-a. Zbog nedostataka, nedosljednosti i nepotpunosti informacija objavljenih u spomenutim izvješćima populacije osoba prema primljenoj dozi cjepiva je za neke statuse cijepljenja i neka razdoblja bilo nužno procijeniti. Pripremljeni podaci dostupni su u Excel tablici koju ću povremeno ažurirati.

Međunarodni podaci

Glavni izvor općih međunarodnih podataka o pandemiji je CSV datoteka koju objavljuje i svakodnevno osvježava Our World in Data. Glavni izvor općih ekonomskih pokazatelja su izvještaji Svjetske banke. Podaci iz navedenih izvora se u izvještaje na ovom web mjestu uvoze dva puta dnevno, u podne i u ponoć.