코로나19 데이터

왜 데이터가 중요한가? 데이터 사용에 주의가 필요한 이유는 무엇인가?

전 세계 많은 연구자들이 COVID-19 데이터 수집에 헌신하였다. 초기에는 기초감염재상산수(R0), 사망률 및 심지어 정확한 사망자 수에 대해 거의 알려지지 않았다. 예를 들어, 일본은 다이아몬드 프린스 사례에서의 감염자 수를 포함하고 싶지 않았고, 프랑스는 요양원 감염 사례를 세지 않으려 했으며, 중국은 계속해서 감염 및 사망자를 산정하는 기준을 변경하였다. 무신론의 유혹은 고통스런 과학적 탐구보다 강할 것입니다. 

그러나 ARIC 연구진은 데이터에는 우리가 상상하는 것보다 더 많은 정보가 담겨있다고 믿는다. 이에 UN WHO, 존스홉킨스 대학, 유럽 질병 예방 통제 센터, Oxford University's policy tracker 등 다양한 출처의 데이터를 수집하기로 결정하였다. 이러한 인식 하에 COVID-19 관련 데이터를 수집하고 사회 경제 변수와 결합한 데이터셋을 제공함으로써 연구자들이 COVID-19과 정치, 경제, 의료 자원 또는 심지어 부패와의 관계를 분석하는 데 도움을 주고자 한다.

SNU ARIC : South Korea COVID.xlsx

한국 원자료


자료원: 질병관리청

1) 과정

아시아지역정보센터는 질병관리청의 보도자료를 중심으로 데이터셋을 구축하였다. 아시아 지역정보센터는 질병관리청의 데이터 오류를 반영한 데이터셋을 추가적으로 제공한다.

2) 변수 

(1) Sheet 1 : Cases in Korea

  • CONFIRM : 누적확진자 수
  • RELEASE : 누적 격리해제 수
  • QUARANT : 격리자 수
  • DEATH : 누적 사망자 수
  • TOTAL_TEST : 총 검사 수(=검사 진행 + 양성 + 음성)
  • UNDER_TEST : 진행 중인 검사 수
  • NEGATIVE : 누적 음성 판정자 수

(2) Sheet 2 : Number of COVID-19 vaccination by Province 

(3) Sheet 3 : Cases in Korea by Province

(4) Sheet 4 : Cases by gender & age group

(5) Sheet 5 : Cases in Korea_corrected

(6) Sheet 6 : Cases in Korea by Province_corrected

(7) Sheet 7 : Cases by gender & age group_corrected

(8) Sheet 8 : Cases in Seoul by district 

(9) Sheet 9 : Stats correction by KCDC 

3) 주요 변화

3월 2일부터, 한국 정부는 공식 통계를 0시에 발표하였다.

한국 자료는 요양원 사례, 검역 외국인 사례를 포함한다.

서울특별시는 매일 오전 10시 기준 자료를 발표하였다.

사용가능한 한국 데이터

(업데이트: 2022. 05. 17)
자료원: 질병관리청

1) 과정

아시아지역정보센터는 원자료에 분석 시 유용한 변수를 추가한 데이터셋을 제공한다

2) 데이터: COVID_KOREA

a. 메타데이터

SNU ARIC : Metadata of Usable Korea Data

b. 미리보기

covid_korea_n.csv

c. 다운로드

코로나19 통합데이터셋(updated : 2022. 05. 18)

1) 데이터: COVID_WORLD

2021년 3월 23일, 아시아지역정보센터는 2019년까지의 사회경제적 변수를 업데이트하였다. 예를 들어, 2017년 1인당 GDP는 2019년 1인당 GDP로 업데이트되었다. 자세한 내용은 메타데이터를 참고하면 된다.

a. 메타데이터

SNU ARIC : Metadata of Integrated data

2) 설명: 자료원

(1) Novel Coronavirus (COVID-19) Cases Data 



(2) COVID-19 Cases worldwide(- 2020년 12월 14일)

  • 변수 : JVAR1-JVAR2
  • 자료원 : EU Open Data Portal

(3) Total COVID-19 Tests Performed by Country 

  • 변수 : SVAR1-SVAR29
  • 자료원 : Our data in world, HDX


(4) Stringency of government response


(5) WHO COVID 19 Global Data


(6) 사회경제적 변수

  • 변수 : BVAR1-BVAR16, BKVAR1-BKVAR35
  • 자료원 : Word Bank (BVAR1-BVAR16)
INSCR (BKVAR1-BKVAR3), Varieties of Democracy (BKVAR4-BKVAR8), TRANSPARENCY INTERNATIONAL (BKVAR9), FRASER INSTITUTE (BKVAR10-BKVAR15), World Justice Project(BKVAR16-BKVAR24), Human Development Index(BKVAR25- BKVAR26),  World Governance Indicators(BKVAR27-BKVAR32), Freedom House Index(BKVAR33-BKVAR34), Penn World Table(BKVAR35)

3) 데이터: COVID_GOVMEA

a. 메타데이터

SNU ARIC : Metadata of ACAPS

(1) ACAPS COVID-19: Government Measures Dataset 

  • 변수 : LVAR1-LVAR5
  • 자료원 : ACAPS, HD

4) 데이터: COVID_CITY

a. 메타데이터

COVID-19 Cities

(1) COVID-19: Global Cities Dataset 

  • 변수 : PVAR1-PVAR3
  • 자료원 : 메타데이터 참고

5) 데이터: COVID_Vaccine in Asia Countries

a. 메타데이터

COVID-19 Vaccination

(1) COVID-19: Vaccination in Asia Countries Dataset 

  • 변수 : AVAR1-AVAR35
  • 자료원 : 메타데이터 참고