코로나19 데이터
왜 데이터가 중요한가? 데이터 사용에 주의가 필요한 이유는 무엇인가?
전 세계 많은 연구자들이 COVID-19 데이터 수집에 헌신하였다. 초기에는 기초감염재상산수(R0), 사망률 및 심지어 정확한 사망자 수에 대해 거의 알려지지 않았다. 예를 들어, 일본은 다이아몬드 프린스 사례에서의 감염자 수를 포함하고 싶지 않았고, 프랑스는 요양원 감염 사례를 세지 않으려 했으며, 중국은 계속해서 감염 및 사망자를 산정하는 기준을 변경하였다. 무신론의 유혹은 고통스런 과학적 탐구보다 강할 것입니다.
그러나 ARIC 연구진은 데이터에는 우리가 상상하는 것보다 더 많은 정보가 담겨있다고 믿는다. 이에 UN WHO, 존스홉킨스 대학, 유럽 질병 예방 통제 센터, Oxford University's policy tracker 등 다양한 출처의 데이터를 수집하기로 결정하였다. 이러한 인식 하에 COVID-19 관련 데이터를 수집하고 사회 경제 변수와 결합한 데이터셋을 제공함으로써 연구자들이 COVID-19과 정치, 경제, 의료 자원 또는 심지어 부패와의 관계를 분석하는 데 도움을 주고자 한다.
![](https://www.google.com/images/icons/product/drive-32.png)
한국 원자료
자료원: 질병관리청
1) 과정
아시아지역정보센터는 질병관리청의 보도자료를 중심으로 데이터셋을 구축하였다. 아시아 지역정보센터는 질병관리청의 데이터 오류를 반영한 데이터셋을 추가적으로 제공한다.
2) 변수
(1) Sheet 1 : Cases in Korea
- CONFIRM : 누적확진자 수
- RELEASE : 누적 격리해제 수
- QUARANT : 격리자 수
- DEATH : 누적 사망자 수
- TOTAL_TEST : 총 검사 수(=검사 진행 + 양성 + 음성)
- UNDER_TEST : 진행 중인 검사 수
- NEGATIVE : 누적 음성 판정자 수
(2) Sheet 2 : Number of COVID-19 vaccination by Province
(3) Sheet 3 : Cases in Korea by Province
(4) Sheet 4 : Cases by gender & age group
(5) Sheet 5 : Cases in Korea_corrected
(6) Sheet 6 : Cases in Korea by Province_corrected
(7) Sheet 7 : Cases by gender & age group_corrected
(8) Sheet 8 : Cases in Seoul by district
(9) Sheet 9 : Stats correction by KCDC
3) 주요 변화
3월 2일부터, 한국 정부는 공식 통계를 0시에 발표하였다.
한국 자료는 요양원 사례, 검역 외국인 사례를 포함한다.
서울특별시는 매일 오전 10시 기준 자료를 발표하였다.
사용가능한 한국 데이터
(업데이트: 2022. 05. 17)1) 과정
아시아지역정보센터는 원자료에 분석 시 유용한 변수를 추가한 데이터셋을 제공한다
2) 데이터: COVID_KOREA
코로나19 통합데이터셋(updated : 2022. 05. 18)
1) 데이터: COVID_WORLD
2021년 3월 23일, 아시아지역정보센터는 2019년까지의 사회경제적 변수를 업데이트하였다. 예를 들어, 2017년 1인당 GDP는 2019년 1인당 GDP로 업데이트되었다. 자세한 내용은 메타데이터를 참고하면 된다.
2) 설명: 자료원
(1) Novel Coronavirus (COVID-19) Cases Data
Johns Hopkins Bloomberg School에서 발표한 확진, 사망, 완치에 대한 시계열 자료를 수집하였음
- 변수 : MVAR1-MVAR12
- 자료원 : Johns Hopkins Bloomberg School of Public Health, HDX
(2) COVID-19 Cases worldwide(- 2020년 12월 14일)
전세계 코로나19 사례의 지리적 분포에 관한 자료
- 변수 : JVAR1-JVAR2
- 자료원 : EU Open Data Portal
(3) Total COVID-19 Tests Performed by Country
"Our data in world"는 확진자, 사망자, 검사 자료 뿐만 아니라 여러 관심 변수를 제공함
- 변수 : SVAR1-SVAR29
- 자료원 : Our data in world, HDX
(4) Stringency of government response
OxCGRT는 17가지 정부 대응에 대한 정보를 수집하고 정부 대응의 엄격성을 Stringency Index로 점수화함
- 변수 : OVAR1-OVAR39
- 자료원 : Hale, Thomas, Sam Webster, Anna Petherick, Toby Phillips, and Beatriz Kira (2020). Oxford COVID-19 Government Response Tracker, Blavatnik School of Government. Data use policy: Creative Commons Attribution CC BY standard.
(5) WHO COVID 19 Global Data
- 변수 : WVAR1-WVAR4
- Source : WHO Coronavirus Disease (COVID-19) Dashboard
(6) 사회경제적 변수
아시아지역정보센터는 다양한 자료원으로부터 사회경제적 변수를 수집함
- 변수 : BVAR1-BVAR16, BKVAR1-BKVAR35
- 자료원 : Word Bank (BVAR1-BVAR16)
3) 데이터: COVID_GOVMEA
4) 데이터: COVID_CITY
(1) COVID-19: Global Cities Dataset
2021년 3월 31일까지의 세계 주요 도시의 코로나19 확진 및 사망 정보를 제공함
주요 도시: 서울, 뉴욕, 런던, 파리, 베이징, 도쿄, 자카르타, 마닐라, 델리)
- 변수 : PVAR1-PVAR3
- 자료원 : 메타데이터 참고
5) 데이터: COVID_Vaccine in Asia Countries
(1) COVID-19: Vaccination in Asia Countries Dataset
2021년 4월 26일까지 아시아 국가들의 백신 데이터 및 공급 계약 정보를 제공함
- 변수 : AVAR1-AVAR35
- 자료원 : 메타데이터 참고