Health Data Science LAB
Health Data Science LAB
Research Areas
Causal Inference
보건학에서는 데이터 분석결과를 정책 수립을 위해 직접적으로 활용하는 경우가 많습니다. 정책 수립의 관점에서 보면 설명변수에 개입(intervention)이 들어갈 때 결과변수에 미치는 효과의 크기를 파악하는 것이 중요하고 이를 위해서는 인과성 추론이 필요합니다. 어떠한 상황에서 데이터를 통해 개입 효과를 파악할 수 있는지에 대한 조건 분석, 해당 조건이 위배될 때 생길 수 있는 편의(bias) 분석 등을 진행합니다. 특히 모형의 올바른 지정(specification)을 완화시켜나가면서 안전한 분석을 수행할 수 있는 방법을 개발합니다. 또한 의료, 보건 및 산업 분야에 필요한 다양한 인과성 추론 응용연구를 진행합니다.
In public health sciences, empirical analysis results are often directly used for policy formulation. From the perspective of policy-making, it is important to assess the magnitude of the effect of intervention on the outcome variable of interest. Causal inference is useful for this purpose. We study conditions to identify intervention effects in various observational studies, and conduct sensitivity analysis when those conditions are violated. Particularly, we develop methods to perform safe analysis while relaxing the correct specification of the model. Additionally, various applied research on causal inference required in medical, health, and industrial fields is conducted.
Application of machine learning techniques in public health sciences
보건학에서는 다양한 차원의 예측 문제가 있습니다. 다음 주 서울시의 특정 질환 신규 확진자 수를 예측하는 경우부터 만성 질환자의 예후를 예측하는 것까지 데이터를 이용한 건강 관련 예측문제는 주변에 매우 다양한 형태로 주어집니다. 최신의 기계학습 기법등을 활용해서 예측성능을 개선하는 것은 물론, 복잡한 모형의 결과를 인간이 쉽게 이해할 수 있도록 해석가능한 형태로 변환하는 다양한 응용연구를 진행합니다.
In public health sciences, there are various prediction problems. From predicting the number of new confirmed cases of a specific disease in Seoul next week to forecasting the prognosis of chronic patients, health-related prediction problems appear in a wide range of forms. We conduct various application studies to improve prediction performance using state-of-the-art machine learning techniques and to transform the results of complex models into interpretable forms that humans can easily understand.
Likelihood inference for complex health data
가능도 함수를 이용하여 건강 관련 데이터에 대한 다양한 종류의 모델링과 데이터 분석을 수행합니다.
Using likelihood functions, various types of statistical modeling and data analysis are performed on health-related data.
Analysis of complex health survey data
국가 기관은 다양한 조사(survey) 를 통해 보건의료 빅데이터를 만들고 있습니다. 이 때 조사 디자인이 적절하게 고려되지 않은 분석은 거짓된 발견(false discoveries) 이 많기 때문에 연구 결과의 신뢰도에 큰 영향을 줄 수 있습니다. 보건의료 데이터를 분석할 수 있는 기존의 도구들은 아직까지 조사 디자인을 충분히 고려하고 있지 않기 때문에 이에 대한 방법론을 개발하고 여러 응용연구를 진행하고 있습니다.
National institutions are generating health big data through various surveys. However, analyses that do not adequately consider survey design can lead to many false discoveries or significantly impact the reliability of research results. Existing tools for analyzing healthcare data still do not adequately consider survey design, so we develop methodologies to address this issue, along with various application studies.
Analysis for cohort studies after public health disaster
건강 재난 사건이 발생한 후 위험 요인이 질병 발생에 어떠한 영향을 주는지 보기 위해 코호트가 구축됩니다. 이 때 코호트는 피해자 신청을 통해 구축되기 때문에 일반적인 랜덤 표본으로 볼 수 없으며 선택 편의(selection bias)를 고려해야 합니다. 대표적으로 가습기 살균제 건강 재난과 같은 대형 사건이 벌어진 후에 구축된 코호트 분석에 필요한 통계 및 역학적 방법론을 개발합니다.
After a health disaster event occurs, cohorts are established to observe how risk factors influence disease occurrence. In this case, cohorts are constructed through victim enrollment, so they cannot be considered as typical random samples, and selection bias must be taken into account. Specifically, statistical and epidemiological methodologies are developed for cohorts established after major events such as the humidifier disinfectant health disaster.
Meta analysis and reproducible research
메타 연구는 특정한 연구 가설에 대해 수행된 기존 연구들을 종합하는 대표적인 분석 기법 중 하나입니다. 연구간 이질성 검정, 출간 편향(publication bias) 검정, 메타 회귀분석 등 연구결과의 논리적 수준을 한 단계 높이기 위해 필요한 방법론을 개발합니다. 또한 연구의 재현성 및 전반적 평가에 필요한 방법론을 개발합니다.
Meta-analysis is one of the prominent analysis techniques that integrates existing studies conducted on specific research hypotheses. We develop methodologies to enhance the logical level of research findings, including tests for heterogeneity between studies, detection of publication bias, and meta-regression analysis. Additionally, we also develop methodologies for reproducibility and overall evaluation of research.