Project Introduction
1. 비독립적 표본 기반 차세대 염기서열자료의 통합분석모형 개발 연구
연구개발의 중요성
차세대 염기서열 분석(Next Generation Sequencing; NGS) 기술은 유전체 연구에 획기적인 변화를 가져왔으며, 특히 전산학 및 생물정보학, 통계학적 방법을 활용한 새로운 연구 주제가 활발히 논의되고 있음.
이러한 유전체 연구는 질병 원인 유전자 발굴 뿐 아니라 질병의 예후·예측인자로의 적용 가능함에 따라 정밀의료·개인 맞춤형 치료 실현을 위한 기반 연구로 그 중요성이 대두되고 있음.
연구 목표
본 연구는 차세대 염기서열 자료를 활용하여 질병 및 다양한 복합질환과의 연관 분석 연구를 수행함에 있어, 표본이 독립이 아닌 경우(가족 코호트 및 쌍둥이 코호트, 다중 코호트 자료 등)를 고려한 통계분석 모형을 개발하고자 함.
공통변이(common variant)와 희귀변이(rare variant) 정보를 결합한 새로운 통계 모형 개발
유전자-유전자 상호작용 모형 개발
유전자-환경요인 상호작용 모형 개발
개발과정
1차년도: 비독립 표본기반 차세대 염기서열 자료에 생산된 공통변이와 희귀변이 정보를 통합하여 질병과 연관된 마커 발굴을 위한 고급 통계분석모형 개발
기존 희귀변이에 기반한 후보 유전자 발굴 모형과 비교하여, 새롭게 제안하는 공통·회귀변이 통합 분석모형의 장단점에 대한 비교 분석함. 기개발한 통계모형을 확장하여 다음과 같은 다양한 형태의 모형으로 고급 통계분석 모형을 개발 하고자 함.
2차년도: 1차년도에서 개발한 통합분석 모형을 유전자-유전자 상호작용 모형으로 확장
공통변이와 희귀변이를 유전자(gene) 수준으로 요약하고, 요약된 유전자 요인들 간의 상호작용 모형을 통합적으로 고려한 새로운 통계모형을 개발할 예정임. 1차년도에 개발한 통계모형을 상호작용 모형으로 확장하여 다음과 같이 개발하고자 함.
3차년도: 유전자-환경요인 상호작용 모형 개발 및 시각화 프로그램 개발
2차년도에 개발한 비독립 표본에 기반한 차세대 염기서열 자료에 적용 가능한 유전자-유전자 상호작용 모형을 유전자-환경요인 상호작용 모형으로 확장 및 실제 시퀀싱 자료에 적용하여, 개발 모형의 효용성을 검증하고자 함.
본 연구에서 개발된 시각화 프로그램은 질병 지표 발굴 및 통합모형의 분석 결과에 생물학적 지식 기반의 정보를 연결함으로써 분석 결과의 생물학적 해석을 도와주고, 통계학적 및 생물학적인 복합 해석을 가능하게 하는 직관적인 인터페이스와 시각화를 제공하게 될 것임.
기대효과
본 연구에서 개발하게 될 다양한 통계분석 모형 개발 원천 기술은 시퀀싱 기술발달 및 시퀀싱 비용 감소에 따라 급격히 증가하고 있는 차세대 염기서열자료 및 한국인칩 자료의 효과적인 분석에 크게 기여할 수 있음.
본 연구에서 개발하게 될 분석 기술은 보다 정교한 개인별 질환 진단 및 약물 처방 등 정밀의료 구현에 필요한 기반 연구임. 따라서 개인 맞춤 의학 시대에 발병 전 맞춤형 관리·치료 목적으로 본 연구의 결과물을 활용함으로써 유전체 관련 질환, 약물유전체 연구자 및 그룹에서 효과적으로 활용할 수 있음. 또한, 근친 교배한 동물자료로도 적용이 가능하여, 분석 기술의 활용도가 높을 것으로 기대됨.
2. 마이크로바이옴 기반 인공지능 질병 예측모형 개발 연구
연구개발의 중요성
헬스케어 산업이 치료에서 예방 및 건강관리 중심으로 발전함에 따라 의료 패러다임도 변화하고 있음. 의료서비스는 Predictive(예측), Preventive(예방), Personalized(개인화), Participatory(참여)의 4P 중심으로 전환될 전망임. 정밀 맞춤의료 산업은 전 세계적으로 매년 10% 이상의 성장률을 보이며, 지속적인 수요 확대, 오믹스 기술과의 융합을 통한 응용 가능한 범위의 확대 등을 바탕으로 이에 따른 사회적, 경제적 가치는 매우 크다고 할 수 있음.
마이크로바이옴 기작(mechanism)에 대한 연구를 바탕으로 밝혀낸 바이오 마커는 조기진단에 유용하게 사용 가능하기 때문에, 마이크로바이옴을 활용한 질병 연구가 활발하게 진행되고 있음. 특히, 인공지능 모형을 활용한 마이크로바이옴 기반 질병예측모형 개발은 한 단계 더 정밀하게 질환을 예측하는 핵심 원천기술임과 동시에 급격하게 성장하는 글로벌 정밀의료 시장에서 중요한 한 축을 담당할 것으로 예상됨.
연구 목표
본 연구과제는 마이크로바이옴 기반 인공지능 질병 예측모형을 개발하는 것이 목표임. 본 연구팀은 공개 마이크로바이옴 데이터베이스(HMP, MetaHIT 등)를 바탕으로, 마이크로바이옴 데이터 및 임상자료, 역학자료 등을 통합하여 각 개인별로 특정 질환에 대한 위험도를 예측하기 위한 수학적‧통계적 모형을 개발하고자 함.
질병 예측인자 발굴을 위한 인공지능 기반 연구
설명가능 인공지능(Explainable AI, XAI) 질병 예측모형 개발 연구
시각화 소프트웨어 개발 및 통합 데이터베이스(DB) 구축
개발과정
1차년도: 머신러닝/딥러닝 모형에 기초한 질병 예측 인자 발굴 모형 개발 / 예측인자 발굴 결과의 데이터베이스(DB) 구축
마이크로바이옴 기반 질병 예측인자 발굴을 위해 제안된 다양한 머신러닝/딥러닝 모델 등을 적용하고자 함.
대표적인 공개 데이터베이스 중 하나인 휴먼 마이크로바이옴 프로젝트(Human Microbiome Project, HMP) DB 정보를 활용하고자 함. 먼저, 건강한 집단의 16S rRNA (V3~V4) 데이터의 Taxa 분류 및 각 인체 조직 별 마이크바이옴들의 균 군집 분류 및 α-diversity 정보를 통합 DB에 반영하고, 이를 통해 임신 및 조산, 염증성 장질환(IBD), 제 2형 당뇨병(T2D) 등 다양한 질병 환자군과의 특성을 비교하고자 함
2차년도: 설명가능 인공지능(XAI) 질병 예측모형 개발 연구
설명가능 인공지능(XAI) 질병 예측모형 개발 연구
3차년도: 시각화 소프트웨어 개발 및 통합 데이터베이스(DB) 구축
본 연구과제에서 수행될 질병 예측인자 발굴 및 예측모형 분석 결과를 수학‧통계학적 관점이 아닌 생물학적 관점에서 설명하기에는 많은 어려움이 있음. 이러한 어려움을 극복하기 위해, 분석 결과에 대해 생물학적 지식 기반의 정보를 연결함으로써, 생물학적 해석을 도와줌은 물론, 수학적 및 통계학적, 생물학적인 복합 해석을 가능하게 하는 web 기반의 시각화 소프트웨어를 개발할 것임.
기대효과
본 연구과제를 통해 개발될 인공지능 분석 기법은 높은 신뢰성과 정확성을 가지는 오믹스 마커를 발굴하고 이를 이용한 예측모형을 제공함으로써 임상적용이 가능한 수준의 신뢰성 있는 결론을 도출하고, 이를 통해 국내의 마이크로바이옴 자료 분석기술력을 한 단계 끌어올릴 것으로 기대됨.
본 연구과제의 목표 중 하나인 마이크로바이옴 분석 소프트웨어는 인공지능 분석 – 예측모형 – 임상적용의 세 단계를 통한 다양한 질병 예측을 제공할 수 있으며, 이러한 목적을 달성하기 위해 개발될 다양한 수학적, 통계적, 전산적 기술들은 추후 플랫폼의 확장 및 신뢰성 확보에 크게 기여할 것임.
본 연구과제를 통해 개발될 분석 소프트웨어는 완성도 높은 복합질환 예측 솔루션으로써 향후 국내 임상연구 및 임상적용 관련 산업의 기틀이 되어, 마이크로바이옴과 관련된 다양한 경제적, 산업적 부가가치를 창출할 수 있을 것으로 기대됨.