Bioinformatics는 유전체, 전사체, 단백체, 대사체 등의 다양한 오믹스 데이터를 활용하여 생물의 분자적 기작을 탐구하는 분야입니다. 융합의학기술원은 최신 통계학적 방법론과 시각화 도구를 활용하여 데이터 내에서 유의미한 패턴과 연관성을 찾아내고, 질병의 기작을 이해합니다. 나아가, 질병 예방, 진단, 치료에 기여할 수 있는 새로운 바이오마커를 개발하고 치료 표적을 식별합니다.
개별적인 오믹스 데이터의 통계학적 분석 뿐만 아니라, 단일 세포 오믹스 데이터를 활용하거나 멀티 오믹스 데이터를 통합하는 연구 또한 함께 수행합니다. 이 과정에서 머신러닝, 딥러닝 모델의 개발 및 연구를 진행하고 있습니다. 최신 딥러닝 모델을 활용하여 오믹스 데이터를 분석함에 따라 데이터에 내재된 생물학적, 의학적 정보를 정제, 추출할 수 있습니다. 다양한 데이터와 딥러닝 기술을 활용하며 이전에는 알지 못했던 질병 특이적인 특성을 발굴할 수 있으며, 나아가 질병 기작을 이해하고 치료법을 제시하기 위한 새로운 관점을 제시할 수 있습니다.
국내외 다기관 공동연구의 기반이 되는 오몹-공통데이터모델(Observational Medical Outcomes Partnership-Common Data Model, OMOP-CDM)은 의미와 구조가 표준화된 의무기록 자료입니다. OMOP-CDM을 활용한 다양한 국책 과제와 임상 연구를 수행하고 있으며, 그 영역을 이미지, 영상, 생체신호, 기록지 등 비정형 데이터로 확장하고 있습니다. 이를 통해 관찰연구에서 실제 환자 데이터로 실사용증거(Real World Evidence, RWE)를 창출하여 임상에 기여하고자 합니다.
생체신호의 정확한 해석은 환자의 건강상태 모니터링, 질병 예측 및 조기 진단에 필수적입니다. ECG, EMG, 호흡음 등 환자의 생체신호에 대한 체계적인 수집과 이에 대한 효율적인 라벨링을 통해 데이터베이스를 구축하고 머신러닝, 딥러닝 등 인공지능 기술을 활용하여 생체신호의 복잡한 패턴을 분석하고 변화를 식별하여 질병을 조기에 예측하고 진단하는 모델을 개발하여, 의료의 질 개선과 부작용 예방에 기여함으로써 보다 효율적이고 정밀한 의료 서비스를 실현하고자 합니다.
생병원에서 생성되는 수많은 의무기록지 (입원초진기록지, 마취전상태평가기록지, 퇴원기록지 등)를 인공지능(AI) 기술을 이용하여 처리 및 분석하는 연구를 수행 중입니다. 1) 진료과와 작성 주체에 따라서 다양한 형식으로 작성되는 의무기록지를 자연어 처리(NLP) 및 거대언어모델(LLM)을 활용하여 전처리 및 정규화 연구들이 수행 중에 있습니다. 2) 병원의 실제임상 텍스트 데이터와 의료 도메인 논문 및 말뭉치 텍스트를 기반으로 환자들의 다양한 임상결과(응급실 과정 예측, 기저질환 파악, 환자의 질문에 대한 답변 등)를 예측하는 연구들이 진행 중입니다.