Bioinformatics Research
Project List
유방암 distant metastasis 분석을 위한 MRI 이미지, RNAseq 통합 Radiotranscriptomics 연구
RNAseq, WES 데이터를 이용한 치료제 반응에 따라 분류된 난소암 환자군 차이 통합 분석
유방암 subtype 내에서 병리 이미지를 이용한 고위험/저위험 환자 분류: 서울대학교병원 병리 이미지 + TCGA 병리 이미지 + TCGA Multiomics 데이터 통합 분석
DNA methylation 패턴을 활용한 CUPS(cancer of unknown primary site) 환자의 원발 장기 예측
scRNAseq 데이터를 이용한 mouse renal macrophage 분석
TCGA RNA-seq 데이터를 이용한 Sample-specific co-expression network 구축을 통한 암종별 subtype 분석
Adrenal Cushing’s syndrome에 대한 RNA-seq 데이터 분석
Pheochromocytoma RNA-seq 및 Exome-seq 데이터 통합 분석
Craniopharyngioma RNA-seq, Exome-seq 및 Mass-spectrometry 데이터 통합 분석
Peritoneal Recurrence and Metastasis in Patients with Gastric Cancer
Repeatitive sequence(예: LINE1, Alu)와 관련된 DNA methylation 분석
Topological Data Analysis (TDA) 방법론을 활용한 multi-omics data clustering 및 single-cell trajectory 연구
Logical Data Analysis (LDA) 방법론을 활용한 multi-omics data classification 및 composite biomarker 발굴 연구
Digital spatial profiling을 이용한 Lung cancer 연구
암 전이 여부 및 예후에 따른 cfDNA에서의 Variant allele frequency 변화 연구
해부학적 위치에 따른 암 분류 및 이에 대한 Hypoxia 연관 유전자 발현 기반 예후 예측 모델 연구
single cell RNA-seq 기반 염증 정도에 따른 장 상피세포/T 세포의 유전자 발현 및 Cell-cell interaction 변화 연구
Bladder papilloma 내 invasive 여부에 따른 mRNA expression 차이 분석
소음에 따른 Auditory tissue 내 micro RNA 발현 분석
IgA Nephropathy 환자의 WES+microbiome 데이터 분석 연구
LC-MS로 생성된 Metabolomics 데이터 분석을 위한 R shiny 활용 web app 개발
Ongoing Projects
scMILD: 단일세포 전사체 기반 환자/샘플 분류 모델
개요
scMILD는 약한 지도 학습 기반의 프레임워크로, 샘플을 가방(bag)으로, 세포를 인스턴스(instance)로 취급
샘플 수준의 상태에 대한 레이블을 활용해, 샘플의 상태 (Sample condition)와 연관된 세포 아군 (Cell subpopulation)을 식별
Teacher branch: 다양한 단일 세포 RNA-seq 데이터셋에서 평가한 결과, scMILD는 기존 모델들을 능가하는 샘플 분류 성능을 보였음
Student branch: 세포 수준에서 샘플 상태 연관성 (Sample condition association) 을 정량화하여 상태 특이적 세포 아군(Condition specific cell subpopulation)을 식별할 수 있음
방법론
모델 학습
Teacher branch: 각 세포의 특성을 샘플 수준의 특성으로 변환, 샘플 수준의 분류 예측을 수행함.
Student branch: Teacher branch에서의 attention module을 통한 cell의 attention score를 예측함
Encoder: 두 branch 사이에서 공유됨
하위 분석
학습된 Encoder, attention module을 통해 세포타입별 Attention score를 측정하고, 이를 바탕으로 subgrouping을 진행.
subgroup에 대한 다양한 분석을 통해 검증 진행
샘플 분류 성능
진행중인 연구 주제) 멀티오믹스 기반 COVID19 중증도 분류 모델
진행중인 연구 주제) 면역 세포에 대한 Single cell RNA sequencing 분석 (Collaboration with Pf. 나이랑)
진행중인 연구 주제) Host cell에 따른 Acinetobacter pathogenesis 분석 (Collaboration with Pf. 염진기)
진행중인 연구 주제) Bacterial Dormancy 관련 멀티오믹스 분석 (Collaboration with Pf. 염진기)
진행중인 연구 주제) Finding Effective Spatial Correlation: Applying Geographical Analysis in Spatial Transcriptomics
진행 예정 연구 주제) 오믹스 데이터 기반 생물학적 Pathway Perturbation Scoring method 개발
진행 예정 연구 주제) 생물학 지식 기반 그래프의 Patch 기반 GCN
진행 예정 연구 주제) 멀티오믹스 데이터의 잠재 요인 추출 기법