Global Fellowship
I direct the Genome Intelligence Mining Lab, where we focus on uncovering the hidden codes and mechanisms embedded in human genetic information. Our overarching goal is to transform these insights into strategies for understanding complex diseases and improving human health.
In this presentation, I will highlight our efforts to develop predictive and preventive approaches for Alzheimer’s disease (AD). Specifically, we have pursued two complementary directions: (1) building flexible risk-prediction models that integrate multi-modal data, and (2) evaluating the strengths and limitations of each modality to optimize their effective use. We established a genetic risk prediction framework that incorporates common genetic variants (single nucleotide polymorphisms/variants) and identifies AD-associated loci. This genetic risk is dynamically updated by integrating additional evidence from other modalities—such as neuroimaging, plasma biomarkers, and cognitive measures—when available.
Validation using data from the Gwangju Alzheimer’s & Related Dementias (GARD) study showed that this multi-modal framework substantially improves prediction of AD, as measured by amyloid positivity and early cognitive decline, compared to single-modality strategies. These results illustrate how mining genetic information and combining it with multi-modal data can open new avenues for primary and secondary prevention of late-onset Alzheimer’s disease (LOAD).
2025년 11월 18일
언어 산출은 여러 뇌 영역이 복합적으로 작동하는 고도의 계획적 활동입니다. 이러한 이유로, 말소리(speech)는 뇌 및 인지 관련 질환의 조기 선별과 모니터링을 위한 강력한 도구가 될 수 있습니다.
이번 강연에서는 인지 및 사회적 기능을 자동으로 평가할 수 있는 확장 가능한 분석 도구들을 활용하여, 자폐 스펙트럼(autism), 정신병(psychosis, 예: 조현병), 신경퇴행성 질환(neurodegenerative disorders, 예: 알츠하이머병) 등 다양한 임상적 상태에서 나타나는 특이한 언어 및 발화 패턴(speech and language signatures)을 소개합니다.
연구 결과에 따르면, 자동화된 언어 및 발화 지표는 비침습적이면서도 객관적이고 민감한 척도로서, 다양한 임상적 상태를 가진 개인의 선별 및 경과 모니터링에 유용하게 활용될 수 있습니다.
2025년 10월 17일
다섯 번째 튜토리얼 주제인 메타 분석(Meta-analysis)은 기존 연구의 결과를 데이터로 활용하여 분석을 실시함으로써 새로운 정보를 얻는 연구 방법입니다. 이 방법론은 실험을 디자인할 때 검정력 분석(power analysis)을 통해 샘플 사이즈를 계획하는 데도 응용될 수 있습니다.
독일 브라운슈바이크 공과대학교의 Katie Von Holzen 박사님께서 먼저 메타 분석 방법론을 적용한 연구에 대한 강연을 하신 후, 이후 직접 따라 해 볼 수 있는 실습을 진행하실 예정입니다. 좋은 학습 기회가 되었으면 합니다.
Part 1: 강연
Part 2: 직접 따라 하는 실습
2024년 3월 15일
네번째 튜토리얼 주제인 WordSeg는 영유아가 맨처음 단어를 배울 때 물처럼 흐르는 말소리의 입력데이터에서 어떻게 단어경계를 찾아내는지에 관한 내용입니다. 코퍼스의 텍스트를 입력데이터로 다양한 알고리즘을 통해 단어를 분절하여 그 성능을 비교하고, 입력데이터가 아동지향어일 때에 성인지향어에 비해 그 성능이 우월한지, 그렇다면 어떤 이유 때문에 그런 것인지 심도 있게 분석한 내용을 공유합니다.
제1부에서는 조선대학교 Jun Ho Chai 연구교수가 한국어 코퍼스 기반 단어분절학습을 수행한 내용을 영어로 발표하고, 제2부에서는 아주대학교 문성민 연구교수가 한국어 텍스트를 음운규칙을 반영해 영어음소로 바꾸는 G2P (Grapheme-to-Phoneme) 변환 기술및 이를 WordSeg 패키지를 활용해 분절하는 내용의 튜토리얼을 한국어로 진행합니다.
PART I: 양육자의 발화 패턴이 단어 분절을 향상시키는 방식: 한국어 코퍼스를 활용한 계산 모델링 접근법
Jun Ho Chai, 조선대학교 인문데이터과학연구소 연구교수
PART II: Grapheme-to-Phoneme (G2P) 변환 및 WordSeg 패키지 튜토리얼
문성민, 아주대학교 인문과학연구소 연구교수
2023년 12월 15일
세번째 튜토리얼 주제인 ELAN는 오디오 및 비디오 자료에 주석을 추가하고 분석하는 도구로 사용되는 프로그램입니다. 영유아기 아동의 발화 혹은 상호작용 비디오에 다양한 언어 및 비언어적 요소를 주석으로 추가하고, 미디어 파일과 시간을 동기화하여 세부적인 분석을 할 수 있습니다. University College London의 Rana Abu-Zhaya 박사님의 연구발표에 이어 조선대학교의 김수한님이 ELAN 사용법에 관한 발표를 한국어로 진행합니다.
PART I: 초기 언어 환경의 다중 감각적(멀티모달) 특성 분석: 영아와의 자연스러운 상호작용에서 얻은 증거
University College London의 Rana Abu-Zhaya박사
(웹사이트)
PART II: ELAN 사용법에 관한 튜토리얼 (ELAN 웹사이트)
조선대학교 김수한 (석사과정)
2023년 6월 9일
두번째 튜토리얼 주제인 CHILDES는 영유아기 아동에 관한 대화를 전사한 데이터베이스로 웹 명령어나 CLAN을 활용해 원하는 정보를 추출할 수 있고, R/Python의 childes-db 패키지를 활용해 좀 더 개인의 연구 목적에 맞게 사용할 수도 있습니다. MIT의 Stephan Meylan 박사님의 연구발표에 이어 UCLA의 조진영님이 CHILDES 사용법에 관한 발표를 한국어로 진행합니다.
PART I: 아동 지향적 청취: 성인은 어린 아동의 말을 어떻게 이해하는가
MIT 대학의 Stephan Meylan 박사 (웹사이트)
PART II: CHILDES 사용법에 관한 튜토리얼 (CHILDES 웹사이트)
UCLA 조진영 (박사과정) (웹사이트)
2023년 5월 19일
이번 강연에서는 스탠퍼드대학교의 Michael C. Frank 교수가 전 세계 아동 언어 발달 연구를 위한 대규모 데이터 기반 접근법을 소개합니다. 모든 아동은 언어를 배우지만, 그 속도와 방식에는 큰 개인차가 존재합니다. Frank 교수는 이러한 차이를 예측하고, 언어 및 문화권에 따라 공통적으로 나타나는 발달 패턴을 규명하기 위해 Wordbank, Peekbank 등 대규모 공개 데이터베이스를 구축해 왔습니다.
본 강연에서는 이러한 데이터 자원을 기반으로 한 예측 모델링(predictive modeling) 연구를 통해 아동 언어 학습의 변이성과 보편성을 이해하는 최신 연구 성과를 공유합니다.
2023년 4월 12일