본 연구의 주 목적 중 하나는 한국어 가정에서의 영유아의 음소 습득, 단어 분절, 문장 이해 과정을 체계적으로 연구하는 것입니다. 이를 위해 시선 추적, HPP (Headturn Preference Procedure), BabyView, LENA와 같은 실험적 및 자연주의적 방법을 결합하여 실생활 환경에서의 언어 입력과 학습 과정을 분석할 것입니다. 특히, 한국어 아동을 대상으로 한 시선 추적 연구를 통해 형태 편향(Shape Bias)의 획득 과정과 언어 구조의 영향을 규명할 것입니다.
초기 언어 습득에 있어서의 환경적 입력의 영향과 더불어, 대화 개시자의 역할과 발화권 조정, 사회적 지위가 성인 간 상호작용의 구조 형성에 끼치는 영향을 탐구할 것입니다. 보호자-아동 간 상호작용 유형, 독서 및 음악 활동이 아동 및 노인의 언어 발달에 미치는 영향을 연구하고, 성별, 권력 관계, 사회경제적 요인이 보호자-아동 및 성인 간 상호작용에 미치는 영향을 실증적으로 분석하는 데 중점을 둡니다.
영유아의 인지 발달 연구에 더불어, 대규모로 수집·분석한 노년층의 자연 발화 데이터를 통해 사회적 상호작용 빈도와 질이 인지 건강에 미치는 영향을 연구할 것입니다. 특히, AI 기반 음성 분석 기술을 활용하여 노화가 언어 지각, 발화 생산 및 및 언어 유창성(fluency)에 미치는 영향을 분석할 것입니다. 이어 정량적으로 측정된 노년층의 언어적 어려움을 기반으로 어휘 회복, 구문적 복잡성, 문맥 이해 능력의 저하를 측정하고 이를 조기 포착하는 것을 목표로 합니다.
본 연구는 AI 기반 음성 분석, 시선 추적, LLM(Large Language Models)을 활용한 감성 분석 등을 통해 언어 환경을 자동 분석하는 연구 방법을 개발하는 것을 목표로 삼고 있습니다. 장시간 녹음 데이터를 활용하여 아동과 성인 간 대화 패턴을 자동으로 전사·분석하여 한국 다문화 가정의 언어 환경이 아동의 언어 및 인지 발달에 미치는 영향을 정량화하는 것을 목표로 합니다. 이를 위해 이를 위해 시각, 촉각, 제스처 등의 다중 감각 단서 데이터를 활용합니다.
본 과제는 기존의 서구 중심 연구에서 다루지 못했던 교착어 환경에서의 언어 발달 과정을 분석함으로써 한국을 국제적인 연구 허브로 육성하는 것을 목표로 합니다. 한국어 환경에서의 언어 습득 및 변화 과정을 실증적으로 분석함으로써, 학문적 다양성을 확보하고 국제적인 연구 흐름에서 한국의 위상을 높이는 데 기여하고자 합니다.
국제 연구 네트워크 확장 및 주도적 역할: 본 연구소는 ManyBabies-AtHome 프로젝트(Katie Von Holzen 공동연구) 및 Stanford 대학(Mike Frank 공동연구)등 세계 유수의 연구기관 및 학자들과 긴밀한 국제 공동연구 협력 체계를 구축하고 있습니다. BabyView및 ManyBabies-AtHome 프로젝트를 통해 세계 여러 다른 언어를 배우는 영아들의 어휘 인지 발달 과정을 비교 분석하며, 기존 해외 연구 방법론을 배우는 것을 넘어 새로운 방법론을 전파하는 주도적 역할을 수행하기 위해 국제 학회 및 워크숍을 주최할 계획입니다.
한국어 중심의 학문적 다양성 확보: 본 연구소는 기존 서구 중심의 언어 연구 패러다임에서 벗어나, 한국어를 기반으로 한 전 생애적 언어 연구를 수행합니다. 영어에서 벗어나 교착어인 한국어의 문법적 특징을 반영한 기계 학습 모델을 개발하고, 이를 통해 한국어 영유아 및 노년층의 언어 발달과 환경을 체계적으로 연구함으로써 국제적으로 비교 가능한 다 언어 데이터를 제공할 것입니다. 이는 언어 발달 연구의 비 서구권에로의 확장과 글로벌화에 기여할 것입니다.
학문후속세대의 글로벌 육성: 본 연구소는 국제 영아 학회 여름 인턴십 프로그램에 아시아에서 유일하게 지속적으로 호스트 기관으로 참여하여 국내외 학부생 및 대학원생들에게 국제 연구 경험을 제공하고 글로벌 네트워크를 형성할 수 있도록 지원한 경험이 있습니다. 이를 바탕으로 HK Global Fellowship 프로그램을 통해 차세대 연구자들이 연구 역량을 키우고 국제적 연구자로 성장할 수 있는 기반을 마련하며, 특히 데이터사이언스학과 내 인문데이터과학 석·박사 과정을 통해 한국어를 포함한 인문학 데이터와 데이터 과학을 융합한 차세대 연구 인력을 양성하려 합니다.
본 연구소는 인간 언어 발달 연구를 위해 데이터 기반의 정량적·정성적 분석을 수행하는 데 주력하며, 이를 위한 최첨단 연구 환경을 구축하고 있습니다. 이는 기존의 개별 연령층이나 특정 언어 현상에 집중했던 연구의 한계를 극복하고, 전 생애에 걸친 언어 발달의 근본적인 기제를 탐색하는 데 필수적입니다.
대규모 자연 발화 데이터 구축: 영유아부터 노년층까지 다양한 연령대를 대상으로 생태학적으로 유효한 일상 환경 자연 발화 언어 데이터와 이에 연관된 다양한 모달리티 데이터를 대규모로 수집합니다. 이를 위해 LENA (Language ENvironment Analysis) 시스템, BabyView (1인칭 시점 비디오 데이터), 웹캠 기반 시선 추적 (WebGazer, iCatcher+)과 같은 최첨단 웨어러블 디바이스 및 기술을 적극적으로 활용합니다.
자동화된 계산적 방법론 활용: 자동화된 전사, 화자 식별, 발화 분할 기법을 활용하여 아동/성인 지향 발화를 자동 분류하는 시스템을 개발합니다. 감성적 요소가 아동의 언어 및 인지 발달에 미치는 영향을 실증적으로 검토하기 위해 LLM(Large Language Models) 기반 감성 분석 방법론을 제시하며, 영아의 시각적 주의와 언어 습득과의 객관적인 관계를 정교하게 측정합니다.
연구 신뢰성 및 접근성 증대: 재현가능한 실험구조와 분석 도구, 오픈사이언스모델에 입각한 데이터 공개를 통해 정밀한 데이터 처리와 분석을 자동화합니다. 이를 통해 연구 결과의 객관성과 신뢰성을 높이는 데 기여하며, 저자원 연구자들도 연구를 수행할 수 있도록 연구 접근성을 높일 것입니다.