Modeling Conditional Dependence and Deriving Personalized Diagnoses
조건부 상관 모델링 및 개인 맞춤형 진단 개발
Modeling Conditional Dependence and Deriving Personalized Diagnoses
조건부 상관 모델링 및 개인 맞춤형 진단 개발
심리측정학에서는 심리적 구성개념 (Psychological Construct)을 요인 (요인 Factor; 잠재 변수 Lantet Variable)로 표상하고 분석한다(참고: 계량심리학 소개 - 2. 심리측정학). 잠재 변수는 특정한 분포 (e.g., 표준 정규 분포)를 따르는 것으로 가정되며, 응답자들의 심리적 수준은 이 분포에서 '상대적'으로 추정된다. 이는 요인 분석 (Factor Analysis; FA), 문항 반응 이론 (Item Response Theory; IRT) 모형 등의 공통적인 접근법이다.
위 히스토그램은 Post-traumatic Stress Disorder (PTSD)에 대한 자료를 기존 심리측정 모형으로 분석해 얻은 결과 예시이다. 해당 분석에서 PTSD는 18개 세부 증상의 강도를 기록한 자료를 통해서 추정되었다. 히스토그램은 응답자들의 PTSD 요인 점수 (Factor Score) 분포를 보여주고 있다. 이 요인 점수들은 종합적인 PTSD 수준을 나타내며, 그렇기에 이 결과를 바탕으로 응답자들을 진단하고 필요한 처치를 내릴 수 있다. 해당 히스토그램 상에서의 점수는 임의의 단위를 토대로 하고 있으며, 각 응답자의 점수는 전체 분포에서의 상대 점수이다. 예컨대 점수가 0점인 경우 해당 요인 상에서 평균 수준임을, 1점인 경우 대략 상위 15% 수준임을 뜻한다.
위 정보를 이용하여 응답자에 대한 판단을 할 때, 자연히 비슷한 점수를 가진 응답자들은 비슷한 PTSD 수준을 나타내는 것으로 판단하게 된다. 예컨대 히스토그림에는 임의의 두 응답자 (P102, P38)의 요인 점수가 검정색 수직선으로 표시되어 있다. 실제 값은 각각 0.049, 0.055로 전체 분포 대비 거의 동일한 수준이라고 볼 수 있다.
그러나 이는 응답자들 간의 개인차 정보를 정확히 반영하는 접근이 아니다. 상술했듯이 PTSD 요인은 18개 세부 증상들로부터 진단되는데, 종합적인 요인 수준은 비슷하더라도 세부 증상의 패턴은 크게 다르게 나타날 수 있기 때문이다. 기존 모형들은 요인 점수 및 모형의 다른 요소들을 통해 응답자들의 특성 및 행동 양식을 잘 설명할 수 있다고 가정한다. 이를 심리측정 모형의 조건부 독립 (Conditional Independence) 가정이라고 한다. 이와는 달리 요인 점수 및 기존 모형 요소들만으로는 응답자들의 특성 및 행동 양식을 완전히 설명할 수 없음을, 이들만으로는 포착할 수 없는 여러 효과가 자료에 내재되어 있음을 말하는 것이 심리측정 모형에서의 조건부 상관(Conditional Dependence)이다. 조건부 상관에 대한 분석은 응답자들의 개인차 (Individual Differences) 및 측정 도구의 특성 (Item Charateristics)에 대한 여러 상세한 분석을 가능하게 한다.
보다 정확한 분석을 위해 연구실에서는 기존 심리측정 모형을 네트워크 자료 분석법 중 하나인 잠재 공간 모형 (Latent Space Model; Hoff et al., 2002)과 결합하여 새로운 잠재 공간 기반 측정 모형을 만들고 개인 맞춤형 프로파일을 유도하는 접근법을 개발하고 있다. 해당 방법에서는 1) 기존 모형과 마찬가지로 응답자들의 종합적인 수준을 요인 점수로 분석함과 동시에, 2) 응답자와 측정 문항 (여기서는 세부 증상)들이 공통의 '잠재 공간'에 놓인다는 가정 하에 이들의 잠재 위치를 분석하고, 3) 잠재 공간 상에서의 거리를 통해 응답자-증상 간의 상호작용 관계를 분석한다. 이러한 상호작용 분석은 개인 별 세부 증상 프로파일 분석 및 시각화로 연결된다.
다음은 잠재 공간 기반의 접근법을 이용하여 앞서 다룬 것과 동일한 PTSD 자료를 분석한 결과 예시이다.
좌상단 그림은 앞서 다룬 것과 같은 히스토그램을 보여주고 있으며, 이를 통해 두 응답자 P102, P38의 종합적인 PTSD 수준은 거의 동일함을 알 수 있다. 요인 점수 중심의 기존 모형 분석에서 더 나아가, 새로운 모형은 우상단 그림의 (2차원) 잠재 공간을 유도하게 된다. 해당 공간에서 회색 숫자들은 응답자 번호를, 파란색 텍스트들은 PTSD의 18개 세부 증상을 약자(abbreviation)로 표시하고 있다. 예시로 꼽은 두 응답자의 번호는 큰 글씨와 점선으로 된 원을 통해 강조되어 있다. 요인 점수가 굉장히 비슷했던 것과는 달리, 잠재 공간에서 두 응답자의 위치는 크게 다르게 나타난다. 이에 따라 각 응답자의 '세부 증상과의 거리'도 굉장히 다른 패턴을 띄게 된다. 증상과의 가까운 거리는 강한 증상을, 먼 거리는 약한 증상을 나타낸다.
하단의 그림들은 응답자 별로 세부 증상와의 거리를 적절히 변환하여 얻은 '세부 증상 프로파일'을 보여주고 있다. 이는 응답자들이 어떤 프로파일을 더 강하게 보이는지를 막대 그래프 형식으로 시각화한 것이다. 막대 점수가 1.0에 가까울수록 해당 막대에 대응되는 세부 증상을 더 강하게 보임을 나타낸다. 그림을 통해 드러나듯이, 두 응답자 P102과 P38는 서로 다른 세부 증상을 보유하고 있다. 구체적으로 P102는 physior (트라우마 상기 자극에 대한 생리적 반응), upset (트라우마 상기 자극에 대한 불안 및 괴로움 반응) 등의 증상을 더 강하게 보이고 있는 반면, P38은 future(단축된 미래 의식), numb (감정적 둔감), disant (타인과의 단절감) 등의 증상을 더 강하게 보이고 있다. 즉 P102는 PTSD로 인한 생리적 반응이 강하게 나타나는 것으로, P38은 생리적 증상보다는 인지적, 사회적인 면에서 강한 증상을 보이는 것으로 진단을 내릴 수 있다. 이러한 세부 진단은 기존 측정 모형 (요인 점수 및 그 히스토그램)에서는 얻기 어려운 결과이다.
연구실에서는 이러한 세부 진단 도구 개발을 위해 여러 심리측정 모형과 네트워크 모형, 기타 다른 통계적 접근법들을 결합하는 연구들을 진행하고 있다. 또한 신속한 진단 및 처치를 위한 계산 속도 개선, 다양한 응답자-문항 상호작용에 대한 세부 분석 등 역시 다루고 있다.
관련 논문
Hoff, P. D., Raftery, A. E., & Handcock, M. S. (2002). Latent Space Approaches to Social Network Analysis. Journal of the American Statistical Association, 97(460), 1090–1098. https://doi.org/10.1198/016214502388618906
Jeon, M., Jin, I. H., Schweinberger, M., & Baugh, S. (2021). Mapping Unobserved Item–Respondent Interactions: A Latent Space Item Response Model with Interaction Map. Psychometrika, 86(2), 378-403. https://doi.org/10.1007/s11336-021-09762-5
Kang, I., Jeon, M., & Partchev, I. (2023). A Latent Space Diffusion Item Response Theory Model to Explore Conditional Dependence between Responses and Response Times. Psychometrika, 88(3), 830-864. http://doi.org/10.1007/s11336-023-09920-x
Kang, I., & Jeon, M. (2024). A Recent Development of a Network Approach to Assessment Data: Latent Space Item Response Modeling for Intelligence Studies. Journal of Intelligence, 12, Article 38. https://doi.org/10.3390/jintelligence12040038