검색 상세

Structural Modeling for Multiple Latent Class Variables

초록/요약

This dissertation presents a comprehensive exploration of the Structural Latent Class Model (SLCM), an advanced statistical framework that enriches the field of latent class analysis (LCA). The SLCM unifies and extends various LCA methodologies, including latent transition analysis (LTA), latent class profile analysis (LCPA), and joint latent class analysis (JLCA). The central thesis revolves around the capability of SLCM to not only integrate these established models but also offer the flexibility to incorporate additional latent variables, paving the way for more sophisticated extensions of latent class models. A significant contribution of this work is the development of the \textsf{R} package `slca`, a tool designed to facilitate the practical application of SLCM in diverse research contexts. By simplifying the implementation of complex, multi-faceted latent class models, this package lowers the barriers to entry for researchers across various disciplines. It enables them to engage with and apply intricate modeling techniques, which were previously accessible only to those with advanced statistical expertise. The package includes unique functionalities such as bootstrap goodness-of-fit testing and a three-step approach for introducing covariates with bias correction, which are not commonly found in existing LCA \textsf{R} packages. The dissertation also outlines potential directions for future research to enhance the SLCM framework further. One key area is the incorporation of group effects to handle multilevel data structures, which could be achieved by integrating methodologies like multiple-group LCA or multilevel LCA. Adopting Bayesian approaches, such as Gibbs Sampling or Variational Bayes, is proposed as a robust solution to mitigate these issues. These techniques, by embedding prior knowledge into the estimation process, could help navigate away from extreme parameter values, enhancing the stability and interpretability of SLCM.

more

초록/요약

본 학위논문은 다수의 잠재계층 변수를 다루는 다양한 잠재 클래스 분석(LCA) 확장 모형들을 포괄하는 일반적인 모형인 구조적잠재계층모형을 제시하고, 그 추정방안을 탐구한다. 구조적잠재계층모형은 연속형 잠재변수들을 측정하고, 동시에 잠재변수 간의 상관을 분석하는 구조방정식과 유사하게 범주형 잠재변수인 잠재계층변수들을 측정하고, 동시에 잠재변수들 간의 상관관계를 분석하는 방법이다. 기존에 제안되었던 잠재전이분석(LTA), 잠재계층프로파일분석(LCPA), 결합잠재계층분석(JLCA)과 같은 다양한 LCA 방법론을 하나의 틀 안에서 일반적으로 설명하고, 더 나아가 복잡한 잠재계층 구조를 마찬가지로 일반적인 하나의 틀 안에서 설명하는 데에 그 목적이 있다. 이 모형은 기존의 모형을 통합할 뿐만 아니라 잠재 변수들 간의 다양한 상관관계를 도입할 수 있는 유연성을 제공하여 다변량의 잠재계층 변수를 이용한 더욱 복잡한 확장 모형을 구축할 수 있다. 본 논문에서는 위에서 설명한 구조적잠재계층모형을 쉽게 적용할 수 있도록 개발된 \textsf{R} 패키지 `slca`을 소개한다. `slca`는 복잡한 다변량 잠재 클래스 모델의 구현을 단순화함으로써, 다양한 학문 분야의 연구자들이 고급 통계 전문 지식 없이도 복잡한 모델링 기법을 적용할 수 있도록 개발되었다. 또한, 모형 비교를 위한 붓스트랩 적합도 검정 및 공변량 도입에 있어 편향을 보정한 3단계 방법을 포함하는 등, 기존 LCA를 다루는 R패키지에서는 제공하지 않은 다양한 기능을 제공한다. EM알고리즘의 고질적인 문제인 추정 속도 개선을 위해 Rcpp를 사용하여 기본적인 모형의 적합속도 또한 다범주의 측정변수를 다루는 여타 R패키지에 비해 빠르다. 또한, 본 논문에서는 구조적잠재계층모형을 더욱 발전시킬 수 있는 미래 연구 방향을 제시한다. 다층 데이터 구조를 다루기 위한 집단 효과의 통합, 베이지안 접근법의 채택 등이 그 예로, 이러한 방법론은 추정 과정에 사전 지식을 포함시켜 극단적인 파라미터 값으로부터 벗어나 모형의 안정성과 해석 가능성을 향상시킬 수 있다.

more

목차

Abstract i
국문초록 iii
Table of Contents v
List of Tables vii
List of Figures viii
1 Introduction 1
2 Structural Latent Class Model 4
2.1 Latent class analysis 4
2.2 Multiple latent class variables 6
2.2.1 Latent transition analysis (LTA) 6
2.2.2 Latent class profile analysis (LCPA) 8
2.2.3 Joint latent class analysis (JLCA) 10
2.3 Structural latent class model 11
2.3.1 Model examples 13
2.4 Model likelihood 21
2.4.1 Index-based notation 21
2.4.2 Model parameters 22
2.4.3 Likelihood function 24
2.4.4 Measurement invariance 25
2.5 Estimation 26
2.5.1 Expectation-maximization algorithm 27
2.5.2 Upward-downward algorithm 30
3 R package slca 35
3.1 Package usage 36
3.1.1 slca: Functions for model specification 36
3.1.2 Model examples 40
3.1.3 estimate: Parameter estimation and inference 46
3.1.4 Dislaying parameter estimates 47
3.1.5 gof, compare: Model diagnostics 49
3.1.6 Including exogeneous covariates 50
3.1.7 Other methods 52
3.2 Examples with real data 53
3.2.1 General Social Survey (GSS) 1976-1977: gss7677 53
3.2.2 National Longitudinal Survey of Youth 1997 (NLSY97): nlsy97 62
4 Conclusion 83
Bibliography 87

more