검색 상세

Comparison of Models with and without a Covariate to Determine the Number of Latent Classes in Latent Class Analysis

잠재계층 분석에서의 계층 수 결정을 위한 공변량 유무 모형 비교

초록/요약

Latent class analysis is widely used in behavioral science such as education, psychology, and sociology. The conventional analytic method assumes that the sample will have one distribution, but the latent class analysis tries to find the distribution of each of the latent classes in the sample without assuming the same distribution and tries to understand its characteristics. Therefore, not only the analysis is meaningful itself, but it is used in combination with various analysis methods of the latent class recently. One of the important issues in this analysis is the number of latent classes, since it is assumed that the latent classes have their respective distributions. Since this affects the understanding of the characteristics of the sample and its subsequent interpretation, it is important to determine the number of latent classes in the latent class analysis process. There are positions to divide the class by using only the measurement variables used to divide the class, and to divide the class including the covariate information that may affect the class. There is also an argument for partially incorporating covariates information, and comparing covariates inclusion and non-inclusive models, creating confusion for application researchers. In addition, previous simulation studies had mostly two latent classes, with some of them omitting the process of latent class analysis to determine the number of latent classes to be analyzed for research purposes. Therefore, taking these limitations into consideration, this study tried to compare with and without a covariate model with the covariance model in order to better predict the number of latent classes. Although previous studies have mostly determined based on the model fit indices, since the data are generated in the simulation study, it is possible to determine the quality of the classification that was well classified as a latent class at the time of generation following the analysis, which can also be an important assessment criterion. In order to evaluate the model, the model fit indices used frequently in the latent class analysis and classification quality (Separation) proposed in this study were examined. As a result of the analysis, the model without a covariate predicted the number of latent classes well, and the quality of classification was good, under various conditions of covariate effect, sample size, and quality of indicators. In reality, researchers do not know the true model of the relationship of variables or response patterns, so it is good to select a stable model under many conditions. Therefore, it is reasonable to examine the relationship with other variables after analyzing the latent class through the model without covariates. These results support the 3-step approach and are meaningful that the quality of the classification of the latent class analysis, which was not considered in the previous studies, was evaluated. The quality of the classification can be a new reference point for comparing the models, which can be useful for simulation researchers, and this study implies that a practical model is presented to applied researchers.

more

초록/요약

잠재계층분석(Latent Class Analysis)은 교육학, 심리학, 사회학 등 행동과학에서 많이 사용되고 있다. 일반적인 분석방법은 표본이 하나의 분포를 가질 것이라 가정하지만, 잠재계층분석은 동일한 분포를 가정하지 않고 표본 내의 잠재계층 각각의 분포를 찾아 그 특성을 이해하려 하기 때문이다. 따라서 분석 자체로도 의미가 있을 뿐만 아니라, 최근에는 잠재계층의 다양한 분석 방법들과 결합하여 사용되고 있다. 잠재계층이 각각의 분포를 갖는다고 가정하기 때문에 이와 같은 분석에서 중요한 이슈 중 하나는 잠재계층의 수이다. 이는 표본의 특성 이해와 이후의 해석에 영향을 미치기 때문에, 잠재계층의 수를 잘 정하는 것이 잠재계층분석 과정에서 중요하다. 잠재계층의 수를 결정하는데, 계층을 나누는데 사용하는 측정변수들만 사용하여 계층을 나누어야 한다는 입장과, 계층에 영향을 줄 수 있는 공변량의 정보를 포함하여 계층을 나누어야 한다는 입장이 존재한다. 부분적으로 공변량의 정보를 포함하여야 한다는 입장과, 공변량 포함 모형, 포함하지 않는 모형을 비교해야 한다는 주장도 있기 때문에, 응용 연구자들에게 혼란을 주고 있다. 또한 기존의 시뮬레이션 연구는 대부분 잠재계층의 수가 2개였으며, 연구목적을 위해 분석에서 잠재계층 수를 결정하는 잠재계층 분석의 과정을 일부 생략한 연구도 있었다. 따라서 본 연구에서는 이러한 점들을 고려하여 잠재계층의 수가 3개일 때, 범주형 변수를 사용하는 잠재계층분석에서 잠재계층 분석의 과정에 따라 공변량의 유무 모형을 비교하여 잠재계층의 수를 더 잘 예측하는지 보고자 하였고, 이를 위해 Monte Carlo Simulation 연구를 진행하였다. 기존 연구에서는 모형 적합도 지수를 기준으로 주로 판단하였으나, 시뮬레이션 연구에서는 데이터를 생성하기 때문에 분석 이후 생성시 잠재계층으로 잘 분류되었는지 분류의 질(Separation)을 판단가능하며 이 역시 중요한 평가 기준이 될 수 있다. 따라서 본 연구는 모형을 평가하기 위해 잠재계층분석에서 많이 쓰이는 AIC, BIC, LMRLRT, BLRT의 모형 적합도 지수와 본 연구에서 제안하는 모형 평가 방법인 분류의 질(Separation)을 조사하였다. 분석결과, 공변량의 효과, 표본 크기, 측정 변수의 질 등을 다양하게 한 조건에서 공변량이 없는 모형이 안정적으로 잠재계층의 수를 잘 예측하였고, 분류의 질도 좋았다. 현실의 연구에서는 변수의 관계나 응답 패턴의 참 모형을 알지 못하므로 많은 조건에서 안정적인 모형을 선택하는 것이 좋다. 따라서 공변량이 없는 모형을 통해 잠재계층분석을 수행한 후 다른 변수들과의 관계를 살펴보는 것이 타당하다고 할 수 있겠다. 이와 같은 결과는 3-step 접근법을 지지하며 기존 연구에서 고려하지 않았던 잠재계층분석의 분류의 질을 평가하였다는 점에서 의의를 찾을 수 있다. 분류의 질을 살펴보는 것이 모형을 비교하는 새로운 기준점이 될 수 있어, 시뮬레이션 연구자들에게 도움이 될 수 있을 것이며, 응용 연구자들에게는 현실적으로 타당한 모형을 제시하였다는 의미가 있다.

more

목차

I. INTRODUCTION 1
1. Necessity of the Study 1
2. Purpose of the Study 4
3. Research Questions 5

Ⅱ. THEORETICAL BACKGROUND 7
1. Basic Latent Class Analysis Model 7
2. LCA with Covariates 10
3. Previous Simulation Studies 11

Ⅲ. METHOD 16
1. Monte Carlo Simulation 16
2. Simulation Designs and Manipulated Conditions 17
1) Study 1 17
2) Study 2 18
3) Study 3 20
4) Common Conditions 21
3. Criteria 23
1) Model Fit Indices 23
2) Separation 25
4. Programs 28

Ⅳ. RESULTS 29
1. Study 1 29
1) Model Fit Indices 29
2) Separation 32
2. Study 2 40
1) Model Fit Indices 40
2) Separation 44
3. Study 3 57
1) Model Fit Indices 57
2) Separation 61

Ⅴ. CONCLUSION AND DISCUSSION 74

REFERENCES 80
KOREAN ABSTRACT 86
APPENDIX 88

more