교육학이나 사회과학 분야에서의 자료는 다층구조를 지니는 경우가 많다. 다층잠재계층분석(MLCA)은 이러한 다층데이터를 분석하기 위해 도입된 2 수준 내 1 수준 개인의 응답 사이의 비독립성을 고려한 무선효과 접근방법이다. 이는 모수적 접근과 비모수적 접근으로 나뉘는데, 모수적 MLCA 는 하위 수준의 개인을 잠재집단으로 분류하는 데 초점을 둔다. MLCA 는 일반적으로 지표변수가 무선절편을 지니지 않는다고 가정하나, 이를 가정한 MLCA 는 잠재계층 구분에 미치는 예측변인의 영향력을 보는 것 이상으로 2 수준 예측변인과 지표변수가 어떠한 관계를 지니는지를 확인할 수 있고, 보다 구체적이고 추가적인 정보를 얻을 수 있다는 강점을 가진다. 따라서 본 연구는 지표변수의 무선효과 포함 여부에 따른 모수적 MLCA 모형의 성능을 비교하고, 지표변수의 무선효과를 포함한 모수적 MLCA 모형에서 2 수준 예측변인이 지표변수에 미치는 영향력 추정의 정확도를 살펴보고자 하였다.
본 연구는 몬테카를로 시뮬레이션을 통해 모수적 MLCA(모형 1), 모수적 one-factor MLCA(모형 2), 지표변수의 무선효과를 지닌 모수적 MLCA(모형 3)의 성능을 비교하고, 지표변수의 무선효과를 포함하였을 때 2 수준 예측변인이 지표변수에 미치는 영향력 추정의 정확도를 확인하였다. 시뮬레이션 조건으로 1 수준 샘플 사이즈(10, 30, 50), 2 수준 샘플 사이즈(30, 50, 100), 지표변수의 개수(5, 10, 15)를 설정하였다. 총 27 개의 조건을 각 100 번 반복하여 데이터를 생성한 후, 총 2,700 개의 데이터셋을 세 가지 모형에 적용하였다. 모형의 성능 비교를 위한 평가 지수로 모형 비교의 정보 지수(AIC, BIC, aBIC)와 분류의 질(Entropy)을 비교하였다. 모형 3 의 모수 추정의 정확도를 위한 평가 지수로는 모수 추정 편향, 평균 제곱근 오차, 범위 확률을 사용하였다.
연구 결과, 1 수준 및 2 수준 샘플 사이즈와 지표변수의 개수에 따라 모형 비교와 분류의 정확도에 의미 있는 차이가 발견되었다. AIC 와 aBIC 에 따르면 연구 조건에 상관없이 모형 3 이 더 좋은 성능을 보였으나, BIC 의 경우 샘플 사이즈가 크고 지표변수가 많은 조건하에 잘 기능하였다. 분류의 질은 모형 3 이 다른 모형에 비해 더 낮은 수준을 보였으나, 2 수준 샘플 사이즈가 클수록 비슷한 분류의 질을 나타냈다. 또한, 모형 3 에서 샘플 사이즈가 작고 지표변수가 적을 경우, 지표변수에 미치는 2 수준 예측변인의 영향력을 추정하는 데 부적절한 모수 추정 편향이 발생하였다. 평균 제곱근 오차의 경우 샘플 사이즈와 지표변수 개수가 클수록 예측변인의 영향력을 더 정확하게 추정하였고, 지표변수가 적을 때 부적절한 범위 확률을 보였다.
본 연구는 지표변수 무선효과의 포함 여부에 따른 모수적 MLCA 의 성능 차이를 확인하였고, 최적의 모형을 탐색할 때 일반적인 MLCA 와 지표변수의 무선효과를 포함한 모형을 함께 비교할 필요가 있음을 제언하였다는 점에서 의의를 지닌다. 또한, 이를 적용하고자 하는 연구자에게 해당 모형이 정확한 모수 추정을 도출해낼 수 있는 샘플 사이즈와 지표변수 개수의 조건을 밝혀냈다는 점에서도 중요성을 지닌다. 최근 교육학 및 사회과학 분야에서 다층데이터와 혼합모형에 관한 관심이 늘어남에 따라 예측변인과 지표변수 사이의 관계를 확인할 수 있는 모형 역시 활발히 활용될 것이라 짐작해볼 수 있다. 따라서 본 연구가 해당 모형을 적용하고자 하는 연구자에게 유용한 지침이 될 수 있으리라 기대한다.