벌점화 구조방정식(penalized structural equation model)은 기존의 구조방정식 모형(structural equation model; SEM)과 머신러닝에서 활용되고 있는 벌점화 모형이 결합된 분석방법이다. 모형 명세화 오류(model misspecification), 비정규분포, 작은 표본에 취약성을 보이는 MLE, ADF 추정법, 문항묶음의 대체방법으로 최근 주목받고 있다. 벌점화 구조방정식이 이를 어떻게 보완할 수 있는지 각 주제별로는 연구가 진행됐으나 이를 종합한 연구는 제한적인 범위에서 이루어졌다. 이에 이 연구는 측정모형 및 구조모형의 모형 명세화 오류, 비정규분포, 작은 표본을 따르는 자료를 분석할 때 벌점화 구조방정식 추정방법이 양호한 추정치를 도출하는지 실증적으로 살펴보는 것을 목적으로 한다.
구조방정식의 대표 추정방법인 최대우도 추정법(maximum likelihood estimation; MLE)은 가장 오래되고 활용도가 높은 추정법 중 하나로 교육연구에서 빈번하게 활용되지만, 정확한 모형 설정, 다변량 정규성, 큰 표본을 기본가정으로 하므로 이를 충족시킬 때 정확한 결과를 도출할 수 있다. 그러나 기본가정을 충족하지 않는 경우에도 활용되어 분석모형이 참임에도 기각되거나, 편의 추정치를 얻는 등 심각한 문제가 발생하기도 한다. 이를 보완하기 위해 ADF 추정법과 문항묶음이 등장했지만, 이 또한 모형 명세화 오류와 작은 표본에 취약하다는 단점이 있다. 그러나 교육연구에서 활용하는 자료는 관찰변수가 많고 표본 크기가 작은 경우가 빈번하며, 변수에 따라서 정규성 가정을 충족하지 않는 경우가 있어 주의가 필요하다.
이에 이 연구에서는 벌점화 구조방정식이 MLE의 대체방법이 될 수 있는지 확인하기 위해 MLE와 벌점화 구조방정식의 추정방법을 비교하여 살펴보았다. 자료를 모형 명세화 오류를 중심으로 하여 표본 크기와 비정규분포로 구분하고 실험조건에 따라 추정치의 양호도를 비교하였다. 연구자료는 자료 생성 모형과 분석모형에, 기준모형과 모형의 명세화 오류가 측정모형과 구조모형에 포함된 경우에 따라 연구모형1, 연구모형2, 연구모형3, 연구모형4, 연구모형5, 연구모형6, 연구모형7, 연구모형8, 연구모형9로 구분하고, 비정규분포, 표본 크기에 차이를 두어 가상자료를 생성하여 활용하였다. 연구모형은 3요인 매개모형을 기본으로 하여 MLE와 벌점화 구조방정식의 추정방법인 릿지 회귀, LASSO, elastic net, MCP를 적용하여 분석하였다.
연구 결과를 요약하여 제시하면 다음과 같다.
첫째, 연구모형1에서는 표본 크기에 따라 벌점화 구조방정식 추정방법이 MLE보다 양호한 상대적 편의 및 평균제곱근오차를 보였다. 정규분포일 때 추정치의 정확성과 효율성의 양호도에는 뚜렷한 차이가 나타나지 않았지만, 비정규분포일 때 LASSO, elastic net, MCP가 MLE보다 표본 크기에 따른 상대적 편의의 추정치의 차이를 확인할 수 있었다.
둘째, 연구모형2와 연구모형3에서는 벌점화 구조방정식이 표본 크기와 자료의 정규성에 따라 MLE보다 양호한 상대적 편의 및 평균제곱근오차를 보였다. 연구모형2의 정규분포와 비정규분포에 따른 결과에서는 벌점화 구조방정식 추정방법이 교차요인부하량에 대해 MLE보다 양호한 편의와 오차를 보였으나, 뚜렷한 차이는 확인할 수 없었다. 연구모형3에서는 분석모형의 교차요인부하량으로 측정오차가 작게 설정되었음에도, 정규분포는 elastic net과 MCP가, 비정규분포는 릿지 회귀와 elastic net이 표본 크기가 증가함에 따라 양호한 정확성과 효율성을 보였다. 이를 통해 표본 크기가 작고 측정모형 명세화가 불확실한 상황에서는 벌점화 구조방정식 추정방법이 보다 정확한 모수의 추정치를 얻기 위해 권장된다는 점을 알 수 있었다.
셋째, 구조모형의 구조계수에 따라 설정한 연구모형4, 연구모형5, 연구모형6, 연구모형7, 연구모형8, 연구모형9에서도 벌점화 구조방정식 추정방법이 표본 크기와 자료의 정규성에 따라 MLE보다 양호한 추정치를 보이는 것으로 나타났다. 먼저 자료생성 모형에 구조계수의 모형 명세화 오류가 있는 연구모형4에서는 LASSO가, 연구모형6에서는 정규분포일 때는 릿지 회귀가, 비정규분포일 때는 LASSO와 elastic net이, 연구모형8에서는 정규분포와 비정규분포에서 LASSO와 elastic net이, 표본 크기가 작고 구조모형의 모형 명세화 오류가 있는 상황에서 양호한 추정치를 나타냈다. 또한 LASSO와 elastic net이 다른 추정방법보다 효과적으로 참값이 0인 모형 명세화 오류에 해당하는 구조계수를 0으로 축소하는 것으로 확인할 수 있었다. 다음으로 분석모형에서 구조계수의 모형 명세화 오류가 있는 연구모형5에서는 정규분포와 비정규분포에서 LASSO와 elastic net이, 연구모형7에서는 정규분포에서는 LASSO와 elastic net이, 비정규분포에서는 LASSO가, 연구모형9에서는 정규분포일 때는 릿지 회귀, LASSO, elastic net이, 비정규분포일 때는 LASSO와 elastic net이 양호한 추정치를 나타내는 것을 확인할 수 있었다. 결과적으로 구조계수의 유무로 인해 구조계수뿐만 아니라 내생잠재변수의 요인부하량이 영향을 받는 것을 확인할 수 있었다. 그리고 벌점화 구조방정식 추정방법 중 MCP는 구조모형의 모형 명세화에 대해 비교적 양호하지 않은 추정치를 보였다. 이러한 결과는 비정규분포와 작은 표본 크기를 갖는 구조모형의 모형 명세화가 확실하지 않을 경우, 벌점화 구조방정식 추정방법인 LASSO와 elastic net이 다양한 구조방정식 모형을 쉽게 탐색하는 데 기여할 수 있는 가능성을 보여준다.