초록

집약적 종단 데이터(Intensive Longitudinal Data: ILD)는 측정 및 데이터 저장 기술의 발달과 더불어 앞으로의 연구에서 가장 흔한 데이터의 형태로 자리 매김 할 수 있는 데이터이다. 이러한 데이터의 분석을 위해서는 기존의 연구 방법에서 나아가 몇 가지 고려되어야 할 사항들이 있다. 첫번째로는 측정 간격이 짧음으로 인해 발생하게 되는 자기회귀효과로, 이전 시점의 측정이 이후 시점의 측정에 영향을 미치는 것이다. 이는 잠재변수로부터 일정한 응답이 나오기를 기대하는 것과는 다른 효과로, 분리되어 연구될 필요가 있다. 두번째로는 사람 간 측정시점이 다를 수 있다는 점이다. 데이터 수집 참여자들에게 동일한 횟수의 자료를 수집하더라도, 일정한 공간에 모여서 응답하는 것이 아니라면 시간 간격이 달라질 수 있다. 이에 집약적 종단 데이터는 동일한 시간간격을 생성하고 분석하기 위하여, 결측 자료의 형태로 구성되는 경우가 많다.

한편, 많은 시점의 종단 데이터를 분석하기 위한 방법론이 구조방정식 모형을 기반으로 발달해왔다. 가장 간단한 형태의 잠재 자기회귀 모형부터, 상태와 특성을 고려한 잠재 자기회귀 상태-특성 모형, 상태와 특성의 성장효과를 고려한 잠재 자기회귀 상태-특성 성장 곡선 모형 등이다. 이러한 분석 모형들은 잠재 상태 특성 이론(Latent State-Trait Theory: LST Theory)을 근거로 모델링의 기반을 마련하였다. 그러나 이는 모두 단일 수준의 분석 모형으로, 최근에서야 다층 모형으로 집약적 종단 데이터에 대한 분석이 Mplus 와 같은 분석 프로그램에 마련되고 있는 상황이다. 그 이유는 다층 모형으로 분석할 때 자기회귀효과나 무선효과의 분석이 어려웠기 때문인데, DSEM(Dynamic Structural Equation Modeling)의 틀에서 해당 분석이 가능하도록 제공하고 있어, 집약적 종단 데이터를 다층 모형으로 분석할 수 있게 되었다.

이를 기반으로 집약적 종단 데이터를 분석하는데 있어 다층 모형을 도입하거나, 다층 모형에 성장 요인을 도입하는 새로운 모형을 소개하는 연구들과 여러가지 조건에서 단일 수준 모형과 다층 모형을 비교하는 연구들이 진행되었다. 그러나 기존 연구에서 자기회귀효과와 성장 요인을 함께 도입하여 비교한 경우는 없었기 때문에, 본 연구에서는 단일 수준 모형과 다층 모형을 비교함에 있어서, 자기회귀효과와 성장 요인이 모두 투입된 모형을 활용하였다. 또한, DSEM 틀에서 분석할 때는 Bayesian 추정방법을 사용해야 하는데, 단일 수준에서는 기존의 전통적인 추정 방법인 최대 우도 방법(Maximum Likelihood: ML)으로 분석하고, 다층 모형에서는 Bayesian 방법으로 추정하면, 연구 결과가 분석 수준의 영향인지, 추정방법의 영향인지를 명확히 알기 어렵기 때문에 단일 수준에서도 Bayesian 추정 방법을 도입하여 분석하였다.

연구 설계를 기반으로 한 본 연구의 목적은 다음과 같다. 첫째, 다양한 조건에서 단일 수준의 분석이 적합한지 다층 분석이 적합한지 탐색하는 것이다. 둘째, ML 추정방법과 Bayesian 추정방법을 비교하여 더 나은 추정 방법으로 응용 연구자들이 연구를 수행할 수 있도록 제언하는 것이다. 이를 위하여 시뮬레이션 연구를 진행하였고, 자기회귀효과, 측정 시점의 이벤트 변수에 의한 효과, 측정 시점의 개수, 결측 비율, 표본 크기를 조건으로 고려하였다. 데이터 생성은 성장 요인이 있는 경우와 없는 경우에서 모두 생성하여, 성장 요인이 있는 모형과 없는 모형으로 분석할 때, 옳은 모형이 아님에서 오는 잘못된 결과해석을 피하고자 하였다.

분석결과는 수렴정도, 편향정도, MSE(Mean Squared Error), Coverage, 그리고 Bayesian 추정에서 도출되는 PSR(Potential Scale Reduction), DIC(Deviance Information Criterion)를 통해 비교되었으며, 일반적인 결론을 도출해내면 다음과 같다. 첫째, 전반적인 분석에서 성장 요인이 투입된 모형이 무선 절편 모형보다 좋은 결과를 보였기 때문에, 진모형(True Model)을 모르는 실제 연구에서는 성장 요인이 투입된 모형을 활용하는 것을 지지하였다. 둘째, ML 추정방법보다는 대체적으로 Bayesian 추정방법이 더 많은 조건에서 양호한 결과를 보였기 때문에, Bayesian 추정방법을 지지하였다. 셋째, 구체적으로 8 개의 측정 시점까지는 단일 수준에서 Bayesian 추정방법으로 분석하는 것이 권장되며, 12 개의 측정 시점부터는 다층 Bayesian 추정방법으로 분석하는 것이 좋았다. 다만 평균 추정에 비해 분산의 추정은 편향이 큰 것으로 나타나 이는 해석에 주의가 요구된다.

이와 같은 결과는 기존의 Bayesian 추정방법이 수행이 좋다고 보고한 연구와 맥락을 같이하며, 본 연구는 기존 연구에서 고려되지 않은 조건에서, 성장 요인과 자기회귀효과를 함께 투입하여 분석을 진행했다는 점에서 의의를 찾을 수 있다. 본 연구를 기반으로 자기회귀효과가 측정 시점 사이에 변화하여 강해지거나 약해지는 연구나, 측정 동일성을 가정하지 않은 추후 연구들이 진행될 수 있는 만큼, 이후 시뮬레이션 연구자들에게도 도움이 될 수 있을 것으로 기대되며, 구체적인 조건에서의 제언은 응용 연구자들에게 현실적으로 도움이 될 수 있다는 의미가 있다.