오랜 기간 동안 성격의 평가는 자기보고식 설문지에 많은 부분 의존해왔다. 성격평가 목적의 자기보고식 설문지는 반응 왜곡, 높은 안면타당도, 제한된 정보량 등의 한계점을 가지고 있으므로, 자기보고식 설문지의 대안에 대한 필요성이 대두되었다. 최근에는 기계학습과 자연어 처리 분야가 크게 발전하여, 언어를 계량화하여 다루고 분석할 수 있는 기술적 제반이 마련되었다. 이에 국내외에서 자연어 처리 기술을 활용한 심리 평가 및 성격 평가 방식의 가능성이 활발히 탐색되고 있다.
본 연구에서는 성격 5요인 이론에 기반을 두고 개발된 개방형 질문을 통해 언어 응답을 수집하였고, 자연어 처리 기술을 활용해 개인의 응답을 분석하여 부정정서성 성격 특질을 예측하였다. 여러 성격 특질 중 부정정서성(negative affectivity) 및 부정정서성의 하위양상에 초점을 둔 이유는 부정정서성이 개인의 정신병리 및 성격장애와 밀접한 연관성을 지니기 때문이다. 본 연구의 예비 타당화 과정에서는 한국어가 모국어인 57명의 성인을 바탕으로 총 18개의 언어 기반 성격평가를 위한 개방형 질문을 확정하였으며, 이후 한국어가 모국어인 425명의 성인을 바탕으로 인구통계학적 정보, 개방형 언어 기반 성격평가 문항, 그리고 성격 및 정신건강 측정 목적의 자기보고식 척도에 대한 응답을 수집하였다.
본 연구에서 수집된 데이터는 크게 두 종류의 분석을 거쳤다. 첫 번째는, 개방형 질문에 대한 응답을 바탕으로 연구 참여자의 부정정서성 및 하위양상을 예측하는 것이다. 개방형 질문에 대해 30,576개의 한국어 문장이 수집되었으며, 사전 학습 언어 모델인 KoBERT를 본 연구의 데이터와 연구 목적에 맞게 미세 조정하여 활용하였다. 각 문항별 예측 모델을 비교한 결과, 부정정서성과 이론적으로 부합하는 문항으로 구축된 예측 모델의 성능이 우수한 경향을 나타냈다. 이를 통해 문항의 내용타당도와 응답의 내용이 모델의 예측력에 영향을 미치는 것을 실증적으로 확인하였다. 또한, 어떤 문항들이 부정정서성 및 하위양상을 잘 예측하는 문항들인지 확인하였다.
두 번째 분석으로는 각 문항별 어휘 분석(lexical analysis)이 실시되었다. 이는 부정정서성 및 하위양상이 높은 사람들은 낮은 사람들에 비해 어떤 언어적 표현을 더 두드러지게 사용하였는지 탐색하기 위함이다. 기존의 연구들은 이미 구축되어있는 소셜미디어 등의 언어 자료를 활용하다보니 말뭉치를 하나로 합쳐서 분석하는 방법을 사용할 수밖에 없었는데, 이로 인해 특정 표현이 어떤 맥락에서 사용한 것인지 파악할 수 없다는 한계점이 있었다. 본 연구에서는 성격 5요인 이론에 기반을 둔 개방형 질문들을 활용했으므로, 문항과 응답 내용의 맥락을 연관 지어 이론적으로 해석하는 것이 가능했다. 예를 들면, 부정정서성의 하위양상인 우울 성향이 높은 사람들의 경우, 부정적인 감정이 들 때 인지적 정서 처리에 대한 언급이 적었으며 자거나 눕거나 먹는 등의 행동을 통해 부정적인 정서를 다루고자 하는 것을 확인할 수 있었다. 반면 우울 성향이 낮은 사람들의 경우 이유를 정리하고, 감정을 느끼고, 일기를 쓰고, 대화하는 등의 방법을 통해 정서를 다루고자 함을 확인할 수 있었다. 이와 같은 방식은 계산 과학을 적용한 심리학 연구와 기존의 심리학 이론과의 연결을 가능하게 하며, 성격 특성과 심리적 과정에 대한 단서를 제공한다.
본 연구는 국내에서는 처음으로 임상심리 및 성격심리 분야에서 자연어 처리를 활용한 언어 기반 성격예측 및 평가를 소개하는 연구이다. 성격 이론에 기반을 두고 고안된 개방형 질문을 활용하고 자연어 처리 기법을 활용하여 분석하는 방식은 국내 뿐만 아니라 해외에서도 아직 시도되지 않은 방식이다. 본 연구는 심리학과 컴퓨터 공학 분야 간 긴밀한 협업을 통해 이론에 기반을 둔 하향적 접근과 데이터에 기반을 둔 상향적 접근의 통합을 시도하였다는 중요한 의의를 지닌다. 또한, 심리학에서 이론과 내용타당도가 예측력에도 영향을 미친다는 것을 실증적으로 검증하였고 응답에 드러난 표현의 맥락을 확인하여 기존의 심리학 이론과 연결 지어 해석을 시도하였다. 본 연구의 논의 부분에서는 위와 같은 연구 과정이 지니는 의의를 논하고 연구의 한계점과 제언도 함께 제시하였다.