본 연구는 한국어 학습자의 연어 사용 양상을 대규모 말뭉치를 사용하여 분석하고 모어 화자와 비교·대조하는 한편, 학습자의 숙달도별로 연어 사용 양상 과정을 살펴보고, 최종적으로 교육에 필요한 연어 목록을 제시하고 등급화하였다.
본 연구에서는 제2언어 교육적 관점에서 연어의 언어학적 특성이 학습자의 연어 사용에 영향을 미칠 수 있다고 보고 연어의 의미 불투명성과 결합의 제약성에 초점을 둔 성구론적 연어 개념을 연구 대상으로 삼았다. 그러므로 성구론적 연어 개념에 의해 구축된 『세종연어사전』의 8,846개 연어 목록을 대상으로 〈학습자말뭉치〉와 〈세종말뭉치〉에서 사용되는 양상을 파이썬을 활용하여 추출하였다. 각 말뭉치에서 추출한 연어들은 통사 성분에 의해 유형을 구분하였다.
먼저, 학습자와 모어 화자의 연어 사용 양상을 비교 분석하였다. 모어 화자가 많이 사용하는 연어를 학습자가 많이 사용하는 것이 연어 학습에 효율적이라고 보고, 〈세종말뭉치〉에서 사용 빈도에 따라 고빈도, 중빈도, 저빈도 연어로 나눈 후 학습자가 이 유형의 연어들을 얼마나 사용하는지 살펴보았다. 〈세종말뭉치〉의 고빈도 연어가 모어 화자보다 학습자들에게 더 높은 비율로 사용되고 있었고, 〈세종말뭉치〉의 중빈도 연어와 저빈도 연어는 〈학습자말뭉치〉에서 사용 비율이 낮게 나타났다. 그리고 모어 화자가 사용한 연어 토큰 수를 기준으로 하여 학습자들의 사용율이 높은 연어, 보통인 연어, 낮은 연어들로 나누어 특징을 알아보았다. 먼저 학습자의 사용율이 높은 연어의 특징은 초급 수준의 어휘로 구성된 연어 사용이 많았고, 특정 연어들의 과잉 사용이 나타났으며, 모어 화자는 자주 사용하지 않는 학업 관련 연어들이 많이 사용되었는데, 이는 학습자 말뭉치의 장르적 특성으로 보았다. 반면 학습자의 사용율이 낮은 연어의 특징은 연어핵과 연어변의 어휘 난이도가 높은 경향을 보이며, 어휘 난이도가 낮더라도 연어변의 의미가 불투명하거나 어휘적 의미가 약한 기능동사의 사용율이 낮았다. 또한 연어핵과 연어변이 제약적인 결합을 보이는 연어의 사용이 부족하였으며, 유의 관계에 있는 연어들 중 한 쪽 연어에 사용이 편중되어 다른 연어의 사용이 적게 나타났다.
연어의 사용 양상을 연어핵과 연어변으로 나누어 살펴보았다. 연어핵은 〈학습자말뭉치〉에서 〈세종말뭉치〉에 비해 다양하게 결합하지 못 할 뿐만이 아니라 특정 연어변과의 결합에 쏠려 있었다. 한편 연어변은 〈세종말뭉치〉와 〈학습자말뭉치〉 모두에서 '받다', '나다'등이 많이 사용되었고, '치다'와 '내다'는 학습자에서의 사용이 매우 부족하게 나타났는데 학습자들이 모어 화자보다 기능동사의 사용이나 연어변의 의미를 확장하여 사용하는 능력이 부족한 것으로 나타났다. 마지막으로 연어의 통사 구조 사용 양상에서는 연어 사용 능력이 높을수록 연어핵과 연어변을 조합하고 이동시켜 사용하는 것에 자유로울 것이라는 가정 하에 연어핵을 기준으로 연어변이 사용된 위치를 분석하였다. 연어변의 위치는 R1>R2>L1>L2순으로 많이 나타났으며, 〈세종말뭉치〉에서 L1과 L2의 비율이 더 높게 나타나 모어 화자가 연어를 수식 구성으로 좀 더 적극적으로 활용하여 사용하는 것으로 보았다. R2에서의 사용율은 〈학습자말뭉치〉에서 더 많이 나타났는데, 극고빈도 연어들이 학습자에게 내재화되어 R2에서 많이 사용된 것으로 보았다.
기타 유형의 연어들 중에서 '부사+동사'형 연어는 모어 화자 사용률에 비해 〈학습자말뭉치〉에서는 10% 남짓만 사용되어 매우 저조하였다. 〈세종말뭉치〉에서 많이 사용된 '흠뻑 젖다', '피식 웃다'와 같은 특정 동사와만 긴밀한 결합을 보이며, 제약적으로 사용되는 '부사+동사'형 연어를 학습자들이 거의 사용하지 못하고 있음을 확인하였다.
학습자의 숙달도별로 연어 유형을 분류하여 사용 양상을 살펴보았다. 연어의 토큰 수는 3급까지 가파르게 증가하다가 4급에서는 증가폭이 줄어들고, 5급부터는 오히려 감소하는 양상을 보였다. 타입 수와 TTR값은 숙달도에 따라 증가하고 있기는 하지만 4급부터는 증가폭이 둔화되어 학습자들의 연어 사용이 고급 단계에서 발달이 부족한 양상을 보였다. 숙달도별로 사용된 연어들의 예를 살펴보면, 등급별 교육 주제와 관련된 연어 사용을 확인할 수 있었다. 초급에서는 일상 생활과 관련한 연어들이 고빈도로 사용되었으며, 중·고급에서는 문어적 표현들이 많이 사용되고 있었다. 또한, 중급 문법 교육에서 다루어지는 피동형의 연어들이 해당 급에서 많이 나타나 학습자의 연어 사용은 교육 과정과 긴밀하게 연계될 필요성이 있음을 재차 확인할 수 있었다. 숙달도별로 연어변의 위치를 살펴보았다. 수식 구성으로 사용된 연어의 비율은 숙달도가 높아질수록 증가하였는데, 이는 중급 이후 관형형 문법 학습에 의한 문법 능력 발달, 학습자의 사용 내재화가 영향을 미친 것으로 보았다.
위의 연어 사용 양상을 분석한 결과를 바탕으로 학습자의 연어 사용의 한계와 문제점을 보완하기 위해 교육용 연어 목록을 선정하고, 등급을 나누어 교육용 자료로 제시하였다. 이를 위해 본고에서 분석한 〈세종말뭉치〉에서 고빈도와 중빈도로 사용된 연어들을 1차적으로 모은 후, 연어핵과 연어변 어휘가 「국제통용 한국어 표준 교육과정」어휘 목록과 중복되는 연어들만을 선별하였고, 제시된 어휘 등급을 기준으로 임시적으로 초급, 중급, 고급으로 나누었다. 다음 단계로 숙달도별 주제와 기능, 연어변의 의미 투명도, 제약적인 결합, 유의관계와 반의 관계 연어 등을 고려하여 세부 기준을 설정하여 한국어교육을 위한 등급별 연어 목록을 구축하여 제시하였다.