초록

AI기술은 급속도로 발전하고 있으며, 이미 누구나 사용할 수 있는 보편적 기술이 되었고 AI 활용능력이 경쟁력이 되었다. 우리나라도 한국판 뉴딜 2.0, 2022 개정 교육과정 총론 주요사항 발표를 통해 체계적인 AI교육을 위한 계획을 수립하고 있으며, 각급 학교에서도 성공적인 AI교육을 위해 다양한 노력과 연구가 이루어지고 있다. 교육은 교육목적을 달성하기 위한 의도적이고 계획적인 노력이다. 흔히 한 학생의 교과 목표를 달성했는지 여부를 판단하기 위해 형성평가, 수행평가, 또는 지필평가로 대표되는 시험 점수라는 정보를 활용한다. 하지만 AI리터러시와 같이 여러 요인들이 복합적으로 작용하여 형성되는 개인의 역량을 측정하기 위한 도구 개발이 많이 이루어지지 않았으며, 특히 대학입시에 집중하게 되는 일반적인 고등학교 학생을 대상으로 한 AI리터러시 척도 개발 연구는 전무하였다.

이에 본 연구는 AI기술과 함께 미래사회를 맞이해야 하는 고등학생에게 요구되는 AI리터러시의 구성요소를 규명하고, 이를 측정하기 위한 척도를 개발하여 내용타당도, 구인타당도 등의 근거를 확보함으로써 우리나라 고등학생들의 AI리터러시 수준을 확인할 수 있는 타당화된 측정도구를 제안하고자 하였다. 본 연구를 통해 개발된 측정 도구는 일반적인 고등학생을 대상으로 한 인공지능 교육의 목표 설정과 교육방법 설계, 단위학교에서의 교육과정 수립 및 실행에 대한 방향성을 제공해 줄 수 있을 것으로 생각된다. 본 연구가 상정한 구체적인 연구문제는 다음과 같다.

첫째, AI리터러시의 구성 요인은 무엇인가?

둘째, AI리터러시를 측정하기 위한 타당한 문항은 무엇인가?

셋째, AI리터러시 측정 도구는 타당도와 신뢰도를 확보하였는가?

넷째, 우리나라 고등학교 학생의 AI리터러시 수준은 어떠한가?

위와 같은 연구 문제를 달성하기 위해, 우선 문헌연구를 통해 인공지능과 AI리터러시의 정의를 도출하였다. 그리고 AI리터러시의 구성요인으로 AI지식, AI활용, AI평가, AI윤리의 4개 요인을 도출하였고, AI지식 27문항, AI활용 10문항, AI평가 12문항 AI윤리 16문항의 총 65문항의 초기 문항을 개발하였다.

문헌연구를 통해 개발된 초기 문항은 2차례의 델파이 조사를 통해 내용타당도를 확인하였다. 델파이 조사를 위한 패널은 교육공학 전문가 4인과, 고등학교 컴퓨터교육 전문가 2인이 선정되었다. 이들을 대상으로 한 델파이조사 결과, 초기 개발된 65문항 중 AI지식 22문항, AI활용 6문항, AI평가 7문항, AI윤리 14문항의 총 49문항을 선정하였다.

다음으로 델파이 조사를 통해 선정된 AI리터러시 초기 문항을 타당화하기 위해 경기도, 충청도 소재 고등학교에 재학 중인 고등학생 586명을 대상으로 설문조사를 실시하였다. 수집된 자료는 탐색적 요인분석과 확인적 요인분석을 통해 분석되었다. 탐색적 요인분석 결과 AI리터러시는 AI 데이터 지식, AI 기초 지식, AI 심화 지식, AI활용 및 평가, AI 윤리의 5요인으로 구성된 것으로 나타났으며, 총 38문항이 확정되었다. 또한 문항내적일관성 신뢰도를 분석하여 적합한 수준임을 확인하였다. 다음으로 확인적 요인분석 결과, 탐색적 요인분석을 통해 도출된 5개 요인으로 설명되는 모형이 적합한 것으로 확인되었다. 또한 수렴타당도 및 판별타당도가 적절한 수준으로 나타나, AI리터러시 측정 도구의 구인타당도 근거가 확보되었다.

이와 같이 도출된 AI리터러시 측정 도구의 각 요인은 다음과 같이 논의될 수 있다.

첫째, AI지식 요인은 3개의 요인으로 구분되어 나타났다. 본 연구에서는 이를 각각 AI 데이터 지식, AI 기본 지식, AI 심화 지식으로 명명하였다. AI데이터 지식은 총 6문항으로 구성되었으며, 인공지능 학습에 사용되는 데이터에 대한 지식으로, 데이터의 관리, 인공지능 학습에 사용되는 데이터의 종류와 역할, 데이터를 수집하는 데 활용되는 센서에 대한 지식을 포함한다. AI 기초 지식은 총 9문항으로 구성되었으며, 인공지능과 인간지능을 구별하는 역량과, 일상생활에서 사용되는 인공지능 기술이 적용된 도구들을 식별하는 역량, 인공지능을 활용한 문제해결 역량을 포함한다. AI 심화 지식은 총 4문항으로 구성되었으며, 기계학습과 딥러닝에 대한 지식, 딥러닝 활용 분야, 단층 신경망과 다층 신경망의 차이점에 대한 지식을 포함한다.

둘째, AI활용 요인과 AI평가 요인은 하나의 단일 요인으로 구분되었으며, 본 연구에서는 AI활용 및 평가로 명명하였다. AI활용 및 평가 요인은 총 10개의 문항으로 구성되었으며, 인공지능 모델 생성도구를 활용하여 인공지능 모델을 만들 수 있는 역량, 인공지능을 활용해 실제 문제를 해결하는 역량, 인공지능 모델의 성능을 평가하고 개선하는 역량을 포함한다.

셋째, AI 윤리 요인은 단일 요인으로 구분되었으며, 총 9문항으로 구성되었다. AI 윤리는 인공지능에 대한 비판적인 자세, 인공지능의 발전에 따른 사회적 영향력과 변화를 예측하고 대비하는 태도, 인공지능 기술이 적용될 사회 모습을 예상하고 준비하는 자세를 포함한다.

다음으로 확정된 AI리터러시 측정 도구로 고등학생 586명의 AI리터러시 수준을 진단한 결과는 다음과 같다. 전체적인 AI리터러시 수준은 보통 수준에 도달하지 못하였다. 요인별로는 AI 윤리 요인이 평균 3.78로 보통 수준 이상으로 나타났으며, AI 데이터 지식의 평균이 1.92로 가장 낮은 수준으로 나타났다. 75분위 평균을 살펴보았을 때, AI 윤리 요인은 평균 4.33으로 높은 수준을 보여주었으며, AI 데이터 지식의 평균은 2.50으로 가장 낮은 수준의 요인으로 나타났다.

성별에 따른 AI리터러시 수준은 남학생이 여학생보다 통계적으로 유의미하게 높은 것으로 나타났다(p＜.05, 평균차이＝.18). 하위 요인에서는 AI 데이터 지식(p＜.001, 평균차이＝.40), AI 기초 지식(p＜.05, 평균차이＝.15), AI 심화 지식(p＜.001, 평균차이＝.41), 그리고 AI활용 및 평가(p＜.05, 평균차이＝.22)에서 남학생의 수준이 여학생보다 높은 것으로 확인되었다. AI 윤리요인의 경우 여학생의 수준이 남학생보다 높은 것으로 나타났으나(평균차이＝ -.10), 통계적으로 유의미한 수준 차이는 아닌 것으로 확인되었다.

학년에 따른 AI리터러시 수준은 전 학년이 보통 수준에 미치지 못하는 것으로 확인되었다. 학년에 따른 AI리터러시 수준은 3학년 평균 2.97, 1학년 평균 2.82, 2학년 평균 2.73으로 3학년의 수준이 가장 높았으며, 그 다음으로 1학년이 높았고 2학년은 가장 낮은 수준으로 확인되었다. 하위 요인에서의 차이는 AI활용 및 평가(3학년 평균＝3.28, 1학년 평균＝3.10, 2학년 평균＝2.17), AI 데이터 지식(3학년 평균＝2.67, 1학년 평균＝2.67, 2학년 평균＝2.17)요인에서 3학년, 1학년, 2학년 순으로 수준 차이가 확인되었으며, AI 심화 지식(3학년 평균＝3.50, 1학년, 2학년 평균＝3.00)요인에서는 3학년의 수준이 가장 높고, 1학년과 2학년의 수준은 동일한 것으로 확인되었다. AI 기초 지식(전 학년 평균＝3.67)요인에서는 전 학년이 동일한 수준으로 나타났으며, AI 윤리(3학년 평균＝4.53, 2학년 평균＝4.33, 1학년 평균＝4.22)요인에서는 학년이 올라갈수록 수준이 올라가는 것으로 확인되었다.

지역별 AI리터러시 수준 차이를 진단해본 결과, 시 지역과 읍 지역 모두 보통 수준에 미치지 못하는 것으로 확인되었으나 시 지역의 고등학교 학생들의 AI리터러시 수준이 높은 것으로 나타났다(평균차이＝ -.19). 하위 요인 별 수준 차이를 살펴본 결과 AI 데이터 지식 요인에서 -.29(읍 지역 평균＝1.82, 시 지역 평균＝2.11, p＜.05)과 AI 심화 지식 요인에서 -.33(읍 지역 평균＝2.35, 시 지역 평균＝2.68, p＜.05)의 통계적으로 유의한 차이가 나타났다.

이상을 토대로 볼 때, 본 연구는 다음과 같은 의의를 가진다.

첫째, 본 연구를 통해 고등학생의 AI리터러시 함양 정도를 측정할 수 있는 도구를 마련하였다. 본 연구에서 개발된 측정 도구는 일반적인 고등학교 학생들의 인공지능 리터러시 수준을 진단하는데 활용될 수 있을 것이다. 둘째, 고등학교 정규 교육과정 속 인공지능 리터러시 교육의 질적 제고를 하는데 유용한 기초자료로 사용될 수 있을 것이다. 특히, 인공지능 관련 과목을 이수한 학생들과 그렇지 않은 학생들의 비교 분석을 통해 '인공지능 기초' 교과목을 중심으로 한 인공지능 관련 수업의 가치와 중요성에 대한 근거를 제공해 줄 수 있을 것이다. 셋째, 단위 학교에서의 교육과정 계획 과정에 인공지능 리터러시 함양을 위한 다양한 활동을 수립하는데 방향을 제시해 줄 수 있을 것이다. 고등학교 학생들이 이수하는 과목별 특성과 이수 단위를 고려하여 AI리터러시를 구성하는 각 요인들의 역량 강화를 위해 교과 간 융합 교육과정을 계획하는 데 근거와 방향을 제시해 줄 수 있을 것이다.

본 연구의 제한점과 의의를 바탕으로 다음과 같이 후속연구를 제안한다.

첫째, 본 연구는 고등학생 총 586명을 대상으로 하였기 때문에 표본의 크기가 충분하지 못한 점이 있다. 본 연구를 통해 개발된 도구를 활용하여 지속적인 검증을 해 볼 필요가 있다. 둘째, 자기보고식 척도로써의 한계를 극복하기 위한 다양한 검사 도구를 개발하여 다양한 방식으로 복합적인 측정을 고려할 것을 제안한다. 셋째, 국내 일반 고등학교 학생을 대상으로 하는 척도를 개발하고자 하였음에도 불구하고 표본이 특정 지역과 특정 학년에 집중되어 있다. 후속연구를 통해 지역별, 학년별 편중이 없는 표집단을 대상으로 측정 도구의 검증을 해 볼 것을 제안한다. 그리고 학년별 3학급 이하의 소규모 학교에서는 교사 수의 부족으로 인해 해당 학교에 정보 또는 인공지능 관련 과목을 개설할 수 있는 교사가 없을 가능성이 높으며, 결과적으로 보다 큰 규모의 학교에 비해 다양한 교과목 개설 뿐만 아니라 교육과정 설계 및 운영에 상대적으로 제한점이 발생할 수 밖에 없다. 따라서 소규모 학교에 재학중인 고등학생을 대상으로 한 연구를 통해 학생들의 AI리터러시 수준을 진단하여 학교 규모에 따른 격차가 발생하는지 확인할 필요가 있다. 넷째, AI리터러시 측정 또는 도구 개발 연구가 시작 단계에 있기 때문에 본 연구에서 도출한 측정 도구의 준거타당도를 확보하지 못한 한계점이 있다. 따라서 후속연구를 통해 준거타당도를 확보할 것을 제안한다.