표제지
목차
연구요약 5
Ⅰ. 서론 17
1. 연구의 필요성 및 목적 18
2. 연구 내용 20
3. 연구 방법 22
Ⅱ. 교육 빅데이터의 개념 25
1. 교육 빅데이터의 정의 및 특징 26
가. 교육 빅데이터의 정의 26
나. 교육 빅데이터의 특징 27
다. 교육 빅데이터의 유형 30
2. 교육 빅데이터의 기능과 가치 31
3. 시사점 33
Ⅲ. 교육 빅데이터 정책 추진 현황 및 활용 사례 35
1. 국내외 정책 추진 현황 36
가. 국내 정책 추진 현황 36
나. 국외 정책 추진 현황 41
2. 국내외 활용 사례 44
가. 국내 활용 사례 44
나. 국외 활용 사례 47
3. 시사점 50
Ⅳ. 교육 빅데이터 구축 방안 51
1. 교육 데이터 현황 52
가. 공공데이터 현황 52
나. 교육 유관기관 데이터 현황 55
2. 교육 빅데이터 처리 기술 100
3. 교육 빅데이터 플랫폼 구축 방안 114
가. 빅데이터 플랫폼 구축 사례 114
나. 교육 빅데이터 플랫폼 설계 방안 131
4. 시사점 133
Ⅴ. 국가수준 학업성취도 평가 자료를 활용한 교육 빅데이터 분석 방안 135
1. 교육 빅데이터 분석 예시 136
가. 분석 주제 유형화 136
나. 분석 예시 137
2. 교육 빅데이터 실증 분석 151
가. 교육 격차에 대한 텍스트마이닝 분석 151
나. COVID19 전후(2019-2020) 기초학력 미달 학생의 증감 양상에 대한 사교육 및 지역 간 격차 분석 163
3. 시사점 170
Ⅵ. 교육 빅데이터 활용 방안에 관한 인식조사 173
1. 교육 데이터 활용 경험 및 개선 방안 174
가. 교육 데이터 활용 경험 및 만족도 175
나. 교육 데이터 활용 활성화 177
다. 교육 데이터 플랫폼 활용 경험 및 만족도 180
라. 교육 데이터 플랫폼 활용 활성화 182
마. KICE 교육 데이터 활용 경험 및 만족도 185
바. KICE 교육 데이터 활용 활성화 186
사. KICE 교육 데이터 활용도 평가 189
아. KICE 교육 데이터와 타 기관 데이터와의 연계 192
자. KICE 교육 데이터 플랫폼 구축 시 고려사항 193
2. 교육 데이터 플랫폼 운영 경험 및 개선 방안 195
가. 교육 데이터 플랫폼 운영 현황 196
나. 교육 데이터 플랫폼 활성화 방안 199
다. KICE 교육 데이터 플랫폼 구축 시 고려사항 200
3. 시사점 201
Ⅶ. 결론 203
1. 요약 204
가. 교육 빅데이터의 개념 204
나. 교육 빅데이터 정책 추진 현황 및 활용 사례 204
다. 교육 빅데이터 구축 방안 205
라. 국가수준 학업성취도 평가 자료를 활용한 교육 빅데이터 분석 방안 206
마. 교육 데이터 활용 방안에 관한 인식조사 208
2. 정책 제언 210
참고문헌 245
ABSTRACT 259
[부록 1] 인식조사지 266
판권기 2
〈표 Ⅱ-1〉 교육 빅데이터의 유형 30
〈표 Ⅱ-2〉 빅데이터의 가치 31
〈표 Ⅲ-1〉 국내 범정부 차원의 정책 추진 현황 37
〈표 Ⅲ-2〉 국내 교육 분야 정책 추진 현황 39
〈표 Ⅲ-3〉 국외 범정부 차원의 정책 추진 현황 41
〈표 Ⅲ-4〉 국외 교육 분야 정책 추진 현황 42
〈표 Ⅲ-5〉 국내 교육 분야 빅데이터 활용 사례 45
〈표 Ⅲ-6〉 국외 공공 분야 빅데이터 활용 사례 47
〈표 Ⅲ-7〉 국외 교육 분야 빅데이터 활용 사례 48
〈표 Ⅳ-1〉 공공데이터 공개 현황 54
〈표 Ⅳ-2〉 교육 유관기관 및 시도교육청 보유 데이터 현황 55
〈표 Ⅳ-3〉 학업성취도 평가 체제의 변화 56
〈표 Ⅳ-4〉 학업성취도 평가의 개요 58
〈표 Ⅳ-5〉 대학수학능력시험의 개요 59
〈표 Ⅳ-6〉 PISA 개요 60
〈표 Ⅳ-7〉 ICILS 개요 63
〈표 Ⅳ-8〉 TIMSS 개요 65
〈표 Ⅳ-9〉 교육기본통계의 개요 67
〈표 Ⅳ-10〉 한국교육종단연구의 개요 69
〈표 Ⅳ-11〉 학교교육 실태 및 수준 분석 개요 72
〈표 Ⅳ-12〉 EDS 데이터 보유 현황(2020년 기준) 75
〈표 Ⅳ-13〉 한국아동ㆍ청소년패널조사 개요 77
〈표 Ⅳ-14〉 한국교육고용패널조사 개요 78
〈표 Ⅳ-15〉 시도교육청 종단연구 현황 81
〈표 Ⅳ-16〉 서울교육종단연구 개요 83
〈표 Ⅳ-17〉 부산교육종단연구 개요 86
〈표 Ⅳ-18〉 대구교육종단연구 개요 88
〈표 Ⅳ-19〉 경기교육종단연구 개요 91
〈표 Ⅳ-20〉 강원교육종단연구 개요 94
〈표 Ⅳ-21〉 전남교육종단연구 개요 96
〈표 Ⅳ-22〉 전북교육종단연구 개요 99
〈표 Ⅳ-23〉 빅데이터 분석 방법 109
〈표 Ⅳ-24〉 데이터 품질 지표 예시 113
〈표 Ⅳ-25〉 국내외 빅데이터 플랫폼 사례에서의 벤치마킹 요소 129
〈표 Ⅳ-26〉 교육 빅데이터 플랫폼 설계 방안 132
〈표 Ⅴ-1〉 교육 정책 성과 모니터링 영역의 분석 예시 1 138
〈표 Ⅴ-2〉 교육 정책 성과 모니터링 영역의 분석 예시 2 139
〈표 Ⅴ-3〉 교육 정책 성과 모니터링 영역의 분석 예시 3 140
〈표 Ⅴ-4〉 교육 정책 성과 모니터링 영역의 분석 예시 4 141
〈표 Ⅴ-5〉 교육 정책 성과 모니터링 영역의 분석 예시 5 142
〈표 Ⅴ-6〉 학업 성취 향상 영역의 분석 예시 1 143
〈표 Ⅴ-7〉 학업 성취 향상 영역의 분석 예시 2 144
〈표 Ⅴ-8〉 학업 성취 향상 영역의 분석 예시 3 146
〈표 Ⅴ-9〉 학업 성취 향상 영역의 분석 예시 4 147
〈표 Ⅴ-10〉 진로 및 생활지도 영역의 분석 예시 1 148
〈표 Ⅴ-11〉 진로 및 생활지도 영역의 분석 예시 2 149
〈표 Ⅴ-12〉 진로 및 생활지도 영역의 분석 예시 3 150
〈표 Ⅴ-13〉 언론사별 기사 수 152
〈표 Ⅴ-14〉 출현 빈도를 기준으로 한 상위 20개 키워드 155
〈표 Ⅴ-15〉 2019년과 2020년 키워드들의 동시 출현 빈도 157
〈표 Ⅴ-16〉 2019년 교육 격차 기사들의 토픽-단어 행렬-1 159
〈표 Ⅴ-17〉 2019년 교육 격차 기사들의 토픽-단어 행렬-2 160
〈표 Ⅴ-18〉 2019년 교육 격차 기사들의 토픽-단어 행렬-3 161
〈표 Ⅴ-19〉 2020년 교육 격차 기사들의 토픽-단어 행렬-1 161
〈표 Ⅴ-20〉 2020년 교육 격차 기사들의 토픽-단어 행렬-2 162
〈표 Ⅴ-21〉 투입된 변수의 기술통계치 166
〈표 Ⅴ-22〉 다층모형 분석 결과 168
〈표 Ⅵ-1〉 설문 대상 174
〈표 Ⅵ-2〉 교육 데이터 전문가용 설문의 구성 175
〈표 Ⅵ-3〉 교육 데이터 활용 빈도(N=47) 175
〈표 Ⅵ-4〉 교육 데이터 활용 만족도(N=46) 176
〈표 Ⅵ-5〉 교육 데이터 활용 활성화 정도(N=46) 177
〈표 Ⅵ-6〉 교육 데이터 활용 활성화 방안의 중요도(N=47) 178
〈표 Ⅵ-7〉 교육 데이터 플랫폼 활용 빈도(N=46) 180
〈표 Ⅵ-8〉 교육 데이터 플랫폼 활용 만족도 181
〈표 Ⅵ-9〉 교육 데이터 플랫폼 활용의 저해요인 및 활성화 방안 183
〈표 Ⅵ-10〉 KICE 데이터 활용 만족도 185
〈표 Ⅵ-11〉 KICE 데이터 활용의 저해요인 및 활성화 방안 186
〈표 Ⅵ-12〉 KICE의 대규모 평가 데이터 활용도 189
〈표 Ⅵ-13〉 교육정책 및 현안 분야별 KICE의 대규모 평가 데이터의 활용도 190
〈표 Ⅵ-14〉 국가수준 학업성취도 평가 자료가 적극적으로 활용될 수 있는 분야 191
〈표 Ⅵ-15〉 KICE 대규모 평가 데이터와 타 기관과의 연계 필요성 192
〈표 Ⅵ-16〉 KICE 데이터와 타 기관 교육 데이터 결합ㆍ활용 시 장애요인 193
〈표 Ⅵ-17〉 KICE 교육 데이터 플랫폼 구축 시 고려사항별 중요도(N=46) 194
〈표 Ⅵ-18〉 교육 데이터 플랫폼 담당자용 설문의 구성 195
〈표 Ⅵ-19〉 교육 데이터 플랫폼 담당자의 데이터 제공 빈도 196
〈표 Ⅵ-20〉 교육 데이터 제공 활성화 정도에 대한 인식 196
〈표 Ⅵ-21〉 교육 데이터 플랫폼 운영상 어려움 및 요구사항 197
〈표 Ⅵ-22〉 교육 데이터 플랫폼 활성화 방안 199
〈표 Ⅵ-23〉 KICE 교육 데이터 플랫폼 구축 시 고려사항에 대한 중요도(N=12) 200
〈표 Ⅵ-24〉 교육 빅데이터 구축 및 활용 활성화를 위한 주요 쟁점 및 과제 202
〈표 Ⅶ-1〉 「초ㆍ중등교육법」 30조의6의 개정 213
〈표 Ⅶ-2〉 자료 이용 범위에 따른 자료 제공 방식 216
〈표 Ⅶ-3〉 시도교육청 종단연구의 단계별 통합 추진 방안 232
〈표 Ⅶ-4〉 학업성취도 평가(NAEA)와 시도교육청 종단연구 연계 가능 웨이브 233
〈표 Ⅶ-5〉 학업성취도 평가와 시도교육청 종단연구 설문조사 유사 항목 235
[그림 Ⅱ-1] 빅데이터의 정의 26
[그림 Ⅱ-2] 스마트 환경에서 생성되는 데이터 예시 27
[그림 Ⅱ-3] 빅데이터의 특징 29
[그림 Ⅱ-4] 교육 빅데이터의 기능과 가치 32
[그림 Ⅱ-5] 교육 빅데이터 활용 시나리오 34
[그림 Ⅲ-1] 국내 데이터 정책 추진 현황 36
[그림 Ⅲ-2] 국내 공공 분야 빅데이터 분석 결과 정책 활용 사례 44
[그림 Ⅳ-1] 우리나라의 공공데이터 개방 표준 추진체계 52
[그림 Ⅳ-2] 교육공공데이터 개방 체계 53
[그림 Ⅳ-3] 빅데이터의 일반적인 처리 절차 100
[그림 Ⅳ-4] 표준화 예시 102
[그림 Ⅳ-5] 표준 연계키 활용 방식 103
[그림 Ⅳ-6] 개인정보 비식별화 및 익명화의 개념 104
[그림 Ⅳ-7] 개인 식별 요소 제거 방식 104
[그림 Ⅳ-8] 기관 간 자료 연계 방식 104
[그림 Ⅳ-9] 맵리듀스(MapReduce)의 개념 105
[그림 Ⅳ-10] 하둡 에코시스템(Hadoop Ecosystem) 106
[그림 Ⅳ-11] 데이터 통합방식(ETL vs ELT) 106
[그림 Ⅳ-12] 대용량 저장장치(DAS, NAS, SAN) 108
[그림 Ⅳ-13] SQL과 NoSQL의 비교 109
[그림 Ⅳ-14] 데이터 시각화 그래프의 종류 111
[그림 Ⅳ-15] 교육 분야 시각화 예시 112
[그림 Ⅳ-16] 빅데이터의 처리 단계별 고려사항 113
[그림 Ⅳ-17] 국내 공공 분야 빅데이터 플랫폼 구축ㆍ운영 사례 115
[그림 Ⅳ-18] 국내 교육 분야 빅데이터 플랫폼 구축ㆍ운영 사례 117
[그림 Ⅳ-19] 국외 공공 분야 빅데이터 플랫폼 구축ㆍ운영 사례 120
[그림 Ⅳ-20] 국외 교육 분야 빅데이터 플랫폼 구축ㆍ운영 사례 123
[그림 Ⅳ-21] NCES 데이터 서비스 구조 124
[그림 Ⅳ-22] Ed-fi 데이터 통합 모형(UDM) 예시 126
[그림 Ⅳ-23] MiDataHub의 교육 시스템 인벤토리 127
[그림 Ⅳ-24] IDB Analyzer의 결합 모듈을 이용한 국가 간 데이터 연계 129
[그림 Ⅴ-1] 국가수준 학업성취도 평가 자료를 활용한 빅데이터 분석 방안 도출 절차 136
[그림 Ⅴ-2] 국가수준 학업성취도 평가 자료를 활용한 빅데이터 분석 주제 및 유형화 예시 137
[그림 Ⅴ-3] 최근 3년간 월별 기사 수 153
[그림 Ⅴ-4] 출현 빈도를 기준으로 한 상위 20개 키워드의 워드클라우드 156
[그림 Ⅴ-5] 의미 연결망 분석 결과 158
[그림 Ⅴ-6] 최적의 토픽개수를 결정하기 위한 로그우도(loglik) 159
[그림 Ⅶ-1] 주요 연구 내용 및 결과 210
[그림 Ⅶ-2] 정책 제언 및 추진 전략 211
[그림 Ⅶ-3] 서로 다른 개인정보처리자 간 가명정보 결합 절차 214
[그림 Ⅶ-4] 저작권 확인 절차(행정안전부(2019), p.19. 재인용) 216
[그림 Ⅶ-5] 교육 빅데이터 얼라이언스(가칭) 218
[그림 Ⅶ-6] 교육빅데이터위원회 개정(안) 219
[그림 Ⅶ-7] 빅데이터 플랫폼 구성 방안 222
[그림 Ⅶ-8] 수집ㆍ연계 영역 구성 방안 223
[그림 Ⅶ-9] 저장ㆍ처리 영역 구성 방안 223
[그림 Ⅶ-10] 분석 영역 구성 방안 224
[그림 Ⅶ-11] 분석 흐름도 224
[그림 Ⅶ-12] 서비스 영역 구성 방안 225
[그림 Ⅶ-13] 보안 및 작업관리 영역 구성 방안 226
[그림 Ⅶ-14] KICE 교육 빅데이터 플랫폼 구축을 위한 중장기 발전 이행 로드맵 226
[그림 Ⅶ-15] 교육 분야 공통기반 플랫폼 아키텍처 228
[그림 Ⅶ-16] 공공데이터포털 국가데이터맵 관계도맵(전라북도교육청 예시) 230
[그림 Ⅶ-17] 미시간 주 위기학생 조기경보 시스템(EWIMS) 화면 240