표제지
목차
국문요약 5
Abstract 15
제1장 서론 30
제1절 연구 배경과 목적 31
1. 연구 배경 31
2. 연구 목적 32
제2절 연구 내용과 추진체계 33
1. 연구 내용 33
2. 연구 추진체계 34
제2장 데이터 기반 정책 연구 동향과 주요국 사례 분석 37
제1절 데이터 기반 정책 연구 동향 38
1. 데이터ㆍ증거기반정책에 대한 본질적 논의 38
2. 데이터ㆍ증거기반정책에 대한 역사적 접근 40
3. 데이터ㆍ증거기반정책의 결과에 관한 연구 40
4. 데이터ㆍ증거기반정책의 영향요인 41
제2절 주요국의 데이터 기반 정책 벤치마킹 44
1. 미국의 증거기반정책법 44
2. 영국 ADR UK 52
제3장 텍스트자료를 활용한 ICT이슈 탐지 및 분석 방법론 연구 58
제1절 연구의 배경 및 목적 59
1. 연구의 배경 59
2. 연구의 목적 60
3. 연구의 범위 및 수행 방안 61
제2절 ICT정책이슈 텍스트마이닝 분석 62
1. 문제 제기 62
2. 분석 대상 자료 수집 및 전처리 62
3. 기초 분석 67
4. 공동출현 네트워크 분석 70
5. 토픽 모형 분석 79
6. 섹션별 주요 단어를 기반으로 한 토픽 주제 추론 83
7. 요약 및 시사점 89
제3절 미ㆍ중 통상마찰의 전개과정과 ICT이슈 텍스트마이닝 분석 91
1. 미ㆍ중 통상마찰 개요 91
2. 분석 프로세스 92
3. 기초분석 94
4. 토픽모델링 분석 98
5. 미ㆍ중 갈등관련 국내외 ICT 이머징 이슈 탐색 103
제4절 결론 및 시사점 107
1. 분석결과 요약 107
2. 연구의 성과 108
3. 연구의 한계 110
제4장 정형ㆍ비정형 데이터 기반 ICT수출 예측 방법론 개발 111
제1절 연구의 개요 112
1. 연구배경 112
2. 기존연구 113
3. 연구내용 114
제2절 온라인뉴스 지수화 116
1. 온라인뉴스 수집(크롤링, crawling) 116
2. 전처리(pre-processing) 및 단어 임베딩(embedding) 116
3. 분류모형 121
4. 온라인 뉴스 지수화 124
제3절 주제별 지수를 활용한 예측모형 127
1. 비추정(ratio estimation) 모형 127
2. 기계학습 분류 이용 예측 128
3. 어휘사전 분류 이용 예측결과 131
4. 결과 요약 133
제4절 ICT수출 전망 모형의 구축 135
1. 예측모형의 구축 135
2. 비정형 데이터와의 결합 138
3. 예측모형 추정과 예측결과 139
4. 비정형 데이터와 결합된 모형의 예측 결과 142
제5절 소결론 145
1. 연구 성과와 한계 145
2. 연구의의와 기대효과 146
제5장 인구지형변화에 따른 머신러닝 기반 고등교육 계열별 수요예측 모형 개발 147
제1절 연구의 필요성 148
제2절 연구의 목적 153
제3절 빅데이터와 AI를 활용한 데이터 분석 방법 154
1. 데이터 과학의 분석 단계 154
2. 데이터 분석 환경 155
3. 데이터 분석 알고리즘 157
제4절 선행 연구 158
1. 교육 분야의 빅데이터, AI 관련 연구 158
2. 대학정원 및 대학 학생 수급 관련 연구 현황 159
3. 주요 선행연구와의 차별화 161
제5절 고등교육기관 졸업자 취업통계 데이터 163
1. 데이터 형태 163
2. 데이터 분석 164
제6절 통계청 전국 사업체 조사 데이터 173
1. 데이터 형태 173
2. 데이터 분석 174
제7절 계열별 산업수요예측 모델 185
제8절 계열별 산업수요예측 모델 산출결과 190
1. 원 산업수요 예측 지수(Idxorg) 190
2. 중계열별 산업 수요 예측지수(Idx) 193
3. 계열별 산업 수요 예측 분석 시스템 프로토타입 194
제9절 정책적 제언 200
제6장 결론 201
제1절 연구의 성과와 한계 202
제2절 연구의의와 기대효과 204
참고문헌 205
판권기 213
〈표 1-1〉 협동연구 담당 기관 및 역할 35
〈표 1-2〉 전문가 초청 세미나 주요 내용 36
〈표 2-1〉 데이터ㆍ증거기반정책에 대한 본질적 논의 연구 39
〈표 2-2〉 증거기반정책의 역사적 접근 연구 40
〈표 2-3〉 데이터/증거기반정책의 결과에 대한 연구 41
〈표 2-4〉 데이터/증거기반정책의 영향요인에 대한 연구 43
〈표 2-5〉 연방정부 기관별 증거구축계획 45
〈표 2-6〉 연방정부의 증거구축을 위한 기관별 평가관 및 통계관의 임명 45
〈표 2-7〉 증거구축을 위한 데이터자문위원회 구성 및 기능 46
〈표 2-8〉 CDO(Chief Data Officer)의 설치와 기능 48
〈표 2-9〉 CDOC(Chief Data Officer Council) 설치와 기능 49
〈표 2-10〉 비밀정보보호의 내용 50
〈표 2-11〉 DSA(Designated Statistical Agencies) 목적과 책임 50
〈표 2-12〉 ADRN의 배경 52
〈표 2-13〉 초기 ADRN의 구성(2013년 10월) 53
〈표 2-14〉 ADR UK의 파트너십 54
〈표 2-15〉 ADRN 내부 거버넌스 구조 55
〈표 2-16〉 ADR UK의 부처와의 협력 관계 56
〈표 3-1〉 색션별/연도별 수집 문헌 수 63
〈표 3-2〉 ICT정책 분야 TF 및 TF-IDF 67
〈표 3-3〉 SW/컨텐츠 분야 TF 및 TF-IDF 68
〈표 3-4〉 ICT융합 분야 TF 및 TF-IDF 69
〈표 3-5〉 ICT정책 분야 토픽 도출 결과 81
〈표 3-6〉 ICT정책 섹션 내 토픽 요약 83
〈표 3-7〉 SW/컨텐츠 분야 토픽 도출 결과 84
〈표 4-8〉 SW/컨텐츠 섹션 내 토픽 요약 86
〈표 3-9〉 ICT융합 분야 토픽 도출 결과 87
〈표 3-10〉 ICT융합 섹션 내 토픽 요약 89
〈표 3-11〉 2018~2019년 미ㆍ중 무역분쟁 경과 91
〈표 4-1〉 doc2vec 학습결과: 유사성이 높은 단어 벡터 추출 120
〈표 4-2〉 주제 분류 결과 122
〈표 4-3〉 감성지수 분류 결과 123
〈표 4-4〉 주제 분류에 대한 confusion matrix 123
〈표 4-5〉 감정 분류에 대한 confusion matrix 124
〈표 4-6〉 기계학습 예측 결과 비교(분기별) 130
〈표 4-7〉 기간별 최소 RMSE 결과 131
〈표 4-8〉 기간별 최소 RMSE 결과 133
〈표 4-9〉 전기 대비 ICT수출을 예측한 상대적 MSFE 결과 141
〈표 4-10〉 전년 동기대비 ICT수출을 예측한 상대적 MSFE 결과 141
〈표 4-11〉 전기대비 ICT수출에 대한 DMA 모형의 상대적 RMSE 결과 143
〈표 4-12〉 전기대비 ICT수출에 대한 DMS 모형의 상대적 RMSE 결과 143
〈표 5-1〉 기관별 교육관련 데이터 보유현황 149
〈표 5-2〉 빅데이터 또는 빅데이터 분석 기법을 활용한 교육 분야 선행연구 150
〈표 5-3〉 데이터 과학 프로세스 154
〈표 5-4〉 온나라 정책연구 사이트의 검색키워드 별 연구 검색 건수 158
〈표 5-5〉 주요 선행연구와의 차별성 162
〈표 5-6〉 1차 분석을 위한 고등교육기관 졸업자 취업통계 데이터 163
〈표 5-7〉 산업 중분류별 인문계열 취업자 분포 165
〈표 5-8〉 산업 중분류별 사회계열 취업자 분포 166
〈표 5-9〉 산업 중분류별 자연계열 취업자 분포 167
〈표 5-10〉 산업 중분류별 공학계열 취업자 분포 168
〈표 5-11〉 산업 중분류별 의학계열 취업자 분포 170
〈표 5-12〉 산업 중분류별 교육계열 취업자 분포 171
〈표 5-13〉 산업 중분류별 예체능계열 취업자 분포 172
〈표 5-14〉 1차 분석을 위한 통계청 전국 사업체 조사 데이터 173
〈표 5-15〉 산업 대분류, 중분류별 산업별 전망가중치와 관련 통계 186
〈표 5-16〉 중계열별 원 산업수요 예측 지수 산출 결과 191
〈표 5-17〉 중계열별 산업수요 예측 지수 산출 결과 193
[그림 1-1] 협동연구 추진 체계 35
[그림 2-1] ONS SRS 데이터 목록 57
[그림 3-1] 섹션별/연도별 수집 문헌 수 그래프 63
[그림 3-2] ITFIND 내 보고서 요약문 예시 65
[그림 3-3] 단어사전별 형태소 분석 결과 66
[그림 3-4] ICT 정책 섹션 내 단어들의 공동출현 네트워크(전체 기간) 71
[그림 3-5] ICT 정책 섹션 내 단어들의 공동출현 네트워크(1기 '08-'12) 72
[그림 3-6] ICT 정책 섹션 내 단어들의 공동출현 네트워크(2기 '13~'15) 73
[그림 3-7] ICT 정책 섹션 내 단어들의 공동출현 네트워크(3기 '16~'19) 73
[그림 3-8] SW/컨텐츠 섹션 내 단어들의 공동출현 네트워크(전체 기간) 74
[그림 3-9] SW/컨텐츠 섹션 내 단어들의 공동출현 네트워크(1기 '08~'12) 75
[그림 3-10] SW/컨텐츠 섹션 내 단어들의 공동출현 네트워크(2기 '13~'15) 75
[그림 3-11] SW/컨텐츠 섹션 내 단어들의 공동출현 네트워크(3기 '16~'19) 76
[그림 3-12] ICT융합 섹션 내 단어들의 공동출현 네트워크(전체 기간) 77
[그림 3-13] ICT융합 섹션 내 단어들의 공동출현 네트워크(1기 '08~'12) 77
[그림 3-14] ICT융합 섹션 내 단어들의 공동출현 네트워크(2기 '13-'15) 78
[그림 3-15] ICT융합 섹션 내 단어들의 공동출현 네트워크(3기 '16~'19) 78
[그림 3-16] ICT정책 섹션 내 시점별 토픽 비중 변화 82
[그림 3-17] SW/컨텐츠 섹션 내 시점별 토픽 비중 변화 85
[그림 3-18] ICT융합 섹션 내 시점별 토픽 비중 변화 88
[그림 3-19] 텍스트 자료 분석 및 이슈 도출 프로세스 93
[그림 3-20] 연구 프로세스 93
[그림 3-21] 미국 매체의 텍스트마이닝 분석 결과 94
[그림 3-22] Semantic network: US media(2018. 4)-"Huawei" 95
[그림 3-23] 중국 매체의 텍스트마이닝 분석 결과 96
[그림 3-24] Semantic network: Chinese media(2018. 4)-"Huawei" 96
[그림 3-25] 미국과 중국 매체의 비교 분석 결과 97
[그림 3-26] 미국과 중국 매체의 담론적 해석 결과 98
[그림 3-27] 토픽 모델 분석 결과: 2차원 시각화 98
[그림 3-28] 토픽 모델 분석 결과: 국가별 토픽 비율 99
[그림 3-29] 토픽 모델 분석 결과: 핵심 이슈 시계열 분석(1)-안보 개념의 확장 100
[그림 3-30] 토픽 모델 분석 결과: 핵심 이슈 시계열 분석(2)-ZTE에 대한 제재와 해제 100
[그림 3-31] 토픽 모델 분석 결과: 핵심 이슈 시계열 분석(3)-화웨이에 대한 제재 101
[그림 3-32] 토픽 모델 분석 결과: 핵심 이슈 시계열 분석(4)-미ㆍ중 무역분쟁 공고화 101
[그림 3-33] 미국 매체에서 중국 및 한국 기업(삼성) 언급 추세 103
[그림 3-34] 중국 매체 속 화웨이 & 삼성의 연결 관계 104
[그림 3-35] 토픽 모델 분석 결과: 해외(미-중)매체에서 삼성의 구조적 위치 105
[그림 3-36] 중국 매체 기술 관심 및 트렌드 106
[그림 4-1] 2017년 이후 분기별 DRAM과 NAND 플래쉬 시장 규모와 가격 113
[그림 4-2] 온라인 뉴스 기사 지수화 작업 흐름도 115
[그림 4-3] CBOW와 Skip-gram의 Architecture 118
[그림 4-4] DM 방식의 Architecture 119
[그림 4-5] DBOW 방식의 Architecture 119
[그림 4-6] 각 신문사내 분기별 수요지수 추이(로지스틱 모형) 125
[그림 4-7] 각 신문사내 분기별 수요지수 추이 125
[그림 4-8] 각 신문사내 분기별 경쟁력지수 추이 126
[그림 4-9] 수요 지수를 활용한 분기별 수출액 예측(로지스틱 모형) 128
[그림 4-10] 수요 지수를 활용한 분기별 수출액 예측(랜덤포레스트 모형) 128
[그림 4-11] 공급 지수를 활용한 분기별 수출액 예측(로지스틱 모형) 129
[그림 4-12] 공급 지수를 활용한 분기별 수출액 예측(랜덤포레스트 모형) 130
[그림 4-13] 수요 지수를 활용한 분기별 수출액 예측 131
[그림 4-14] 공급 지수를 활용한 분기별 수출액 예측 132
[그림 4-15] 경쟁력 지수를 활용한 분기별 수출액 예측 133
[그림 5-1] 학령인구 추계 151
[그림 5-2] 대학입학정원 및 고등학교 졸업자 추이 151
[그림 5-3] 빅데이터, 인공지능과 데이터 과학간의 관계 154
[그림 5-4] Top 데이터과학, 머신러닝, 데이터 분석 도구 156
[그림 5-5] 구글 스칼라에서 인용된 통계 패키지 156
[그림 5-6] 데이터 과학, 머신러닝 알고리즘 점유율(2017년 대비 2018/2019) 157
[그림 5-7] 인문계열 취업자의 산업 대분류별 진출 분야 164
[그림 5-8] 사회계열 취업자의 산업 대분류별 진출 분야 165
[그림 5-9] 자연계열 취업자의 산업 대분류별 진출 분야 167
[그림 5-10] 공학계열 취업자의 산업 대분류별 진출 분야 168
[그림 5-11] 의학계열 취업자의 산업 대분류별 진출 분야 169
[그림 5-12] 교육계열 취업자의 산업 대분류별 진출 분야 171
[그림 5-13] 예체능계열 취업자의 산업 대분류별 진출 분야 172
[그림 5-14] 전체 중분류 중 제조업 대분류 종사자수 변화추이(1) 174
[그림 5-15] 제조업 대계열에 속한 중계열의 종사자수 변화 추이(1) 175
[그림 5-16] 전체 중분류 중 제조업 대분류 종사자수 변화추이(2) 175
[그림 5-17] 제조업 대계열에 속한 중계열의 종사자수 변화 추이(2) 176
[그림 5-18] 제조업 대계열에 속한 중계열의 종사자수 변화 추이(3) 176
[그림 5-19] 전체 중분류 중 제조업 대분류 종사자수 변화추이(3) 177
[그림 5-20] 전체 중분류 중 제조업 대분류 종사자수 변화추이(4) 177
[그림 5-21] 제조업 대계열에 속한 중계열의 종사자수 변화 추이(4) 178
[그림 5-22] 전체 중분류 중 제조업 대분류 종사자수 변화추이(5) 178
[그림 5-23] 제조업 대계열에 속한 중계열의 종사자수 변화 추이(5) 179
[그림 5-24] 전체 중분류 중 제조업 대분류 종사자수 변화추이(6) 179
[그림 5-25] 제조업 대계열에 속한 중계열의 종사자수 변화 추이(6) 180
[그림 5-26] 전체 중분류 중 정보통신업 대분류 종사자수 변화추이 181
[그림 5-27] 정보통신업 대계열에 속한 중계열의 종사자수 변화 추이 181
[그림 5-28] 정보통신업 대계열에 속한 중계열의 사업체수 변화 추이 182
[그림 5-29] 전체 중분류 중 전문, 과학 및 기술 서비스업 대분류 종사자수 변화추이 183
[그림 5-30] 전문, 과학 및 기술 서비스업 대계열에 속한 중계열의 종사자수 변화 추이 184
[그림 5-31] 전문, 과학 및 기술 서비스업 대계열에 속한 중계열의 사업체수 변화 추이 184
[그림 5-32] 중분류별 산업별 전망 가중치 그래프 188
[그림 5-33] 원 산업수요 예측분포 그래프 192
[그림 5-34] 원 산업수요 예측분포 그래프 계열별 산업 수요 예측 분석 시스템 프로토타입 화면-고등교육기관 학과별 취업현황(중계열) 195
[그림 5-35] 원 산업수요 예측분포 그래프 계열별 산업 수요 예측 분석 시스템 프로토타입 화면-고등교육기관 학과별 학생현황(소계열) 195
[그림 5-36] 원 산업수요 예측분포 그래프계열별 산업 수요 예측 분석 시스템 프로토타입 화면-고등교육기관 학과별 취업현황(중계열) 196
[그림 5-37] 원 산업수요 예측분포 그래프계열별 산업 수요 예측 분석 시스템 프로토타입 화면-고등교육기관 학과별 취업현황(소계열) 196
[그림 5-38] 원 산업수요 예측분포 그래프 계열별 산업 수요 예측 분석 시스템 프로토타입 화면-산업현황 대분류 197
[그림 5-39] 원 산업수요 예측분포 그래프 계열별 산업 수요 예측 분석 시스템 프로토타입 화면-산업현황 중분류 198
[그림 5-40] 원 산업수요 예측분포 그래프 계열별 산업 수요 예측 분석 시스템 프로토타입 화면-계열별산업별취업현황분석(중계열) 198
[그림 5-41] 원 산업수요 예측분포 그래프 계열별 산업 수요 예측 분석 시스템 프로토타입 화면-계열별산업별취업현황분석(소계열) 199
[그림 5-42] 원 산업수요 예측분포 그래프 계열별 산업 수요 예측 분석 시스템 프로토타입 화면-계열별산업별취업현황분석(학과) 199
〈수식 5-1〉 산업수요예측지수 모델 185