표제지
목차
국문요약 7
Abstract 10
01. 서론 28
제1절 연구 목적 및 추진전략 29
1. 연구 배경 및 목적 29
2. 연구 내용 31
제2절 연구 차별성과 추진 체계 35
1. 선행연구와 본 연구의 차별성 35
2. 연구 추진 체계 40
02. 지역별 ICT 고용 전망 모형 개발 43
제1절 연구 배경과 필요성 및 목적 44
1. 연구 배경 44
2. 연구 필요성 45
3. 연구 목적 45
제2절 연구 프레임워크 47
1. 연구 프로세스 47
2. 연구 방법론 48
제3절 ICT 고용지수 산출 50
1. 데이터 준비 및 전처리 50
2. 데이터 레이블링 50
3. 모형 훈련 51
4. 지수화 및 검증 52
제4절 지역별 ICT 고용 전망 모형 개발 55
1. 데이터베이스 비교 및 전망목표 변수의 선택 55
2. 정보통신업 고용현황 56
3. 지역별 ICT 전망 모형의 개발 58
가. 전망모형의 구성 58
나. 모형 비교: 표본 내(in-sample) 예측력 비교 60
4. 지역별 ICT 단기 고용 전망 비교 62
제5절 지역별 ICT 고용 설문조사 수행 68
1. 설문 목적 및 대상 68
2. 단기전망 결과 68
3. 정책 요구사항 71
제6절 결론 74
참고문헌 75
03. 지역발전 정책지원을 위한 도시경쟁력 예측 모델 고도화 76
제1절 연구의 배경 및 목적 77
1. 연구의 배경 77
가. 대내적 연구 배경 77
나. 대외적 연구 배경 77
2. 연구의 목적 78
3. 연구의 범위 79
가. 시간적 범위 79
나. 공간적 범위 79
다. 내용적 범위 79
제2절 도시경쟁력 전망 모형 현행화 80
1. 도시경쟁력 전망 모형 현행화 개요 80
2. 도시경쟁력 전망 모형 현행화 결과 81
가. 도시경쟁력 현황 81
나. 도시경쟁력 전망 88
제3절 도시경쟁력 전망 모형 고도화 92
1. 도시경쟁력 전망 모형 고도화 개요 92
가. 인공지능 기반의 예측 모형 92
나. 인공지능 기반의 예측 모형 해석 93
2. 도시경쟁력 전망 모형 고도화 결과 93
가. 학습 결과 분석 93
나. 미래 통행 예측 결과 99
제4절 결론 및 정책 제언 104
참고문헌 106
04. 데이터기반 입법수요 예측 모형 개발 및 고도화 107
제1절 연구의 배경 및 목적 108
1. 연구 배경 108
2. 연구내용 및 활용방안 108
제2절 언론데이터에서 법제ㆍ입법 이슈와 관련성 판단 및 분류를 위한 연구 110
1. 연구개요 110
가. 들어가며 110
나. 선행연구 111
다. 연구내용과 연구 목표 112
라. 텍스트 문서 분류 방법론 112
2. 언론데이터 전처리 및 불용어 처리 기준 113
가. 목표 모집단과 조사 모집단 113
나. 학습 및 테스트 데이터 115
다. 데이터 전처리 116
3. 분류 방법론의 적용과 결과 119
제3절 국회 입법데이터에서 내용기반의 분류기준 마련 연구 125
1. 토픽모델링 개념 및 분석 방법론 125
2. 분석 설정 127
3. 분석 결과와 해석: 지역 등 중점이슈 128
제4절 (pilot study) 언론이슈와 입법활동 간의 연관성에 대한 분석 및 입법수요 예측모형 개발 136
1. 결과 요약 136
제5절 결론 및 시사점 139
1. 결론 139
2. 향후계획 및 제언 140
참고문헌 141
05. 인구변화에 대응한 지속 가능한 양성평등정책분야 이슈 발굴 모형 개발 143
제1절 서론 144
1. 연구목적 144
2. 연구방법 144
제2절 선행연구 및 사례조사 145
1. 인구구조 변화와 주요 양성평등 이슈 및 쟁점 145
가. 우리나라 양성평등정책 현황 145
나. 인구변화 관련 주요 양성평등 이슈 및 쟁점 분석 146
2. 방법론 및 데이터 현황 147
제3절 분석자료 148
1. 분석방법 148
가. 이슈 모니터링 모형 148
나. 정책수요 예측 모형 148
다. 시각화 도구 149
2. 분석자료 149
가. 자료수집 149
나. 수집 키워드 지정 및 분류 151
3. 분석영역 및 키워드 152
가. 분석영역 및 키워드 도출방법 152
나. 주요 기본계획 검토에 의한 영역ㆍ키워드 산정 152
다. 추진전략 및 정책목표 검토 153
라. 전문가 자문 실시 153
마. 최종 분석영역 및 키워드 도출 153
4. 데이터 수집 및 분류 결과 159
가. 분석자료 특성 159
나. 분석영역 간 정보량 오버랩(overlap) 비율 159
제4절 이슈 모니터링 및 미래예측 분석 160
1. 이슈 모니터링 분석 160
가. 사회적 돌봄 160
나. 성평등 노동환경 162
다. 다양한 가족 165
라. 성재생산 권리 166
2. 정책수요 예측 분석 167
가. 뉴스기사 대상 DMR 결과 167
나. 학술자료 대상 DMR 결과 170
다. DMR 분석결과 종합 및 적정성 평가 172
3. 분석결과 시각화 173
가. 네트워크 분석 173
나. 출처별 키워드 교차분석 174
제5절 결론 및 정책제언 177
1. 개발모형 개선사항 177
2. 모형 고도화 방안 177
가. 개발모형 수정보완 177
나. 양성평등 이슈 발굴 내용 개선방안 178
다. 정형-비정형데이터 연계 방안 178
라. 데이터 방안 모색 178
참고문헌 179
06. 사회통합지수 개발 및 예측 모형 개발 181
제1절 연구 목적 및 추진전략 182
1. 연구 배경 182
2. 연구 목적 182
제2절 사회통합 지표의 제안 184
1. 사회통합 개념에 대한 논의 184
2. 사회통합 측정을 위한 지표들의 설정 187
제3절 사회통합 지표의 분석 189
1. 2022년의 전체 사회통합지수 산출 189
2. 사회통합지수의 인구학적 특성별 분석 191
3. 시간과 인구학적 특성에 따른 사회통합지수 변화 198
제4절 예측모형의 구축 204
1. 예측모델 구축과 실제 예측 결과 204
2. 지역별 사회통합지수의 예측 결과 206
제5절 결론 및 시사점 209
참고문헌 212
07. NRC 빅데이터 연구반 운영 215
제1절 연구의 배경 및 목적 216
1. 연구 배경 216
2. 연구 목적 216
제2절 NRC 빅데이터 연구반 운영 217
1. 연구반 개요 217
2. 연구반 회의 주요 내용 218
제3절 결론 및 시사점 231
08. 결론 232
제1절 연구 결과 233
제2절 향후 과제 235
판권기 237
〈표 1-1〉 데이터 기반 미래예측 정책지원 사업 추진 경과 30
〈표 1-2〉 분야별 예측모형 개발 추진 경과와 특징 31
〈표 1-3〉 인구감소ㆍ지역소멸 대응을 위한 분야별 예측모형 개요 32
〈표 1-4〉 선행연구와 본 연구의 차별성 36
〈표 1-5〉 과제 수행을 위한 세미나와 주요 내용 41
〈표 2-1〉 KPF-sBERT fine tuning 결과모형 성능 52
〈표 2-2〉 주요 산업들의 각 지역별 종사자수 비중 58
〈표 2-3〉 외생변수의 활용 59
〈표 2-4〉 지역 및 모형별 RMSE 61
〈표 2-5〉 단기전망에 대한 이유 71
〈표 2-6〉 지역 고용 활성화를 위해 우선적으로 필요한 요인 및 정책 73
〈표 3-1〉 주요 연구 내용 79
〈표 3-2〉 지역별 출근 통행자족도(2022년) 82
〈표 3-3〉 지역별 출근 통행매력도(2022년) 83
〈표 3-4〉 지역별 여가 통행매력도(2022년) 84
〈표 3-5〉 지역별 출근 소비자족도(2022년) 85
〈표 3-6〉 지역별 출근 소비매력도(2022년) 86
〈표 3-7〉 지역별 여가 소비매력도(2022년) 87
〈표 3-8〉 전국 시도 단위 출근 통행 증감률(2030년, 2050년) 88
〈표 3-9〉 전국 시도 단위 여가 통행 증감률(2030년, 2050년) 89
〈표 3-10〉 전국 시도 단위 출근 소비액 증감률(2030년, 2050년) 90
〈표 3-11〉 전국 시도 단위 여가 소비액 증감률(2030년, 2050년) 91
〈표 3-12〉 서울 기준 출근 유입 통행 상위 시군구(2035년) 100
〈표 3-13〉 서울 기준 출근 유출 통행 상위 시군구(2035년) 101
〈표 3-14〉 서울 기준 여가 유입 통행 상위 시군구(2035년) 102
〈표 3-15〉 서울 기준 여가 유출 통행 상위 시군구(2035년) 103
〈표 4-1〉 한국언론진흥재단 빅카인즈 언론데이터 변수테이블 및 내용 114
〈표 4-2〉 한국언론진흥재단 빅카인즈 언론데이터 언론사 분류 114
〈표 4-3〉 한국언론진흥재단 빅카인즈 언론데이터 사건/사고 분류 115
〈표 4-4〉 한국언론진흥재단 빅카인즈 언론데이터 예시(1) 116
〈표 4-5〉 한국언론진흥재단 빅카인즈 언론데이터 예시(2) 117
〈표 4-6〉 한국언론진흥재단 빅카인즈 언론데이터 예시(3) 118
〈표 4-7〉 추가적인 전처리가 필요한 키워드 예시 119
〈표 4-8〉 데이터셋 버전 1-1의 분류 방법론 별 적용 결과 121
〈표 4-9〉 데이터셋 버전 1-2의 분류 방법론 별 적용 결과 121
〈표 4-10〉 데이터셋 버전 1-3의 분류 방법론 별 적용 결과 121
〈표 4-11〉 데이터셋 버전 2-1의 분류 방법론 별 적용 결과 122
〈표 4-12〉 데이터셋 버전 2-2의 분류 방법론 별 적용 결과 122
〈표 4-13〉 조사모집단에서의 분류 방법론 별 적용 결과 123
〈표 4-14〉 '국민연금, 건강보험, 보장성' 토픽 데이터 및 정책사전(공적연금) 사용자 정의 사전 활용 결과(XGBoost) 124
〈표 4-15〉 LDA(K=16) 분석 결과(키워드 생략) 129
〈표 4-16〉 LDA(K=34) 분석 결과(키워드 생략) 131
〈표 4-17〉 HDP(K=86) 분석 결과 133
〈표 5-1〉 분석자료 요약 150
〈표 5-2〉 양성평등정책 이슈발굴을 위한 최종 분석영역 및 키워드 155
〈표 5-3〉 사회적 돌봄: 아동 161
〈표 5-4〉 사회적 돌봄: 노인 162
〈표 5-5〉 성평등 노동환경: 조직문화 163
〈표 5-6〉 성평등 노동환경: 일생활균형 164
〈표 5-7〉 성평등 노동환경: 경력 및 역량개발 165
〈표 5-8〉 다양한 가족 166
〈표 5-9〉 성재생산 권리 167
〈표 5-10〉 뉴스기사 DMR 결과 168
〈표 5-11〉 학술자료 DMR 결과 171
〈표 6-1〉 사회통합 측정 프레임워크 184
〈표 6-2〉 본 연구의 사회통합측정 지표들 188
〈표 7-1〉 NRC 빅데이터 연구반 참여기관 및 참가자 217
〈표 7-2〉 1차 킥오프 회의 / 2023. 2. 27.(월) 14:00~16:00 220
〈표 7-3〉 2차 연구반 회의 / 2023. 4. 4.(화) 15:00~17:00 223
〈표 7-4〉 3차 연구반 회의 / 2023. 4. 25.(화) 15:00~17:00 224
〈표 7-5〉 4차 연구반 회의 / 2023. 5. 31.(수) 15:00~17:00 226
〈표 7-6〉 5차 연구반 회의 / 2023. 6. 26.(월) 15:00~17:00 229
〈표 8-1〉 NRC데이터정보시스템 제공 서비스 236
[그림 1-1] 연구 추진 배경과 필요성 30
[그림 1-2] 연구 추진 체계 41
[그림 2-1] 지역별 ICT 고용 전망모형 개발 프로세스 48
[그림 2-2] ICT 고용지수 53
[그림 2-3] ICT 고용지수와 ESI(원계열) 비교 54
[그림 2-4] 각 데이터 DB 고용 관련 지수 추이 56
[그림 2-5] 고용 증가율 추이 56
[그림 2-6] ICT 산업 고용 수준 전망 지역별 비교 64
[그림 2-7] ICT 산업 고용 증가율 전망 지역별 비교 65
[그림 2-8] 지역별 단기 고용전망 (평균기준) 67
[그림 2-9] 지역별 단기 고용전망 (증감기준) 67
[그림 2-10] 지역별 전 산업 및 ICT 산업 단기 고용 전망 70
[그림 3-1] 도시경쟁력 전망 모형 구축 방법 81
[그림 3-2] 미래 통행 예측 과정 92
[그림 3-3] 출근 통행 예측 모델 SHAP bar plot 94
[그림 3-4] 출근 통행 예측 모델 SHAP dot plot 95
[그림 3-5] 출근 통행 예측 모델 dependence plot (통행거리 및 통행시간) 96
[그림 3-6] 여가 통행 예측 모델 SHAP bar plot 97
[그림 3-7] 여가 통행 예측 모델 SHAP dot plot 98
[그림 3-8] 여가 통행 예측 모델 dependence plot (통행거리 및 통행시간) 99
[그림 4-1] 문서 분류 알고리즘 예시 113
[그림 4-2] 정밀도(Precision), 재현율(Recall), 정확도(Accuracy) 비교 120
[그림 4-3] 데이터셋 버전 2-2의 분류 방법론 별 성능 123
[그림 4-4] 국회 의안정보시스템 의안상세, 제안이유 및 주요내용 검색 126
[그림 4-5] 분석프로세스 127
[그림 4-6] LDA(K=16) 분석 결과(pyLDAvis) 128
[그림 4-7] Optuna 적용 130
[그림 4-8] Optuna를 적용한 LDA(K=34) 분석 결과(pyLDAvis) 130
[그림 4-9] Optuna 적용(HDP) 132
[그림 4-10] Optuna를 적용한 HDP 분석 결과(pyLDAvis) 132
[그림 4-11] 토픽(지역균형발전/인구감소)에 대한 VAR 분석결과 시각화 137
[그림 4-12] 토픽(국민연금/건강보험/보장성)에 대한 VAR 분석결과 시각화 137
[그림 4-13] 토픽(문화/체육)에 대한 VAR 분석결과 시각화 138
[그림 4-14] 토픽(도로/교통/운송)에 대한 VAR 분석결과 시각화 138
[그림 5-1] 분석자료 수집 및 분류 도식 151
[그림 5-2] 분석키워드 선정 방식 요약 152
[그림 5-3] 분석영역 154
[그림 5-4] DMR 결과(뉴스기사) 170
[그림 5-5] DMR 결과(학술자료) 172
[그림 5-6] 네트워크 분석 예시: 사회적 돌봄(아동, 뉴스기사) 174
[그림 5-7] 뉴스기사-학술자료 주요 키워드 출현율 비교 175
[그림 5-8] 교차표 예시: 사회적 돌봄(아동)(2022년 4분기) 176
[그림 5-9] 교차표 예시: 다양한 가족(2022년 2분기) 176
[그림 6-1] 사회통합지수의 전체 분포 189
[그림 6-2] 사회통합지수의 하위 차원별 가중치 190
[그림 6-3] 사회통합지수의 성별에 따른 분포 191
[그림 6-4] 사회통합지수의 연령에 따른 분포 192
[그림 6-5] 사회통합지수의 결혼상태에 따른 분포 192
[그림 6-6] 사회통합지수의 교육수준에 따른 분포 193
[그림 6-7] 사회통합지수의 고용형태에 따른 분포 193
[그림 6-8] 사회통합지수의 가구소득에 따른 분포 194
[그림 6-9] 사회통합지수의 지역별 분포 195
[그림 6-10] 사회통합지수 하위차원들의 지역별 분포 196
[그림 6-11] 중요도 그림 197
[그림 6-12] 소득의 사회통합지수에 대한 영향 198
[그림 6-13] 사회통합지수의 시간에 따른 변화 199
[그림 6-14] 2020년부터 2022년까지의 하위 영역별 비교 200
[그림 6-15] 연도별 각 사회통합지수 하위영역의 추이 201
[그림 6-16] 연도, 소득수준별 사회통합지수 추이 202
[그림 6-17] 연도, 소득별 사회통합지수 하위영역별 추이 202
[그림 6-18] 사회통합지수와 관련 조건들의 시계열적 변화 204
[그림 6-19] 모형으로부터 예측된 사회통합지수의 변화 206
[그림 6-20] 지역별 사회통합지수 변화 추이 207
[그림 7-1] NRC 빅데이터 연구반 킥오프 회의 220
[그림 7-2] NRC 빅데이터 5차 연구반 온라인 발표 모습 229