표제지
목차
국문요약 10
영문요약 13
제1장 서론 16
1.1. 연구의 배경과 필요성 16
1.2. 연구의 목적과 방법 18
제2장 이론적 배경 및 선행연구 고찰 21
2.1. 이론적 배경 21
2.1.1. 빅 데이터 (Big Data) 21
2.1.2. 공간 빅 데이터 24
2.1.3. 토픽 모델링 (Topic Modeling) 27
2.1.4. 감성분석 29
2.2. 선행 연구 및 분석기술 30
2.2.1. 비정형텍스트의 텍스트 마이닝 분석 방법론 30
2.2.2. SNS 데이터를 활용한 사회적 문제의 시공간적 측면 탐색 연구 31
2.2.3. Sentiment in New York City : A High Resolution Spatial and Temporal View 32
제3장 환경민원 빅 데이터 토픽모델링 연구 34
3.1. 실험 개요 34
3.2. 데이터 수집 및 전처리 작업 35
3.2.1. 민원 행정 제도 35
3.2.2. 환경민원의 특징 및 수집절차 36
3.2.3. 환경민원 빅 데이터의 전처리 작업 및 워드 클라우드 생성 42
3.3. 환경민원 빅 데이터 토픽모델링 45
3.3.1. 토픽모델링 45
3.3.2. 환경민원 빅 데이터의 토픽 모델링 46
제4장 환경민원 빅 데이터의 감성분석 및 공간패턴 분석 54
4.1. 환경민원 빅 데이터의 감성분석 54
4.1.1. 감성분석 54
4.1.2. 헤도노미터 행복도점수의 정의 및 특징 57
4.1.3. EC_Score 산정방법 및 적용결과 61
4.2. 환경민원 빅 데이터의 지역적 분포 패턴 공간분석 66
4.2.1. 수집지역 공간모델링 및 스키마 구축 66
4.2.2. 환경민원 빅 데이터의 지역적 분포 및 공간 패턴 분석 70
4.2.3. Nor_EC_Score를 적용한 환경민원 빅 데이터의 토픽별 공간 분포 패턴 분석 74
제5장 결론 80
참고문헌 83
〈표 2.1〉 빅 데이터의 분석 방법 22
〈표 2.2〉 공간 빅 데이터의 개념 24
〈표 2.3〉 공간 빅 데이터의 추가 구성요소 25
〈표 2.4〉 공간 빅 데이터 분석 방법 26
〈표 2.5〉 토픽모델링 기법의 종류 28
〈표 3.1〉 민원 처리기간표 36
〈표 3.2〉 중앙환경분쟁조정위원회 접수 및 처리현황 38
〈표 3.3〉 중앙환경분쟁조정위원회 피해원인별 처리현황 38
〈표 3.4〉 중앙환경분쟁조정위원회 발생지역별 처리현황 39
〈표 3.5〉 환경민원 데이터 현황 40
〈표 3.6〉 환경 키워드의 동일 태그 규칙성 42
〈표 3.7〉 환경민원 빅 데이터의 키워드 Top 50 (서울특별시 대상) 44
〈표 3.8〉 K=5일 때의 토픽모델링 결과 47
〈표 3.9〉 K=6일 때의 토픽모델링 결과 47
〈표 3.10〉 K=7일 때의 토픽모델링 결과 47
〈표 3.11〉 K=8일 때의 토픽모델링 결과 48
〈표 3.12〉 K=9일 때의 토픽모델링 결과 48
〈표 3.13〉 K=10일 때의 토픽모델링 결과 49
〈표 3.14〉 토픽 명 및 토픽번호 부여 결과 50
〈표 4.1〉 환경민원 빅 데이터의 헤도노미터 행복도 점수 산정 점수 예시 58
〈표 4.2〉 환경민원 빅 데이터의 헤도노미터 중복 단어 59
〈표 4.3〉 민원 G1의 EC_Score 산정과정 63
〈표 4.4〉 민원 G2의 EC_Score 산정과정 64
〈표 4.5〉 환경민원 빅 데이터의 EC_Score와 Nor_EC_Score 값 65
〈표 4.6〉 속성 스키마 정보 70
〈그림 1.1〉 연구 흐름도 20
〈그림 2.1〉 LDA 모델의 생성과정 29
〈그림 2.2〉 Public sentiment analysis of Manhattan and surrounding areas 33
〈그림 3.1〉 토픽모델링의 절차 34
〈그림 3.2〉 강남구 새올전자민원창구 2016년 2월 14일 민원내용 41
〈그림 3.3〉 환경민원 데이터 마이닝 결과 42
〈그림 3.4〉 환경민원 빅 데이터의 워드 클라우드 생성 결과 44
〈그림 3.5〉 환경민원 빅 데이터의 토픽주제별 건수 51
〈그림 3.6〉 서울특별시 도봉구의 환경미화원 칭찬 민원 52
〈그림 3.7〉 서울특별시 영등포구의 환경미화원 불만 민원 52
〈그림 4.1〉 환경민원 감성분석의 연구흐름도 57
〈그림 4.2〉 헤도노미터의 일일 평균 행복지수 분석 58
〈그림 4.3〉 환경민원 감성점수 산정방법 61
〈그림 4.4〉 환경민원 감성점수 백분위 정규화 산정방법 62
〈그림 4.5〉 토픽별 Nor_EC_Score 평균점수 65
〈그림 4.6〉 공간모델링 방법 분류 모형 67
〈그림 4.7〉 행정구역 명을 통한 공간정보 생성과정 67
〈그림 4.8〉 지형지물을 통한 공간정보 생성과정 68
〈그림 4.9〉 민원자료에 위치정보가 누락된 경우 68
〈그림 4.10〉 수집 민원들의 공간정보 구축결과 69
〈그림 4.11〉 행정경계 별 공간적 분포 71
〈그림 4.12〉 건축심의 토픽의 공간적 분포 71
〈그림 4.13〉 공사/소음 토픽의 공간적 분포 72
〈그림 4.14〉 도시미관 토픽의 공간적 분포 73
〈그림 4.15〉 생활편의 토픽의 공간적 분포 73
〈그림 4.16〉 안전단속 토픽의 공간적 분포 74
〈그림 4.17〉 환경민원의 Nor_EC_Score 공간 패턴 분석 75
〈그림 4.18〉 건축심의 토픽의 Nor_EC_Score 공간 패턴 분석 76
〈그림 4.19〉 공사/소음 토픽의 Nor_EC_Score 공간 패턴 분석 77
〈그림 4.20〉 도시미관 토픽의 Nor_EC_Score 공간 패턴 분석 77
〈그림 4.21〉 생활편의 토픽의 Nor_EC_Score 공간 패턴 분석 78
〈그림 4.22〉 안전단속 토픽의 Nor_EC_Score 공간 패턴 분석 79