표제지
목차
국문요약 8
제1장 서론 10
1.1. 연구 배경 및 목적 10
제2장 관련 연구 12
2.1. 토픽 모델링 12
2.1.1. Latent Dirichlet Allocation 13
2.1.2. Dynamic Topic Model 15
2.1.3. Structural Topic Model 17
2.1.4. LDA와 Hidden Markov Model을 결합한 연구 18
2.2. 변경점 탐지 19
2.2.1. Hierarchical estimating change point 20
2.2.2. On-line change point model 21
2.2.3. Bayesian change point model 21
제3장 제안 방법론 23
3.1. 제안 프레임워크 23
제4장 실험 및 결과 26
4.1. 국회 본회의 회의록 데이터 26
4.2. 아시안 게임 관련 기사 39
제5장 결론 50
참고 문헌 51
Abstract 56
APPENDIX 58
〈표 1〉 실험 1의 LDA 결과 27
〈표 2〉 Topic 1(경제) 변경점의 개수 모형 비교 33
〈표 3〉 Topic 1(경제)에서 언급된 내용 34
〈표 4〉 Topic 1의 회귀계수 추정 36
〈표 5〉 Topic 8(권리) 변경점의 개수 모형 비교 37
〈표 6〉 Topic 8(권리)에서 언급된 내용 37
〈표 7〉 Topic 8(권리)의 회귀계수 추정 39
〈표 8〉 실험 2의 LDA 결과 41
〈표 9〉 실제 변경점과 각 모델이 탐지한 변경점의 수 46
〈표 10〉 변경점 탐지 모델의 MAE 비교 47
〈표 11〉 Topic 19(수영) : 변경점 전후 기사 48
〈표 12〉 Topic 4(태권도) : 변경점 전후 기사 48
〈표 13〉 Topic 14(펜싱) : 변경점 전후 기사 49
〈그림 1〉 토픽 모델링의 프레임워크 12
〈그림 2〉 LDA의 구조 13
〈그림 3〉 LDA로 각 주제에 할당된 문서의 모습 14
〈그림 4〉 DTM의 구조 16
〈그림 5〉 LDA와 STM의 구조 비교 17
〈그림 6〉 시계열 샘플 데이터에서 변경점 감지 19
〈그림 7〉 제안 프레임워크 23
〈그림 8〉 시점에 할당된 토픽별 등장 빈도 데이터 셋 구축 예시 24
〈그림 9〉 국회 본회의 회의록 예시 26
〈그림 10〉 실험 1의 평균 coherence score 비교 27
〈그림 11〉 각 주제로 할당된 문서의 수 29
〈그림 12〉 시간의 흐름에 따른 문서의 수 변화 31
〈그림 13〉 Topic 1(경제) 변경점의 개수 모형 비교 32
〈그림 14〉 Topic 1(경제)의 변경점 탐지 34
〈그림 15〉 Topic 1(경제)과 숙의 민주주의 지수의 관계 35
〈그림 16〉 Topic 8(권리) 변경점의 개수 모형 비교 36
〈그림 17〉 Topic 8(권리)의 변경점 탐지 38
〈그림 18〉 Topic 8(권리)과 숙의 민주주의 지수(delibdem)의 관계 39
〈그림 19〉 빅카인즈 수집 결과 예시 40
〈그림 20〉 실험 2의 평균 coherence score 비교 41
〈그림 21〉 토픽에 할당된 문서의 수 43
〈그림 22〉 토픽별 변경점 결과 45