표제지
국문초록
목차
제1장 서론 13
1.1. 연구 배경 및 목적 13
1.2. 연구의 범위 및 절차 15
1.2.1. 연구의 범위 15
1.2.2. 연구의 절차 15
제2장 선행 연구 및 이론 고찰 17
2.1. 교통사고 심각도 관련 연구 고찰 17
2.1.1. 국내 연구 17
2.1.2. 해외 연구 20
2.2. 머신러닝 관련 연구 고찰 22
2.2.1. 국내 연구 22
2.2.2. 해외 연구 25
2.3. 본 연구의 차별성 27
2.4. 머신러닝 관련 이론 고찰 28
2.4.1. 머신러닝의 정의 28
2.4.2. 지도학습 30
2.4.3. 비지도학습 31
2.4.4. 강화학습 32
2.4.5. 분류(Classification)분석 33
2.4.6. 회귀(Regression)분석 34
2.4.7. 랜덤 포레스트(Random Forest) 35
2.4.8. XGBoost(eXtra Gradient Boost) 36
제3장 자료수집 및 기초 분석 37
3.1. 자료 수집 및 전처리 37
3.1.1. 종속변수 선정 38
3.1.2. 독립변수 선정 38
3.1.3. 변수 전처리 39
3.2. 현황 및 기초 통계 분석 42
3.2.1. 노인보행자 교통사고 현황 42
3.2.2. 기초 통계 분석 47
3.3. 가설 설정 및 검증 53
3.3.1. 독립표본 t-test 53
3.3.2. 일원 배치 분산분석 55
제4장 머신러닝 성능 비교 57
4.1. 절차 57
4.1.1. 개요 57
4.1.2. 자료 구분 59
4.2. 모형 성능 평가 지표 선정 60
4.3. 노인보행자 사고 심각도 모형구축 (특별시 및 6개 광역시) 61
4.3.1. 랜덤 포레스트 (Random Forest) 61
4.3.2. XGBoost 64
4.4. 모형 성능 비교 67
4.5. 변수중요도 68
4.5.1. Game Theory 68
4.5.2. Shapley value 69
4.5.3. SHAP 69
4.5.4. TreeSHAP 70
4.5.5. SHAP Feature Importance 70
4.5.6. 특별시 및 6개 광역시 중요변수도 71
제5장 결론 및 향후과제 78
5.1. 결론 78
5.2. 한계점 및 향후과제 80
참고문헌 81
ABSTRACT 84
표 2.1. 사고 심각도 관련 국내 연구 19
표 2.2. 사고 심각도 관련 해외 연구 21
표 2.3. 머신러닝 관련 국내 연구 24
표 2.4. 머신러닝 관련 해외 연구 26
표 3.1. 수집 변수 선정 및 변수 표기법 39
표 3.2. 특별시 및 6개 광역시 노인보행자 교통사고 현황 43
표 3.3. 전국 보행자 교통사고 및 노인보행자 교통사고 현황 43
표 3.4. 노인보행자 사고 기초 통계 분석표 49
표 3.5. 독립표본 t-test 가설 설정 53
표 3.6. 독립표본 t-test 검정 결과 54
표 3.7. 일원 배치 분산분석 가설 설정 55
표 3.8. 일원 배치 분산분석 결과 56
표 4.1. Random Forest 설정 하이퍼 파라미터 62
표 4.2. Random Forest 하이퍼 파라미터 의미 62
표 4.3. Random Forest 최적 하이퍼 파라미터 63
표 4.4. XGBoost 설정 하이퍼 파라미터 64
표 4.5. XGBoost 하이퍼 파라미터 의미 65
표 4.6. XGBoost 최적 하이퍼 파라미터 66
표 4.7. 머신러닝 성능 비교 67
표 4.8. 변수중요도 73
그림 1.1. 연구 수행 절차 16
그림 2.1. 머신러닝의 종류 28
그림 2.2. 지도학습 예시 30
그림 2.3. 비지도학습 예시 31
그림 2.4. 강화학습 예시 32
그림 2.5. 분류분석 예시 33
그림 2.6. 회귀분석 예시 34
그림 2.7. Random Forest 예시 35
그림 2.8. XGBoost 예시 36
그림 3.1. 사고 분석 시스템 37
그림 3.2. 전국 보행자 교통사고 현황 44
그림 3.3. 전국 노인보행자 교통사고 현황 44
그림 3.4. 특별시 및 6개 광역시 노인보행자 사고 현황 45
그림 3.5. 특별시 및 6개 광역시 노인보행자 사고비율 현황 45
그림 3.6. 특별시 및 6개 광역시 노인보행자 사망자 비율 현황 46
그림 3.7. 특별시 및 6개 광역시 노인보행자 부상자 비율 현황 46
그림 4.1. 모형구축 절차 58
그림 4.2. 데이터 샘플 59
그림 4.3. 랜덤 포레스트 최적 하이퍼 파라미터 63
그림 4.4. XGBoost 최적 하이퍼 파라미터 65
그림 4.5. Game Theroy 68
그림 4.6. 특별시 및 6개 광역시 변수중요도 75
그림 4.7. 특별시 및 6개 광역시 심각도 변수중요도 상위 10개 76