표제지
목차
약어표 8
논문요약 9
제1장 서론 11
제2장 선행연구 분석 13
제1절 신용평가모델 관련 연구 13
제2절 불균형 데이터 관련 연구 14
제3장 데이터 분석 16
제1절 데이터 구성과 전처리 16
1. 분석 데이터 정의 16
2. 분석 데이터 전처리 17
제2절 데이터 분석법 20
1. 이항 로지스틱 회귀분석 20
2. 의사결정나무 21
3. 앙상블 기법 23
제4장 실험 및 모델 평가 27
제1절 모델 평가 방법 27
제2절 단일 분류기 실험 결과 29
1. 이항 로지스틱 회귀분석 29
2. 의사결정나무 31
제3절 부스팅 실험 결과 33
1. Gradient boosting 33
2. Adaboost 37
제5장 결론 41
참고 문헌 44
ABSTRACT 46
[표 3-1] 종속변수 데이터 구성 17
[표 3-2] 분석 대상 변수 정의 19
[표 4-1] 오분류표 28
[표 4-2] 로지스틱 회귀분석 오분류표 31
[표 4-3] 의사결정나무 오분류표 33
[표 4-4] 모수 n.trees 개수 변화에 따른 모델 성능 비교 34
[표 4-5] Gradient boosting 모수(n.tree=500)인 모델 성능 비교 36
[표 4-6] Adaboost 모수(maxdepth=5, xval=0)인 모델 성능 비교 38
[표 4-7] Adaboost 모수(mfinal=10)인 모델 성능 비교 39
[표 5-1] 각 알고리즘별 parameter과 오분류표 41
[그림 3-1] 종속변수 변환 R code 17
[그림 3-2] 분석대상 변수의 상관관계 분석[원문불량;p.8] 18
[그림 3-3] 선형회귀와 로지스틱 회귀분석 비교 21
[그림 3-4] 의사결정나무 형성과정 22
[그림 3-5] Bagging 알고리즘 23
[그림 3-6] 랜덤포레스트 모델 형성 과정 24
[그림 3-7] Boosting 알고리즘 25
[그림 4-1] Dataset 분할 R code 27
[그림 4-2] 로지스틱 회귀모형 적합 결과 30
[그림 4-3] 로지스틱 회귀모형 R code 31
[그림 4-4] 의사결정나무 적합 결과 32
[그림 4-5] 의사결정나무 가지치기 결과 32
[그림 4-6] Gradient boosting R code 34
[그림 4-7] 트리개수에 따른 오분류표 결과 그래프 35
[그림 4-8] Gradient boosting ROC곡선 37
[그림 4-9] Adaboost R code 38
[그림 4-10] 분류기 개수에 따른 오분류표 결과 그래프 39
[그림 4-11] Adaboost 변수 중요도 40