표제지
목차
국문초록 11
Ⅰ. 서론 13
1. 연구 배경 및 목적 13
(1) 연구 배경 13
(2) 연구 목적 15
(3) 연구 범위 17
Ⅱ. 이론적 배경 19
1. 프로세스 마이닝 19
(1) 프로세스 모델 도출 21
(2) 휴리스틱 알고리즘 23
2. 데이터 마이닝 26
(1) 지도학습 31
(2) 비지도학습 45
3. 고객이탈 선행연구 56
(1) 고객이탈 56
(2) 대학생 중도탈락 61
4. 연구 차별성 65
Ⅲ. 연구설계 및 방법 66
1. 연구모형 66
2. 연구대상 68
3. 연구방법 70
(1) 분석방법 70
(2) 성능 비교 방법 72
Ⅳ. 연구결과 73
1. 데이터 마이닝 단독 모델 73
2. 데이터 마이닝 앙상블 모델 76
(1) 군집분석 76
(2) 랜덤 포레스트 79
3. 프로세스 마이닝과 데이터 마이닝 기반의 하이브리드 모델 84
(1) 프로세스 마이닝 분석 85
(2) 랜덤 포레스트 96
4. 분석모델 성능비교 102
(1) 고객이탈 결정요인 102
(2) 고객이탈 예측모델의 성능평가 105
(3) 고객이탈 방지전략 수립 가능성 비교 107
Ⅴ. 결론 및 제언 112
1. 연구 요약 및 결론 112
2. 연구 제언 115
3. 연구의 한계점 및 향후과제 117
참고문헌 118
ABSTRACT 125
〈표 1〉 프로세스 마이닝 이벤트 로그 구성 예시(대학생 학적 프로세스) 20
〈표 2〉 이벤트 로그 L에 있는 직접적 선후 관계 빈도수 23
〈표 3〉 이벤트 로그 집합 L의 5단계 사이의 종속성 척도 24
〈표 4〉 CRM 분야에서의 데이터 마이닝 활용 방식 28
〈표 5〉 랜덤 포레스트의 일반적인 장·단점 36
〈표 6〉 혼동 행렬 형태 37
〈표 7〉 주요 성능지표 38
〈표 8〉 R을 통한 혼동행렬 예시(재학과 제적) 39
〈표 9〉 고객이탈 관련 주요 선행연구 59
〈표 10〉 고객 세분화 선행연구 60
〈표 11〉 중도탈락 결정요인 관련 선행연구 62
〈표 12〉 중도탈락률 결정요인 관련 선행연구 63
〈표 13〉 중도탈락 예측 관련 선행연구 64
〈표 14〉 연구대상 68
〈표 15〉 분석에 사용된 10개의 변수 68
〈표 16〉 데이터 마이닝 단독 모델의 성능평가 결과 74
〈표 17〉 데이터 마이닝 단독 모델의 ACC와 f1-score 값 비교표 75
〈표 18〉 군집분석 결과 77
〈표 19〉 이탈자 군집분석 후 랜덤 포레스트 분석대상자 현황 79
〈표 20〉 고객군집별 이탈결정요인 분석 결과 80
〈표 21〉 고객군집별 랜덤 포레스트 성능평가 결과 81
〈표 22〉 고객군집1의 ACC와 f1-score 값 비교표 82
〈표 23〉 고객군집2의 ACC와 f1-score 값 비교표 82
〈표 24〉 고객군집3의 ACC와 f1-score 값 비교표 83
〈표 25〉 입학 후 제적기간별 중도탈락자 현황 91
〈표 26〉 주요 중도탈락 패턴의 휴학 현황(요약표) 92
〈표 27〉 프로세스 마이닝 유형 분석결과 94
〈표 28〉 이탈자 프로세스 마이닝 후 랜덤 포레스트 분석대상자 현황 96
〈표 29〉 고객유형별 이탈결정요인 분석 결과 97
〈표 30〉 고객유형별 랜덤 포레스트 성능평가 결과 98
〈표 31〉 고객유형1의 ACC와 f1-score 값 비교표 99
〈표 32〉 고객유형2의 ACC와 f1-score 값 비교표 99
〈표 33〉 고객유형3의 ACC와 f1-score 값 비교표 100
〈표 34〉 고객유형4의 ACC와 f1-score 값 비교표 100
〈표 35〉 고객유형5의 ACC와 f1-score 값 비교표 101
〈표 36〉 분석모델별 고객이탈 결정요인 비교 102
〈표 37〉 분석모델별 고객이탈 예측모델 성능평가 비교 105
〈표 38〉 데이터 마이닝 앙상블 모델 분석결과에 따른 이탈방지 전략(안) 108
〈표 39〉 프로세스 마이닝과 데이터 마이닝 기반의 하이브리드 모델 분석 결과에 따른 이탈방지 전략(안) 109
〈그림 1〉 프로세스 마이닝의 페트리 넷 예시 21
〈그림 2〉 Heuristic mining algorithm 처리 개요 25
〈그림 3〉 데이터 마이닝 관련 영역 26
〈그림 4〉 데이터 마이닝 분류 27
〈그림 5〉 데이터 마이닝 표준 실행 체계:CRISP-DM 29
〈그림 6〉 의사결정나무 모델 예시(중도탈락) 34
〈그림 7〉 변수 중요도 예시 36
〈그림 8〉 인공 신경망의 구조 41
〈그림 9〉 최적분할 수 예시(Silhouette Width) 55
〈그림 10〉 연구 모형 67
〈그림 11〉 데이터 마이닝 단독 모델의 이탈결정 주요요인 73
〈그림 12〉 군집분석 결과 76
〈그림 13〉 학사과정 프로세스(전체) 프레임워크 85
〈그림 14〉 학업이수 프로세스(학업 중 또는 졸업) 프레임워크 86
〈그림 15〉 중도탈락 프로세스 프레임워크 86
〈그림 16〉 학사과정 프로세스(전체 단계) 87
〈그림 17〉 학사과정 프로세스(전체학생_축약) 87
〈그림 18〉 학업이수 프로세스 88
〈그림 19〉 중도탈락 프로세스(제적생_축약) 89
〈그림 20〉 중도탈락 프로세스(제적생_축약_휴학제외) 90
〈그림 21〉 Dotted Chart(입학 후 중도탈락까지 경과일) 91