표제지
목차
국문요약 11
I. 서론 13
1. 연구배경 13
2. 연구목적 15
II. 이론적 배경 17
1. 소상공인 정의 17
2. 소상공인 지원제도 17
3. 선행연구 고찰 19
(1) 소상공인 창업준비 19
(2) 소상공인 경영성과 20
(3) 소상공인 지속가능성 25
(4) 머신러닝을 이용한 소상공인 연구 28
4. 연구방법론 30
(1) 랜덤포레스트(Random Forest) 30
(2) 혼돈행렬(Confusion Matrix) 32
(3) 정확도(Accuracy) 33
(4) 민감도(Sensitivity) 34
(5) 정밀도(Precision) 35
(6) 특이도(Specificity) 35
(7) F1 Score 36
(8) ROC-AUC 점수 37
III. 연구방법 41
1. 자료 및 연구대상 41
2. 측정도구 43
(1) 결과변수: 사업운영계획 43
(2) 설명변수 44
(3) 분석 방법 46
(4) 모형 평가 지표 48
IV. 연구 결과 50
1. 기초통계 50
2. 예측모형성과 60
(1) 원본 데이터의 예측모형 성과 60
(2) 오버샘플링 데이터의 예측모형 성과 62
3. 설명변수의 중요도 66
(1) 원본 데이터의 설명변수 중요도 66
(2) 오버샘플링 데이터의 설명변수 중요도 68
V. 결론 72
1. 연구의 요약 72
2. 연구의 시사점 74
3. 연구의 한계점 76
VI. 참고문헌 77
ABSTRACT 82
〈표 1〉 소상공인 창업준비 선행연구 정리 20
〈표 2〉 소상공인 경영성과 선행연구 정리 24
〈표 3〉 소상공인 지속가능성 선행연구 정리 27
〈표 4〉 머신러닝을 이용한 소상공인 선행연구 정리 29
〈표 5〉 혼돈행렬(Confusion Matrix) 32
〈표 6〉 소상공인 실태조사 대표산업 41
〈표 7〉 소상공인 실태조사 연혁 42
〈표 8〉 사업운영계획 빈도 및 비율 43
〈표 9〉 설명변수 정리 44
〈표 10〉 소상공인 지속가능성 혼돈행렬 48
〈표 11〉 총조사자 수 기초통계 50
〈표 12〉 프랜차이즈가맹여부 기초통계 50
〈표 13〉 사업장이전경험 기초통계 51
〈표 14〉 창업횟수 기초통계 51
〈표 15〉 창업동기 기초통계 51
〈표 16〉 창업준비기간 기초통계 52
〈표 17〉 창업준비활동 기초통계 52
〈표 18〉 창업준비활동중요성 기초통계 53
〈표 19〉 창업과정어려움 기초통계 54
〈표 20〉 임차형태 기초통계 56
〈표 21〉 총창업비용 기초통계 57
〈표 22〉 연간매출액 기초통계 57
〈표 23〉 부채현황 기초통계 58
〈표 24〉 경영애로사항 기초통계 59
〈표 25〉 정부지원경험 기초통계 59
〈표 26〉 소상공인 사업 지속가능성 혼돈행렬 60
〈표 27〉 소상공인 사업 지속가능성 예측모형성과 61
〈표 28〉 소상공인 사업 지속가능성 혼돈행렬(오버샘플링) 63
〈표 29〉 소상공인 사업 지속가능성 예측모형성과(오버샘플링) 64
〈표 30〉 설명변수 중요도 66
〈표 31〉 설명변수 중요도(오버샘플링) 69
〈그림 1〉 랜덤포레스트 예시 31
〈그림 2〉 민감도와 정밀도의 조화평균 37
〈그림 3〉 민감도와 특이도의 관계 38
〈그림 4〉 임계치에 따른 결과의 변화 39
〈그림 5〉 ROC커브와 AUC면적 40
〈그림 6〉 분석방법 다이어그램 47
〈그림 7〉 소상공인 사업 지속가능성 ROC커브 및 AUC면적 62
〈그림 8〉 SMOTE 예시 63
〈그림 9〉 소상공인 사업 지속가능성 ROC커브 및 AUC면적(오버샘플링) 65
〈그림 10〉 설명변수 중요도 시각화 68
〈그림 11〉 설명변수 중요도 시각화(오버샘플링) 70
〈수식 1〉 정확도(Accuracy) 33
〈수식 2〉 잘못 예측한 비율(ErrorRate) 34
〈수식 3〉 민감도(Sensitivity) 34
〈수식 4〉 정밀도(Precision) 35
〈수식 5〉 특이도(Specificity) 36
〈수식 6〉 FPR 36
〈수식 7〉 F1-Score 37