표제지
국문초록
목차
제1장 서론 11
제2장 관련 연구 13
제3장 연구방법 14
3.1. 문제정의 14
3.2. 데이터셋 설명 17
3.3. 특성 추출 20
3.4. 예측 모델 25
3.5. 성능평가 30
3.6. 구현환경 31
제4장 결과 32
4.1. 전체 성능 32
4.2. 특성별 성능 영향 45
제5장 결론 52
참고문헌 54
ABSTRACT 56
표 3.1. 주요 신경계통 질환 ICD 코드 및 카운트 18
표 3.2. 특성 군 및 개별 특성 설명 21
표 3.3. 기계학습 모델 설명 26
표 4.1. Random Forest 성능 33
표 4.2. Baseline model 성능 35
표 4.3. 단일 특성 군별 Random Forest 성능 41
표 4.4. 다중 특성 군 조합별 Random Forest 성능 41
표 4.5. 동일한 특성 군에서의 단일 및 다중 방식 시 성능 비교(A,B) 43
표 4.6. 동일한 특성 군에서의 단일 및 다중 방식 시 성능 비교(A,B,C) 43
표 4.7. 동일한 특성 군에서의 단일 및 다중 방식 시 성능 비교(A,B,C,D) 43
표 4.8. 동일한 특성 군에서의 단일 및 다중 방식 시 성능 비교(A,B,C,D,E) 44
표 4.9. 동일한 특성 군에서의 단일 및 다중 방식 시 성능 비교(A,B,C,D,E,F) 44
표 4.10. 특성별 성능 영향도 상위 10순위 47
표 4.11. 특성별 성능 영향도 하위 10순위 49
표 4.12. B 특성 군과 D 특성 군의 영향도 51
그림 3.1. 주요 신경계통 질환 환자들의 입원 재원일수 분포 15
그림 3.2. 신경계통 질환 환자들의 재원일수 범주화 16
그림 3.3. 주요 신경계통 질환 진단 비율 19
그림 4.1. Random Forest 모델 성능 평가 지표 37
그림 4.2. Random Forest 모델의 confusion matrix (카운트) 39
그림 4.3. Random Forest 모델의 confusion matrix (비율) 39
그림 4.4. Random forest 전체 특성 중요도 46