표제지
목차
국문 요약 9
영문 요약 10
제1장 서론 11
제2장 데이터셋 분석 및 전처리 12
2.1. 데이터셋 분석 12
2.2. 데이터셋 전처리 17
2.3. 데이터 분석 21
2.4. 상관 분석 27
제3장 MARS모형 생성 및 성능 평가 29
3.1. Confusion Matrix 29
3.2. 기본적인 파라미터를 적용한 MARS모형 및 성능 평가 30
3.3. MARS모형의 최적 파라미터 34
3.4. 최적 파라미터를 적용한 MARS모형 및 성능 평가 35
제4장 비교 모형 생성 및 성능 평가 40
4.1. 선형회귀모형 생성 및 성능 평가 40
4.2. 회귀나무모형 생성 및 성능 평가 42
4.3. 신경망모형 생성 및 성능 평가 44
제5장 결론 46
5.1. 예측 모형의 성능 비교 46
5.2. 결론 46
참고문헌 47
부록 48
표 1. NSL-KDD 데이터셋 속성 목록 14
표 2. NSL-KDD 데이터셋 속성 유형 14
표 3. NSL-KDD 데이터셋 분류레이블(class_label)의 공격 유형 15
표 4. NSL-KDD 데이터셋 분류레이블(class_label)의 공격 목록 16
표 5. KDDCUP' 99에서 추출한 NSL-KDD 학습용 데이터셋 레코드 수 16
표 6. KDDCUP' 99에서 추출한 NSL-KDD 시험용 데이터셋 레코드 수 17
표 7. 이진레이블(binary_label)의 정의 17
표 8. 데이터 속성(feature)과 이진레이블(binary_label)의 상관관계 28
표 9. Confusion Matrix 29
표 10. degree=1인 MARS의 Confusion Matrix 34
표 11. degree=1인 MARS의 성능 평가 34
표 12. degree=3인 MARS의 Confusion Matrix 39
표 13. degree=3인 MARS의 성능 평가 39
표 14. 선형회귀의 Confusion Matrix 41
표 15. 선형회귀의 성능 평가 41
표 16. 회귀나무의 Confusion Matrix 43
표 17. 회귀나무의 성능 평가 43
표 18. 신경망의 Confusion Matrix 45
표 19. 신경망의 성능 평가 45
표 20. 모형의 성능 비교 46
그림 1. flag 속성과 이진레이블(binary_label)의 관계 21
그림 2. protocol_type 속성과 이진레이블(binary_label)의 관계 22
그림 3. service 속성과 이진레이블(binary_label)의 관계 23
그림 4. count 속성과 이진레이블(binary_label)의 관계 24
그림 5. same_srv_rate 속성과 이진레이블(binary_label)의 관계 25
그림 6. dst_host_srv_count 속성과 이진레이블(binary_label)의 관계 26
그림 7. 속성과 속성 사이의 상관관계 27
그림 8. degree=1인 MARS모형 31
그림 9. degree=1인 MARS모형의 예측속성 32
그림 10. degree=1인 MARS의 예측 결과 33
그림 11. degree=1인 MARS의 ROC 커브 33
그림 12. MARS모형에서 최적의 degree와 nprune 찾기 35
그림 13. degree=3인 MARS모형 36
그림 14. degree=3인 MARS모형의 예측속성 37
그림 15. degree=3인 MARS의 예측 결과 38
그림 16. degree=3인 MARS의 ROC 커브 38
그림 17. 선형회귀모형 결과 40
그림 18. 선형회귀의 예측 결과 41
그림 19. 선형회귀의 ROC 커브 41
그림 20. 회귀나무모형 결과 42
그림 21. 회귀나무의 예측 결과 42
그림 22. 회귀나무의 ROC 커브 42
그림 23. hidden=1인 신경망모형 44
그림 24. 신경망의 예측 결과 44
그림 25. 신경망의 ROC 커브 44