표제지
목차
논문요약 12
제1장 서론 14
제1절 연구의 배경 및 목적 14
제2절 연구의 방법 및 기대효과 16
제2장 이론적 배경 18
제1절 우리나라의 혈액사업 18
1. 혈액사업의 역사와 제도 18
가. 우리나라 혈액사업의 역사 18
나. 우리나라 혈액사업의 제도 20
2. 최근 헌혈자 현황 24
가. 헌혈 종류별 통계 24
나. 헌혈자 성별 통계 25
다. 헌혈자 직업별 통계 26
라. 헌혈자 연령별 통계 26
마. 헌혈자 장소별 통계 27
바. 헌혈자 실인원수 통계 28
3. 인구변화에 따른 헌혈자원 확보 문제점 29
제2절 데이터 마이닝 31
1. 데이터 마이닝의 정의 31
2. 데이터 마이닝의 과정 32
가. 주요개념 32
나. 데이터 마이닝의 수행 33
3. 데이터 마이닝의 기법 35
제3절 회귀분석 37
1. 회귀분석(regression analysis) 개념 37
2. 단순선형 회귀분석(simple linear regression analysis) 39
3. 다중선형 회귀분석(multiple linear regression analysis) 41
4. 최상의 변수군 선택 (best subsets selection) 43
제3장 헌혈자 데이터 분석 44
제1절 연구 목적 확인 44
제2절 데이터의 수집 및 확인 44
1. 데이터의 수집방법 44
2. 데이터의 상관관계 확인 47
3. 데이터의 탐색, 정제 전처리 50
제4장 다중선형 회귀분석 적용 및 검증 54
제1절 데이터의 분할 55
제2절 다중선형 회귀분석 적용 56
1. 다중선형 회귀분석 실행 56
2. 회귀분석 예측모형 61
3. 검증용 데이터 예측모형 적용 66
제3절 변수군 영향도 분석 70
제4절 회귀분석 결과 72
제5장 결론 73
제1절 연구결과 요약 73
제2절 연구의 한계성과 헌혈자 관리방안 제시 76
참고문헌 78
부록 6
〈부록 1〉 학습용 데이터 리프트 도표와 십분위 도수표의 데이터 80
〈부록 2〉 검증용 데이터 리프트 도표와 십분위 도수표의 데이터 95
ABSTRACT 106
〈표 2-1〉 헌혈의 종류와 그 헌혈 제한 기준 21
〈표 2-2〉 헌혈의 종류별 통계 24
〈표 2-3〉 헌혈자 성별 통계 25
〈표 2-4〉 헌혈자 직업별 통계 26
〈표 2-5〉 헌혈자 연령별 통계 27
〈표 2-6〉 헌혈 장소별 통계 28
〈표 2-7〉 헌혈자 실인원수 통계 28
〈표 2-8〉 인구추이 (통계청 2011) 29
〈표 2-9〉 세계인구현황 보고서와 국내 최신통계 비교 30
〈표 3-1〉 연구에 사용한 헌혈자 관련 변수 45
〈표 3-2〉 상관계수 행렬표 47
〈표 3-3〉 정규화 된 자료의 주성분분석 결과 52
〈표 3-4〉 정규화 된 자료의 주성분분석 결과. (계속) 53
〈표 4-1〉 데이터 분할 정보 55
〈표 4-2〉 다중선형 회귀분석 예측모형 결과 61
〈표 4-3〉 공선성 진단 결과 62
〈표 4-4〉 다중선형 회귀분석 - 학습용 데이터의 예측결과 62
〈표 4-5〉 학습용 데이터 십분위 도수표값 65
〈표 4-6〉 학습용 데이터 예측값 십분위 도수표값 65
〈표 4-7〉 예측모형 적용 - 검증용 데이터 적용 결과 66
〈표 4-8〉 검증용 데이터 십분위 도수표값 69
〈표 4-9〉 검증용 데이터 예측값 십분위 도수표값 69
〈표 4-10〉 독립변수군 조정결정계수표 70
〈표 4-11〉 독립변수군 순위표 71
〈표 4-12〉 회귀분석 결과분석 72
[그림 2-1] 최근 혈장 자급률 19
[그림 2-2] 혈액수급 과정 20
[그림 2-3] 헌혈 종류별 통계 24
[그림 2-4] 헌혈자 성별 통계 25
[그림 2-5] 헌혈자 직업별 통계 26
[그림 2-6] 헌혈자 연령별 통계 27
[그림 2-7] 프로세스 관점의 데이터 마이닝 기법 36
[그림 2-8] 단순 선형 회귀 모형 40
[그림 3-1] 수집한 2013년도 헌혈자 관련데이터 46
[그림 3-2] 헌혈자 데이터의 11개 변수에 대한 행렬 산점도 49
[그림 3-3] 수치형 변수들의 히스토그램 51
[그림 4-1] XLMiner 프로그램 화면 54
[그림 4-2] 다중선형 회귀분석 실행 57
[그림 4-3] 입력(독립)변수와 출력(종속)변수 설정 58
[그림 4-4] 변수군 선택 알고리즘 설정 59
[그림 4-5] 잔차 처리 방법과 공선성 진단 설정 59
[그림 4-6] 학습용 데이터와 검증용 데이터의 추정값 출력설정 60
[그림 4-7] 학습용 데이터 예측값과 실제평균값 리프트 도표 63
[그림 4-8] 학습용 데이터 십분위 도수표 64
[그림 4-9] 학습용 데이터 예측값 십분위 도수표 64
[그림 4-10] 검증용 데이터의 예측값과 실제평균값 리프트 도표 67
[그림 4-11] 검증용 데이터 십분위 도수표 68
[그림 4-12] 검증용 데이터 예측값 십분위 도수표 68
〈수식 3-1〉 단순 선형회귀 모형 회귀 방정식 38
〈수식 3-2〉 단순 선형회귀 모형 회귀 방정식 (오차포함) 38
〈수식 3-3〉 단순선형 회귀분석의 기본식 39
〈수식 3-4〉 독립변수가 k개인 다중선형 회귀분석의 기본모형 41
〈수식 3-5〉 중상관계수 R 42
〈수식 3-6〉 조정결정계수 R*2(이미지참조) 42
〈수식 4-1〉 다중선형 회귀분석 예측모형 56