정보기술의 발전과 더불어 많은 기업에서 축적된 고객정보를 데이터 마이닝 기법을 활용하고 있다. 고객이 구매한 품목과 구매시점, 소모비용을 기초자료로 하여 고객을 세분화하고 그 세분화된 고객 집단별 마케팅전략으로 그 효율성을 극대화 하고 있다. 이러한 일반기업의 마케팅전략은 공공기관의 사업에도 적용되고 있다.
우리나라의 혈액사업은 지난해 말 연간 헌혈자수가 최초 300만 명을 넘어 섰다. 또한 이를 바탕으로 의료기관에 600만 건 이상의 혈액제제가 공급되었다. 하지만 주요 헌혈자 계층이 10대와 20대에 집중된 문제점과 실제 헌혈인원대비 혈액사용량의 증가추세는 우려할 만한 수준이다. 이에 지속적인 헌혈자 관리와 그에 대한 마케팅전략은 그 중요도가 높다. 그러므로 데이터 마이닝을 활용하여 헌혈자의 데이터를 분석하고 그에 맞는 헌혈주기와 횟수를 관리하는 헌혈진흥 전략을 통해 연령대별 헌혈자 문제와 고령화로 인한 문제에 대한 방안을 제시하고자 이 연구를 시작하였다.
본 논문에서는 수집된 헌혈자 정보를 활용하여 통계적으로 유의미한 규칙이나 패턴을 찾아내어 이후 헌혈자가 일정 주기 내에서 몇 회의 헌혈에 참여 할 수 있는지를 예측하고, 또한 헌혈자의 건강을 보호하며 헌혈에 참여할 수 있는 방안을 연구하고자 한다. 이를 위하여 각 정보간의 상관계수를 검증하고 데이터 마이닝 기법의 하나인 다중선형 회귀분석을 적용하여 예측 오차가 작은 모형을 찾고 헌혈자 정보 중에서 유의미성이 높은 예측 변수를 선정하고 이를 활용한 고객관리 마케팅 전략의 수립에 도움이 되고자한다.
본 논문의 제 2장에서는 이론적 배경으로 먼저 우리나라 혈액사업의 현황으로 헌혈의 역사, 제도 그리고 최근 헌혈자 통계를 알아보고 최근 고령화 추세의 인구변화에 따른 문제점을 논의하고자 한다. 다음으로 데이터 마이닝의 개념과 기법에 대해 알아보고 마지막으로 실제 헌혈자정보 분석에 사용될 다중선형 회귀분석에 대하여 소개한다. 제 3장에서는 실제 헌혈자 데이터를 2장에서 다룬 데이터 마이닝의 이론에 따라 수집하고 행렬 산점도와 주성분 분석을 실행하여 독립변수들의 상관성과 유효성을 측정한다. 4장에서는 다중선형 회귀분석 적용하여 학습용 데이터를 이용하여 예측모형의 추정하고 검증용 데이터로 검증을 실시한다. 또한 최상의 변수군 선택방법으로 종속변수인 헌혈횟수에 영향을 주는 독립변수들의 영향도 순위를 측정한다. 제 5장에서는 이 연구 결과에 대하여 전반적인 요약과 이를 헌혈자 관리에 활용할 수 있는 방안 제시하고 이번 연구의 한계성과 추후 지속 가능한 연구과제에 대하여 논하고자 한다.