인터넷 기술의 발달과 이동통신 기술의 발전으로 모바일 기기의 사용이 급증하면서 기기간 모바일 메시지뿐만 아니라, 기업에서 소비자를 대상으로 하는 모바일 메시지 전송이 증가하고 있다.
모바일 메시지 서비스에 있어서 이동통신사 구간에서 장애가 발생해도 어떤 이유로 장애 관련 정보가 중계사에게 전달되지 않는 경우, 중계사가 즉시 장애를 파악하지 못하는 경우가 발생한다. 반면, 중계사 입장에서는 전송 장애를 신속히 감지하여 적절한 시간 내에 고객인 발신자에게 해당 정보를 제공함으로써 서비스의 신뢰성을 제고할 필요가 있다.
본 논문에서는, 이동통신사 내부에서 수신 국번들 중의 일부에 문제가 생기는 경우로 구체화하여 문제를 정의하고, 다른 주변 수신 국번들 상황과의 유사성 판단에 의해 장애 여부를 판단하는 기법을 제안한다. 연구를 위하여 메시지 중계 시스템에서의 장애 상황이 포함된 일부 전송 서버 로그를 사용한다.
정의된 문제를 해결하는 과정에서, 로그를 처리하기 위하여 하둡(Hadoop)의 맵리듀스(MapReduce) 기술을 활용한 로그 전처리기를 구현하며, 전처리기에 의해 생성된 〈기본 데이터〉를 시각화하기 용이한 형태로 조정하여 〈대상 데이터〉를 생성하는 단계를 거친다. 이후 K-평균 군집화(K-means clustering) 기법과 평균 이동 군집화(Mean-shift clustering) 기법을 활용하여 〈대상 데이터〉를 정상 군집과 장애 군집으로 군집화하는 실험 단계를 수행한다. 이 단계에서 오픈소스(open source) 형태의 기계학습(machine learning) 라이브러리(library)를 활용하여 실험을 진행한다. 모든 구현과 실험 과정이 끝난 후에는 군집화된 결과가 적절하게 잘 되었는지 확인하기 위해 산술적 통계값 및 시각화 도구를 활용하고, Jaccard 색인도 함께 보조적으로 활용하여 적합성 여부를 검토한다.
본 연구를 통하여, 메시지 중계 시스템에서 대량의 통신 로그를 효과적으로 처리하면서, 군집화 기법을 이용하여 유사성 판단의 문제를 해결하는 장애 감지 방법을 사용함으로써 메시지 중계 서비스의 서비스 품질을 높이는 데에 기여할 수 있을 것으로 기대한다.
본 논문에서, 제1장은 연구의 배경과 목적, 연구 방법, 기대효과와 논문의 구성에 대해 소개하고, 제2장에서는 이론적 배경으로, 빅데이터(Big data) 개요, 하둡, 맵리듀스, 데이터마이닝(data mining) 개요, K-평균 군집화와 평균 이동 군집화, 그리고 Jaccard 색인에 대해 설명한다. 제3장에서는 제안하는 장애 감지 기법 모형의 구현 및 실험에 대해 기술하며, 제4장은 연구 결과에 대한 분석 내용을 기술한다. 마지막 제5장에서, 제안한 기법에 대한 연구 결과를 요약하며, 향후 연구 및 활용 방안에 대해 기술한다.