최근 네트워크 공격은 동일한 패턴이나 바이너리를 이용하지 않고 다양한 변종의 네트워크 패킷 패턴이나 변조된 바이너리를 이용하여 수행된다. 해당 공격을 탐지하기 위해 공격 형태별로 시그니처를 부여하기에는 너무나 많은 비용이 든다. 그래서 최근 네트워크 침입 탐지는 시그니처 기반이 아닌 행위기반으로 데이터를 분석하여 침입 여부를 판단한다.
행위기반 네트워크 칩입을 판단하는 모형 개발을 위해서는 학습데이터가 필요한데 일반적으로 NSL-KDD 데이터셋을 많이 사용한다. 이 데이터셋은 KDDCUP'99 데이터에서 중복된 데이터를 제거하고 데이터의 출연 빈도에 의해 편향되지 않도록 샘플링한 것이 특징이며, 여러 개의 알고리즘을 비교 분석하는데 사용된다.
MARS(Multivariate Adaptive Regression Splines)는 선형회귀모형을 통해서 분석하기 어려운 비선형적 데이터의 패턴과 상호관계를 파악할 수 있으며, 이 모형은 여러 개의 회귀선이 연결된 형태이다.
이번 연구에서는 NSL-KDD 데이터셋에서 MARS를 이용하여 네트워크 비정상탐지 모델을 생성하고 그 성능을 다른 알고리즘의 성능과 비교 분석한다.