초록

자주 발생하지는 않지만 한번 발생하면 비교적 큰 손실이 발생할 경우 이를 "부정(fraud)"이라고 한다. 부정 사건은 일반 사건에 비해 상대적으로 매우 적고 오분류에 따른 비용도 훨씬 높아 분류정확도에 기반한 고전적 분류기법을 그대로 적용하는 데 문제가 있다. 따라서 부정탐지에 적합하도록 지지벡터기계(SVM)를 확장하여 부정탐지를 해결하고자 한다.

첫째, LASSO패널티가 적용되는 1차노름 벌점화 지지벡터기계(L₁-FDSVM)을 다룬다. 우선 L₁-FDSVM의 해가 조율모수 값에 대해 조각별 선형임을 보였다. 그리고 시뮬레이션 및 실제 데이터 분석을 통해 계산 시간 단축의 효율성, 변수 선택, 목표 민감도 달성 등 L₁-FDSVM의 선형 모델에서 우수한 성능을 확인했다.

둘째, 함수형 공변량을 고려한 함수 부정탐지 지지벡터기계(F²DSVM)을 제안했다. F²DSVM은 새로운 유형의 커널을 활용 한다는 점을 제외하고는 L₂-FDSVM과 동일한 방법이기 때문에 자취해도 얻을 수 있으며, 이를 기반으로 조율모수를 매우 효율적으로 선택 할 수있다. 실제 데이터 분석을 통해 함수형 데이터에서의 계산 시간 단축과 목표 민감도 달성에 있어 우수한 성능을 확인하였다.

셋째, 비선형 모델에 대해 변수선택과 부정탐지를 동시에 가능하게 하는 COSSO FDSVM을 제안했다. 제안한 모델은 선형 모델에서 성능이 보장되지 않는 L₁-FDSVM과 변수 선택이 제한되는 F²DSVM의 단점을 모두 보완할 수 있다. 실제 데이터와 시뮬레이션 실험은 모집단의 특성이 알려져있지 않은 경우라도 COSSO FDSVM이 변수 선택과 부정탐지에 사용될 수 있음을 확인시켜 주었다.