초록

최근 딥러닝 기술은 주어진 데이터세트(dataset)로부터 convolutional neural network(이하 CNN)의 모수들을 목적에 맞게 최적화하여 입력 영상이 갖는 추상적인 특징들을 성공적으로 추출해냈다. 얻어진 추상적인 특징들은 영상 분류, 사물 검출 및 세그먼테이션, 키 포인트 감지 등 다양한 컴퓨터 비전 문제들에 사용되어 우수한 정량적·정성적인 성능을 보여준다. 이와 같은 딥러닝의 성공 사례는 주어진 목적을 수행하기 위해 필요한 정답 레이블에 의존적이다. 하지만 이상치 검출 분야는 앞서 언급한 대표적인 컴퓨터 비전 문제들과 다르게 영상에서 발생할 수 있는 이상치를 예측할 수 없기 때문에 정답 레이블을 구축하는 데 어려움이 있다. 따라서 종래 기법들은 데이터세트가 이루는 분포를 추정함으로써 이상치 검출 문제를 간접적으로 해결했다. 최근에는 이상치 검출에서 더 나아가 입력 영상에서 이상 영역을 식별하는 이상치 위치 식별도 활발하게 연구되고 있다. 이들은 큰 규모의 데이터세트에서 선행 학습된 CNN을 사용한다. 이 CNN의 중간층에서 얻어낸 특징 지도는 국부 수용영역을 갖기 때문에, 특징 지도의 각 화소는 입력 영상의 패치 (patch)로 가정할 수 있다. 최근 연구들은 이러한 성질을 활용하여 패치의 분포를 추정함으로써 이상 영역을 식별하는 것에 주력했다. 그러나 이들은 큰 규모의 데이터세트를 사용하여 학습된 모수들을 그대로 사용하기 때문에 특정 데이터세트에 편향된 특징을 추출할 위험이 있다. 또한, 중복된 입력 영상의 특징들로 인해 많은 시⋅공간 복잡도를 갖는다.

따라서 본 논문에서는 비지도 학습을 통해 입력 영상의 분별력있는 특징을 학습하고, 이들을 프로토타입으로 정의하는 방법을 제안한다. 이로써 제안된 학습 방법은 이상치 검출을 위한 데이터세트의 특징을 추가로 학습하고 시⋅공간 복잡도를 경량화하는 방법에 대한 통찰을 제공한다.