최근에는 학습을 통하여 어떠한 사실을 분류하는데 이용되는 데이터가 급속히 증가됨에 따라 학습을 하는 과정에서의 문제점도 발생되고 있다. 대표적인 문제점으로 많은 양의 데이터에는 서로간의 관련성이 적어서 잘못된 분류를 하는 경우가 빈번이 발생하고 또한 좋지 않은 데이터를 이용한 학습의 결과로 분류 오류가 높아지고 있다는 것이다. 이러한 문제점을 극복하고 분류 성능을 향상시키기 위해서 기존의 가중 퍼지소속함수 기반 신경망(Neural Network with Weighted Fuzzy Membership Functions; NEWFM)은 비중복면적 분산 측정법을 이용하여 많은 양의 데이터로부터 서로 간의 관련성이 적은 데이터를 제거하는 특징 선택을 제공하고 있다.
본 논문에서는 기존의 NEWFM에 많은 양의 데이터로부터 좋은 데이터를 추출하기 위한 퍼지 신경망 기반의 인스턴스 선택을 제안하여 분류 성능을 더욱 향상시키고자 하였다. 제안하는 인스턴스 선택은 Takagi-Sugeno (T-S) 퍼지 모델에서의 가중 평균 역퍼지화와 통계학에서 사용하는 정규분포의 신뢰구간과 같은 구간 선택을 이용하였다. 또한 제안하는 NEWFM의 특징 선택과 인스턴스 선택의 수행 단계는 첫 번째 특징 선택 단계로써 비중복면적 분산 측정법을 이용하여 최고의 분류 성능을 가지는 최소 특징을 선택하게 된다. 첫 번째 단계인 특징 선택 단계가 완료된 후에 두 번째 단계에서는 T-S 퍼지 모델에서의 가중 평균 역퍼지화와 통계학에서 사용하는 정규분포의 신뢰구간과 같은 구간 선택을 이용하여 인스턴스를 선택하고 이렇게 선택된 인스턴스를 이용하여 새롭게 학습을 한다.
제안하는 인스턴스 선택의 분류 성능을 평가하기 위해서 벤치마킹된 데이터를 이용하거나 사례 연구를 통하여 타 논문들과 분류 성능을 비교하였다. 또한 특징 선택과 인스턴스 선택의 분류 성능 간에 차이점을 보여주기 위해서 통계학에서 사용하는 맥니마 검정을 사용하였다. 맥니마 검정의 결과로 4가지 모두의 데이터에 있어서 유의확률이 0.05보다 적게 나오므로 인스턴스 선택의 분류 성능이 특징 선택의 분류 성능보다 우수함을 확인 할 수가 있었다. 제안하는 인스턴스 선택은 통계학에서 사용하는 정규분포의 신뢰구간과 같은 구간 선택을 이용하여 쉽게 접근할 수가 있어서 기존의 다른 퍼지 신경망에 인스턴스 선택을 지원하는 새로운 퍼지 신경망 모델을 만들 수가 있다.