일반적으로 중소기업의 재무제표에 대한 신뢰성 문제는 오랫동안 제기되어 왔으며 이에 따라 결측치 및 이상치 비중이 상대적으로 높을 뿐만 아니라 오류에 의한 값인지 실제 값인지 명확하게 확인하기 어렵다. 이러한 이유로 일반적으로 신용평가 모형 구축 시 결측치와 이상치 값을 모두 제거하기 때문에 정보의 활용성이 낮을 뿐만 아니라 정확하고 고도화된 모형 구축에 어려움이 있었다.
본 연구에서는 이러한 중소기업 신용평가의 비정형화된 정보의 활용가능성에 주목하여 결측치와 이상치를 고려한 신용평가모형을 구축한다. 이를 위한 분석자료는 중소기업통합시스템(SIMS)에 해당하는 기업을 선별하여 총 1,758,760개의 데이터이며, 알고리즘은 로지스틱 회귀모형과 심층신경망을 이용하였고, 설명 가능한 AI 기법(XAI)을 활용하여 유의한 변수를 도출하였다.
결과적으로, 로지스틱 회귀모형과 비교하여 심층신경망 모형의 AUC가 높았으며, 부도 예측에 기여도가 높은 변수들은 이상치 변수를 포함하여 제조업이 재무적 특징을 잘 반영한 결과를 보였다. 이에 따라 부도 예측에 영향을 미치는 변수를 해석하고, 모형이 갖는 사용변수의 제약성을 줄이고 모형의 안정성과 일반화가 가능하다는 결론을 내릴 수 있었다.