본 논문에서는 확률모형을 기반으로 음성의 생성 과정과 다양한 음성 변환 방법에 대해 소개하고, 음성 필터를 모델링하는 방법과 음성의 특징을 추출하는 방법들을 비교하는 데에 중점을 두고 있다. 캡스트럴 피크 현저성(Cepstral Peak Prominence)의 임계값, 멜 주파수 중심 계수(Mel Frequency Ceptral Coffceient), 그리고 웨이블릿 상관계수(Wavelet coeffceient)를 기반으로 분류모델을 통해 정상 그룹과 우울 그룹을 예측하였다. 분류모델은 1 범주를 구분하지 않았을 때, 2 성별에 따라 구분되었을 때, 그리고 3 연령층에 따라 구분되었을 때의 경우에서 진행되었다. 결과적으로, 다른 두 지표들과 다르게 정확한 기본 주파수를 필요로 하지 않는 CPP의 분류 성능이 범주 유형에 따라 67% ~ 88% 로 높게 나타났다.