표제지
목차
국문요약 9
I. 서론 11
1. 연구배경 11
2. 연구목적 13
II. 관련 연구 14
1. 음성 데이터 14
3.1. SNR(Signal to Noise Ratio) 15
3.2. MFCC(Mel-Frequency-Cepstral-Coefficient) 16
3.3. Spectrogram 17
3.4. Spectral contrast 18
3.5. Spectral flatness 19
2. 분석 알고리즘 19
2.1. 분류 알고리즘 19
2.2. 이상치 탐지 알고리즘 20
2.3. 이미지 학습 23
3. 코로나19 관련 선행연구 23
III. 연구방법 25
1. 데이터 및 전처리 25
1.1. 학습 데이터 25
1.2. 데이터 전처리 26
2. 연구 아키텍처 30
3. 모델 생성 31
3.1. 기본정보를 활용한 모델 31
3.2. 기본정보와 기침소리를 활용한 모델 32
3.3. 다양한 방법으로 기침소리 활용 33
4. 모델 결과 38
IV. 결론 39
1. 요약 및 시사점 39
2. 한계점 및 향후 연구 방향 39
참고문헌 41
ABSTRACT 44
〈표 1.1〉 대한민국 코로나바이러스 감염증-19 대유행 11
〈표 1.2〉 성별연령별 사망 및 재원중 위중증 현황 12
〈표 2.1〉 SNR 강도 정량화 16
〈표 3.1〉 데이터 항목별 현황 26
〈표 3.2〉 알고리즘별 하이퍼파라미터 값 31
〈표 3.3〉 기본정보변수를 활용한 분류 알고리즘 결과 비교 32
〈표 3.4〉 MFCC변수를 활용한 분류 알고리즘 결과 비교 32
〈표 3.5〉 MFCC변수를 활용한 이상 탐지 알고리즘 결과 비교 33
〈표 3.6〉 이미지를 활용한 ResNet50 알고리즘 결과 비교 33
〈표 3.7〉 MFCC변수를 활용한 LightGBM 알고리즘 결과 비교 34
〈표 3.8〉 SNR+MFCC32 변수를 활용한 LightGBM 알고리즘 결과 비교 34
〈표 3.9〉 chunk를 통한 기침구간 분할 후 LightGBM 알고리즘 결과 비교 35
〈표 3.10〉 chunk를 통한 기침구간 분할 후 IsolationForest 알고리즘 결과 비교 35
〈표 3.11〉 chunk+MelSpectrogram변수를 활용한 LightGBM 알고리즘 결과 비교 36
〈표 3.12〉 chunk+MelSpectrogram변수를 활용한 IsolationForest 알고리즘 결과 비교 36
〈표 3.13〉 chunk+Spectrogram변수를 활용한 LightGBM 알고리즘 결과 비교 36
〈표 3.14〉 chunk+SpectralContrast변수를 활용한 LightGBM 알고리즘 결과 비교 37
〈표 3.15〉 chunk+MFCC32+MelSpectogram변수를 활용한 LightGBM 알고리즘 결과 비교 37
〈표 3.16〉 chunk+소리변수 결합을 활용한 LightGBM 알고리즘 결과 비교 37
〈표 3.17〉 chunk+중요도 상위변수를 활용한 LightGBM 알고리즘 결과 비교 38
〈그림 2.1〉 SNR 수식 15
〈그림 2.2〉 MFCC 추출과정 16
〈그림 2.3〉 librosa 라이브러리 17
〈그림 2.4〉 Spectrogram 변환과정 18
〈그림 2.5〉 이진 분류 알고리즘과 이상치 탐지 알고리즘 비교 21
〈그림 2.6〉 Autoencoder 학습 절차 22
〈그림 2.7〉 IsolationForest 이상치 분리 컨셉 22
〈그림 2.8〉 하나의 residual block 23
〈그림 3.1〉 학습데이터의 구성 항목 25
〈그림 3.2〉 데이터 label 비율 25
〈그림 3.3〉 MFCC 예시 27
〈그림 3.4〉 Mel Spectrogram 예시 27
〈그림 3.5〉 Spectral contrast 예시 28
〈그림 3.6〉 audio chunk 예시 28
〈그림 3.7〉 Segmentation 분할 예시 29
〈그림 3.8〉 모델 아키텍처 30