표제지
목차
I. 서론 11
II. 관련 연구 14
2.1. 파킨슨병의 인지기능 판별 14
2.2. 인지기능 선별검사 15
2.2.1. MMSE Test 15
2.2.2. MoCA Test 19
2.3. 임상/유전형 데이터베이스 21
2.3.1. PPMI 수집 데이터의 인구 통계 22
2.3.2. PPMI 제공 데이터 24
2.4. 모델링 방법 26
2.4.1. Cutoff 모델 26
2.4.2. Logistic Regression 27
2.4.3. Random Forest 29
2.4.4. Support Vector Machine 32
III. 파킨슨병 인지장애 예측모델 및 시스템 개발 35
3.1. 머신러닝 기반의 인지장애 스크리닝 35
3.1.1. 파킨슨병 인지기능 분류 35
3.1.2. 데이터 전처리 및 실험 데이터 생성 36
3.1.3. 인지기능 예측모델 개발 40
3.1.4. 인지기능 예측모델의 성능평가 43
3.1.5. 웹 기반의 인지장애 스크리닝 시스템 51
3.2. 시계열 데이터 분석에 의한 인지기능 저하 예측모델 56
3.2.1. 데이터 전처리 및 실험 데이터 생성 56
3.2.2. 알츠하이머병의 유전적 위험 인자 분석 61
3.2.3. 인지기능 예측모델 개발 68
3.2.4. 성능평가 71
IV. 결론 77
V. 참고문헌 79
국문 초록 84
영문 초록 86
표 1. MMSE 테스트의 세부 검사항목 16
표 2. MMSE 인지장애 분류 절단 값 17
표 3. MoCA 테스트의 인지 영역 세부 설명 19
표 4. MoCA 인지장애 분류 절단 값 21
표 5. 설명변수로서 MoCA 테스트의 총 점수와 개별항목 점수를 사용한 두 모델의 성능 비교결과 41
표 6. 데이터 그룹1의 첫 번째 데이터 세트에 대한 성능 비교결과 43
표 7. 데이터 그룹1의 두 번째 데이터 세트에 대한 성능 비교결과 44
표 8. 데이터 그룹1의 세 번째 데이터 세트에 대한 성능 비교결과 45
표 9. 데이터 그룹2의 첫 번째 데이터 세트에 대한 성능 비교결과 46
표 10. 데이터 그룹2의 두 번째 데이터 세트에 대한 성능 비교결과 46
표 11. 데이터 그룹2의 세 번째 데이터 세트에 대한 성능 비교결과 47
표 12. 데이터 그룹1의 성능평가 종합 결과 48
표 13. 데이터 그룹2의 성능평가 종합 결과 50
표 14. 병원 방문횟수에 대한 환자 수 분포 57
표 15. 슬라이딩 윈도우 기법을 적용하여 추출한 환자의 인지기능 상태 분포 결과 61
표 16. 유의한 상관관계를 보이는 알츠하이머병 관련 변이 분석 결과 67
표 17. 기존의 파킨슨병 인지기능과 연관성이 알려진 변이에 대한 상관관계 분석 결과 67
표 18. 기본 데이터 세트를 사용한 경우의 성능 비교결과 71
표 19. 증대 데이터 세트에 대한 모델의 성능 비교결과 72
표 20. 증대 데이터 세트를 사용한 모델의 Coefficients 73
표 21. 유전적 변이정보를 설명변수로 추가한 모델 결과 74
표 22. 유전적 변이정보를 설명변수로 추가한 모델의 Coefficients 75
그림 1. MMSE 테스트 검사지 18
그림 2. MoCA 테스트 검사지 20
그림 3. PPMI 데이터의 방문 시점을 기준으로 수집된 데이터 인구 분포 22
그림 4. PPMI 데이터의 인종별 수집된 데이터 인구 분포 23
그림 5. PPMI 데이터의 연령별 수집된 데이터 인구 분포 24
그림 6. PPMI 데이터 다운로드 화면 25
그림 7. 로짓 함수 수식 및 그래프 28
그림 8. 랜덤 포레스트 작동 예 30
그림 9. 배깅을 사용한 부트스트랩 샘플링 예 31
그림 10. SVM의 최대 마진 예 33
그림 11. 생성된 PPMI 데이터베이스 스키마 37
그림 12. 결측값 제거 작업 흐름도 38
그림 13. 2개의 그룹으로 이루어진 6개의 데이터 세트 구성 예 40
그림 14. 인지장애 스크리닝 시스템의 데이터베이스 스키마 52
그림 15. 스크리닝 시스템의 환자 정보 입력화면의 예 53
그림 16. 스크리닝 시스템의 MoCA 개별항목 입력화면의 예 54
그림 17. 스크리닝 시스템의 데이터 분석 화면의 예 55
그림 18. 파킨슨병 환자의 방문(visit) 횟수에 따른 인지기능 변화 양상 58
그림 19. 슬라이딩 윈도우 기법을 이용한 데이터 추출의 예 60
그림 20. 알츠하이머병과 연관성이 규명된 유전 변이 리스트 62
그림 21. UNC5CL(rs187370608)의 Cox 모델 결과 63
그림 22. UNC5CL(rs187370608)변이 유/무에 따른 인지장애 발생 양상 비교 64
그림 23. EPHA1(rs10808026)의 Cox 모델 결과 65
그림 24. EPHA1(rs10808026)변이 유/무에 따른 인지장애 발생 양상 비교 66
그림 25. TGL 모델 생성의 예 69
그림 26. 방문횟수가 3 이상인 환자를 대상으로 한 모델 생성의 예 70
수식 1. Cox Proportional Hazards 모델 63
수식 2. loss function L(w) 68
수식 3. TGL 모델 68