본 연구의 목적은 전자의무기록자료를 활용하여 심장수술 후 중환자 섬망 예측모델을 개발하고 평가하는 것이다. 서울대학교병원 Clinical Data Warehouse (CDW) 연구 검색 시스템인 Seoul National University Hospital Patient Research Environment (SUPREME)를 통해 2017년부터 2021년까지의 5년간 병원 심폐기계중환자실에 입실한 성인 2,083명의 원시자료를 추출한 뒤, R 프로그램을 이용하여 분석하였다.
최대한 누락 없이 선별하기 위해 임상관찰기록의 The Confusion Assessment Method for the ICU (CAM-ICU) 평가 결과, 간호일지 표준 진술문, 진단명, 정신건강의학과 타과의뢰 및 haloperidol 처방내역의 5 가지 자료 중 한 가지 이상에서 섬망 여부가 확인될 경우 섬망 환자로 정의했다. 섬망 발생 건의 수는 전체 2,083건 중 417건(20.0%)이었고, CAM-ICU, 타과의뢰 및 haloperidol만으로 정의된 수와 큰 차이가 없었다(410건).
문헌고찰을 바탕으로 중환자실 입실 직후 시점에 결정되는 46개의 위험요인을 선정한 후, 카이제곱 검정 및 T 검정으로 단변량 분석을 시행하여 p-value가 0.05보다 작았던 최종 35개의 위험요인으로 섬망 예측모델을 개발하였다. 모델 개발에 사용된 최종 위험요인 변수 중 수술 전 변수로 대상자의 성별, 연령, 체질량지수, 수술 전 재실 여부 및 수술 전 입원 기간 등이 포함되었고, 수술 자체 관련 변수로는 대동맥 수술 여부, 관상동맥 수술 여부, 판막 수술 여부, 예상 실혈량, 수술 시간, 심폐기 사용 여부 및 시간이 포함되었으며, 수술 후 변수로는 산소포화도 이상 여부, 체온, 심박수, 평균 동맥 혈압, 동맥혈 산도(pH), 동맥혈 산소 분압(pO₂), 동맥혈 이산화탄소 분압(pCO₂), 혈당, 젖산, 헤모글로빈, 혈소판, 섬유소원(Fibrinogen), 활성화 부분 트롬보플라스틴 시간(activated Partial Thromboplastin Time, aPTT), 프로트롬빈 시간(Prothrombin Time, PT), 나트륨, 칼슘, 마그네슘, 혈중요소질소(Blood Urea Nitrogen, BUN), 크레아티닌, 총 빌리루빈(Total Bilirubin), 알부민, 그리고 C-반응성 단백질(C-Reactive Protein, CRP)이 사용 되었다.
예측모델은 로지스틱 회귀(Logistic Regression), 의사결정나무(Decision Tree), 랜덤포레스트(Random Forest), 그리고 eXtreme Gradient Boosting (XGBoost)의 기계학습 방법을 이용하여 개발하였고 각각의 성능을 비교 평가했다. 섬망군이 추출된 전체 환자군의 약 20%로 비섬망군 대비 균형이 맞지 않아 Synthetic Minority Oversampling Technique (SMOTE) 기법을 사용하여 섬망군과 비섬망군의 비를 1:1로 맞춘 뒤에 모델을 학습시켰다.
예측모델 성능 비교를 위해 반복적 K-겹 교차검증(Repeated K-fold cross-validation) 방법으로 5-겹 교차검증을 10회 반복하였으며 각각의 검증에서 산출된 민감도(Sensitivity), 특이도(Specificity), 양성 예측도(Positive Predictive Value), 음성 예측도(Negative Predictive Value) 및 AUROC (Area Under Receiver Operating Characteristic Curve)의 평균치를 최종 성능 지표로 사용하였다. 네 개의 기계학습 방법 중에서 SMOTE를 적용 후 랜덤포레스트 기법으로 개발한 예측모델의 성능이 민감도 0.9050, 특이도 0.8650, 양성 예측도 0.8702, 음성 예측도 0.9011, AUROC 0.9575로 가장 뛰어났지만, 일반화 가능성에 대한 후속 연구가 필요하다.
본 연구는 섬망의 세부 유형 및 발생 시각을 고려하지 못했다는 제한점을 가진다. 추후 전자의무기록의 data quality를 보완함과 동시에 전자의무 기록의 자유형식 기록을 활용할 수 있는 연구도 계속 되어야 할 것이다.