초록

많은 환자들이 질병치료를 위해 약물치료를 병행한다. 그러나 각 개인이 가지고 있는 고유의 특징이 모두 다르기 때문에 동일한 약물로 치료를 받더라도, 약물 반응이 모두 다르게 나타난다. 이로 인해, 환자마다 약물의 용법을 달리함으로써, 개인의 특성을 고려하는 맞춤형 약물치료가 필요하다. 맞춤형 약물치료가 잘 이루어지면, 약물 부작용은 최소화하고 치료 효과는 최대화할 수 있다는 장점이 있다. 그러므로, 이미 사용되고 있는 약물 또는 새롭게 개발되어야 하는 약물은 모두 맞춤형 약물로 사용될 수 있어야 한다. 따라서, 본 논문에서는 병원의 전자의무기록 (EMR) 데이터를 활용하여 맞춤형 약물치료를 실현하기 위해 두 가지 연구를 수행하였다.

첫 번째 연구에서는, 항응고제 warfarin 의 퇴원용량을 조기 예측하는 기계학습 모델을 개발하고 검증하였다. 먼저 약물 용량에 적절한 네 가지 기계학습 모델을 개발하였으며, 내부검증을 통해 모델 예측이 실제 임상의의 예측보다 정확도가 높은 것을 확인하였다. 또한 SHAP (SHapley Additive exPlanations)기법을 사용하여 모델 예측에 영향을 주는 주요 변수를 분석함으로써 모델 예측을 설명하였다. 이를 통해, 모델의 용량결정 과정이 실제 의사와 매우 유사하다는 것을 확인하였다. 마지막으로, 동일한 데이터를 의사에게 제시했을 때 각 의사의 개별적 의료 경험에 따라 용량 결정에 변동성이 큰 것을 확인하였으며, 모델의 예측 정확도가 의사보다 2 배 더 높다는 임상적 유용성을 입증하였다.

두 번째 연구에서는, EMR 과 의약정보 데이터베이스를 통합함으로써 새로운 임상현장 기반의 database 를 구축하였다. Open Targets Platform 이라는 데이터베이스에서 FDA 승인을 받은 항암제 및 관련 표적 유전자 정보를 추출하였다. 또한 EMR 과 Open Targets Platform 의 약물 성분 표준화를 통해, 두 데이터베이스를 약물 기준으로 연계하였다. 그 결과, 57 개의 항암제와 관련된 60 개의 암 종류 및 91 개의 유전자 돌연변이의 연관성을 확인할 수 있었다. 또한 실제 항암제 처방환자들의 또 다른 진단정보 및 유전자검사 결과를 확인함으로써, 실제 임상현장에서 환자들의 임상적, 유전적 특징을 모두 활용할 수 있는 플랫폼을 구축하였다.

본 연구를 통해, 전자의무기록 데이터를 활용하여 맞춤형 약물치료를 도울 수 있는 tool 을 두 가지 개발하였다. 최적 warfarin 용량을 예측하는 인공지능 모델은 임상의의사결정보조시스템으로 사용됨으로써, 불필요한 치료기간을 감소시키고 약물부작용을 사전에 방지하는 데 기여할 수 있다. 또한 전자의무기록 데이터와 의약정보 데이터베이스를 통합하여 새롭게 구축된 heterogeneous database 는 인공지능 신약개발에 활용될 수 있을 것으로 기대된다.