COVID-19와 같이 새롭게 등장한 질병에 신속히 효과적으로 대처하기 위하여 컴퓨터 알고리즘을 사용한 약물 재배치 기법이 주목받고 있다. 본 연구에서는 약물의 다양한 특성을 멀티모달 자동 인코더를 통해 통합하여 약물의 분류 체계인 ATC 코드를 예측하는 방법을 제안한다. 약물 간의 유사도는 약물의 화학 구조, 질병 또는 단백질과의 상관관계, 약물 간 상호작용, 약물 부작용 정보를 활용하여 계산하였고, 멀티모달 자동 인코더를 통해 이를 통합하여 하나의 약물 유사도 네트워크를 구성하였다. 또한, 약물-ATC 코드 이기종 네트워크를 구성하여 ATC 코드 예측을 진행하였다. 교차검증을 통해 실험 결과를 평가했을 때, 단일 유사도를 사용하는 경우 0.847의 AUC 값에서 병합된 유사도를 사용했을 때 0.914의 AUC 값으로 예측 정확도가 8.5% 향상되었다.
Drug repositioning strategies using computer algorithms to respond quickly and effectively to emerging diseases, such as COVID-19, are gaining attention. In this work, we propose a novel approach for integrating multiple drug features using a multi-modal autoencoder and predicting ATC codes for a drug classification system. The similarity between drugs was computed based on their chemical structures, association with diseases or proteins, interactions between drugs, and drug side effect information. These features were integrated using a multi-modal autoencoder to create a single drug similarity network. ATC code prediction was also performed by forming a heterogeneous drug-ATC code network. When the experimental results were evaluated through cross-validation, the prediction accuracy was improved by 8.5% to an area under the curve (AUC) value of 0.914 when the merged similarity was used from an AUC value of 0.847 when a single similarity was used.