컴퓨터를 활용한 신약 설계 연구분야는 크게 구조기반 약물설계, 리간드기반 약물설계 방법으로 나뉘어져 있다. 이러한 연구기법을 활용해 약물활성 예측을 잘 하기 위한 분자들의 수학적, 논리적 데이터형으로 나타낸 특성들을 descriptor(표현자)라고 한다. 단백질기반의 표현자들은 아미노산서열, 리간드와의 결합에너지, 용매화 자유에너지 등이 있으며, 리간드 기반의 표현자들은 분자량, 분배계수, 수소결합 공여체 및 수용체 수, 방향족 고리 수, 극성표면영역, substructure와 작용기를 논리값으로 나타내는 화학 핑거프린트 등이 있다. 오늘날 유용한 표현자들을 계속해서 식별, 개발, 개선하는 연구가 활발히 진행되고 있다. 본 연구에선 기존에 좀처럼 활용하지 않았던 신규 표현자들을 적용하였다. 단백질 기반의 표현자로서 원자 수준에서의 위상학적 물분자 네트워크를 이용하고, 리간드 기반의 표현자로서 정수형 화학 핑거프린트를 이용하였다. 단백질 기반의 표현자로는 이전에 단백질과 리간드만 고려한 연구방법에서 물분자를 도입한 연구방법으로 확장되고 있다. 그러나 물분자를 이용한 연구방법은 대부분 자유에너지 계산을 이용하며, 이러한 자유에너지 계산은 많은 시간을 요구하고 개개의 물분자만을 고려한다. 본 연구에선 자유에너지 계산 없이 다른 물분자들과의 물리화학적 성질을 나타낼 수 있는 위상학적 물분자 네트워크를 도입하였으며, 고리(ring)형 구조를 나타내는 3-, 4-, 5-, 6-ring 을 추출하여 이용하였다. 원자 수준에서의 위상학적 물분자 네트워크 분석은 각각 20개의 아미노산 구조를 생성해서 분자동역학 시뮬레이션 결과에 적용했으며, 고분자 중합체인 단백질은 X-선 결정 구조로 규명된 12만개의 모든 실험적 단백질 3차구조 파일을 다운로드하여 분석하였다. 친수성 아미노산은 극성 원자인 산소, 질소 주변에 물 네트워크를 형성하였고, 소수성 아미노산은 비극성 원자인 탄소 주변에 물 네트워크를 형성하였다. 리간드 기반의 표현자로는 대부분 이진수형 핑거프린트를 이용하여 연구가 진행되고 있다. 그러나 이진수형 핑거프린트는 일정한 수 (보통 1024개)로 고정되어 있어 분자들의 수많은 substructure, 작용기들을 모두 표현하는 것이 제한된다. 따라서 정수형 핑거프린트를 새로 도입하여 hERG 저해제 예측에 적용하였다. 정수형 핑거프린트는 대부분의 머신러닝 모델에서 잘 예측하며 이진수형 핑커프린트는 딥러닝 모델에서 잘 예측하고 변수들의 수가 1024개로 고정되어 있어서 계산시간이 단축되었다. 생성한 모델들의 성능 비교 결과 데이터 수가 적은 조건(최근 2019년 개제된 hERG 실험결과 문헌들)에서의 예측력은 머신러닝, 딥러닝 모두 정수형 핑거프린트에서 잘 예측하였다. 상기 신규 표현자들의 활용은 컴퓨터 기반 신약 설계분야에 유용하게 적용될 수 있을 것으로 기대한다.