타겟으로 잡은 야누스 키나아제(Janus Kinase; JAK)의 구성은 JAK1, JAK2, JAK3 그리고 TYK2 까지 총 4 가지가 알려져 있으며, 각각의 아이소자임들은 다양하게 결합하여 사이토카인의 downstream 을 조절한다.
본 논문에서는 야누스 키나아제에 대한 데이터를 이용하여 머신러닝과 딥러닝으로 화합물 기반 약물 설계 방법의 정량적 구조 활성 관계(quantitative structure activity relationship; QSAR)를 통해 야누스 키나아제의 저해제를 찾는 모델을 구축하였다. 머신러닝에서는 베이시안 모델을 이용하였고 딥러닝에서는 인공신경망(artificial neural network; ANN) 모델을 이용하였다.
야누스 키나아제 저해제에 있는 카이랄 구조를 활용하기 위하여 3D 표현자를 사용하였고, 이 표현자를 사용할 경우 모델의 정확성이 떨어짐을 알 수 있었다. 이를 보완할 방법을 생각하다가 SMILES 코드를 합성곱 신경망(convolutional neural network; CNN)을 사용하여 모델을 보완한 논문을 보고 이 SMILES 코드를 숫자로 변환하여 일종의 표현자로 사용할 수 있는지 검토하고자 하였다.
숫자로 변환하기 전 카이랄 구조를 SMILES 코드가 구분할 수 있는지를 확인하기 위하여 같은 타겟에 있어 활성값이 다른 카이랄구조를 가지고 2D 표현자, 3D 표현자, SMILES 코드를 계산하였다. 그 결과 3D 표현자와 SMILES 코드에 차이가 있어 이 둘을 표현자로 사용할 수 있음을 알게 되었다.
3D 표현자를 추가한 모델의 그래프 정확성이 떨어지는 경향을 보였으나, SMILES 코드를 표현자로 추가한 모델에서는 정확성이 올라간 것을 훈련, 테스트 그리고 외부 데이터 세트를 통해 확인하였다.
본 논문에서 확인한 표현자가 다른 타겟에 있어서도 신약개발모델에 대한 보완지표로 적용될 수 있을 것이다.