본 논문은 음악 연주 정보 중 하나인 벨로시티(Velocity)를 예측하기 위한 순환 신경망 모델을 제안하고 이를 구현하고 실험한 결과를 분석하여 향후 가치에 대해 자가평가를 진행한다. 이를 설명하기 위해 먼저 이 모델에 이용된 개념인 음악 정보 추출과 인공 신경망에 대해 소개하고 구체적인 이론을 설명한 다음 최근 연구를 몇 가지 살펴본다. 논문에서 제안한 순환 신경망 모델은 MAESTRO 데이터셋의 데이터를 추출 및 가공하여 벨로시티를 예측하기 적합한 정보를 이용할 수 있도록 설계되었으며, 이들 데이터가 시계열 데이터이며 장기적 및 단기적으로 주변 데이터끼리 깊은 연관성을 가지고 있다는 점을 고려해 LSTM(Long Short-Term Memory) 셀에 기반한 신경망 구조를 설계하였다.
이렇게 구축한 모델을 정량적으로 평가하기 위해 기존에 유사한 주제의 연구 결과에 명시되어 있던 4가지 데이터셋을 이용해 본 논문에서 설계한 네트워크를 훈련시킨 후, 훈련된 모델의 학습 및 평가 손실값을 도출하고 해당 연구에서의 손실값과 비교하였다. 결과적으로 본 연구의 모델은 4가지 데이터셋 모두에서 기존 연구의 모델에 비해 더 적은 평가 손실값에 수렴하여 정량적인 성능이 더 개선된 것으로 해석할 수 있었다. 다만 사람들을 대상으로 진행한 정성적 평가에 따르면 모델이 생성한 연주보다 전문 음악인의 연주의 선호도가 좀더 높은 것으로 나타나 이에 대한 개선이 필요한 것으로 판단되었다.
실험을 통해 본 논문에서 구축한 모델은 임의의 피아노 연주가 기록된 데이터에 대해서도 우수한 예측결과를 도출함을 확인할 수 있었고, 이를 통해 본 연구의 결과물이 창작의 영역에 응용될 수 있다는 점도 고려할 수 있었다. 그리고 학습에 이용한 데이터셋이 서양 고전 음악이라는 장르에 한정되어 있었다는 점에서 좀더 다양한 장르의 데이터셋을 확보하고 학습한다면 다양한 서비스로 확장이 가능할 수 있을 것으로 예상한다.