스마트폰 보급률이 높아지면서 모바일 메신저의 이용자 수가 꾸준히 증가하고 있으며, 범죄 활동의 수단으로 악용하는 사례 또한 증가하고 있다. 따라서 메신저 대화 내용은 디지털 포렌식 수사에 필수적인 분석 대상이 되었으나, 방대한 자연어 데이터에서 수사에 필요한 주요 정보를 식별하는 것은 어려운 일이다.
본 논문은 최근 자연어 처리 분야에서 많은 성능 향상을 이끈 사전 학습된 언어 모델을 기반으로 메신저 대화 내용에서 육하원칙 정보, 범죄 키워드와 같은 중요정보를 빠르게 식별하고 시각화하는 자연어 처리 기반 디지털 포렌식 조사 방법론을 제안한다. 또한 제안한 방법론을 기반으로 응용 소프트웨어를 구현하고 실제 대화 내용을 대상으로 실험하여 해당 방법론이 유효함을 입증한다.