초록

빅데이터 시대에 데이터를 활용하기 위해 AI 기술이 중추적인 역할을 하고 있다. AI의 기술 중에서도 Deep Neural Network(DNN)의 연구가 활발히 진행되고 있으며 일상생활 전반에서 활용되고 있다. 이러한 연구를 공공 안전에 적용하고자 하는 연구가 진행되고 있으며 대표적인 사례로 안전신문고를 들 수 있다. 안전신문고는 2014년부터 행정안전부에서 운영 중인 서비스로, 2022년 3월 기준 900만건의 신고데이터가 누적 되어있다. 신고 데이터의 구성은 신고내용과 제목 등의 텍스트 데이터부터 사진, 동영상, 음성 등의 비정형 데이터까지 다양한 형태의 빅데이터로 구성되어 있다. 이러한 안전신문고의 데이터를 활용한 연구는 신고내용 기반의 자연어처리가 대부분이다. 2021년 신고 이미지를 기반으로 이미지를 분류하는 연구가 진행되었으며 범용 이미지를 기반으로 사전학습한 모델의 가중치를 활용해 연구를 진행했다. 이에 본 연구에서는 이전 연구를 확장하여 사전학습 모델을 학습데이터의 특성에 따라 생성하고 성능을 비교 분석한다. 또한 사전학습모델의 학습을 위해 분산학습을 이용하고 분산학습의 전략별로 학습시간과 성능을 비교한다. 학습데이터는 범용데이터와 Task에 특화된 데이터로 수집하여 활용한다. 범용데이터는 Cifar-10 데이터 셋을 활용하며 특화데이터는 AIHub의 노후시설이미지 데이터 셋을 활용한다. 이미지 분류를 위한 DNN 모델은 Vision Transformer를 이용하였으며 성능 비교를 위한 테스트 셋은 안전신문고의 주요처리사례에 게시된 이미지를 대상으로 확인한다. 분산학습 전략별 실험 결과 다중머신의 GPU를 활용한 학습시간이 단일머신의 학습시간 대비 5배가 소요되었다. 이는 매 Iteration 마다 노드 간에 학습Parameter를 공유하기 위한 통신으로 인해 지연되는 것을 확인할 수 있었으며 효율적인 학습을 위해서는 All-Reduce 통신 과정을 줄이는 것이 중요하다는 것을 알 수 있었다. 학습데이터의 특성 별 분류 성능을 비교하는 실험에서는 특화데이터를 이용한 사전학습모델의 분류 성능이 6% 높게 기록됐다. 또한 분류를 위한 이미지의 Attention 부위를 확인한 결과, 안전모델에서 분류 부위가 더 명확히 표시되는 것을 확인할 수 있었다. 본 연구를 통해 사전학습모델 구축 시 학습데이터의 특성을 고려한 모델을 구축하여 활용하는 것이 더 효율적이라는 것을 알 수 있었다. 본 연구를 통해 대규모 데이터와 DNN모델 구축을 위해 분산학습이 반드시 필요하며, Data기반의 분산학습 전략을 사용하는 경우 학습의 효율을 높이기 위해 네트워크의 제약을 최소화할 수 있는 노드의 물리적 연결 구성과 학습에 최적화된 프로세서(GPU, TPU)의 탑재와 프로세서 간에 효율적인 통신이 중요하다는 것을 알 수 있었다. 또한 학습 과정에서 데이터 전처리에 소요되는 시간을 최소화하기 위한 전처리 파이프라인을 구축하고 각 노드의 학습데이터는 Offline에서 미리 분배하여 학습 시 소요되는 시간을 최소화하도록 해야한다. 향후 본 연구를 바탕으로 All-Reduce 구간을 줄이기 위한 Parameter Server 구현 및 비동기식 데이터 공유 등에 관한 연구를 계속 진행할 예정이다.