초록

이 연구는 의료 비디오 분석을 위한 딥 러닝 기술을 탐구합니다. 현재 딥러닝 기술들을 의료 분야에 적용하는 것에는 데이터 수집의 어려움과 자연 비디오와는 다른 의료 비디오만의 독특한 특성으로 인해 몇 가지 도전과제를 안고 있습니다. 본 논문은 지식 증류(Knowledge Distillation), 암시적 신경 표현(Implicit Neural Representation), 그리고 딥거리 학습(Deep Metric Learning)과 같은 고급 딥 러닝 기술을 의료 비디오 데이터 분석에 적용하여 이러한 도전과제들을 해결합니다. 특히, 이 연구는 유양돌기 절제 수술 단계 인식 및 비디오 인페인팅 기법과 대장내시경 비디오 데이터의 정량화 방법에 중점을 둡니다.

이 연구에서는 의료 비디오를 분석하기 위해 세 가지 실험이 수행되었습니다. 첫 번째 연구는 교사-학생 학습을 사용하여 유양돌기 절제 수술 단계 인식 학습 방법을 제안했으며, 클래스 불균형 및 데이터 부족 상황에서 성능이 향상된 것을 보여주었습니다. 두번째 연구는 암묵적 신경 표현 방법을 활용하여 대규모 비디오 데이터 수집이 없이 고해상도 비디오 인페인팅을 하는 방법을 소개했으며, 기존 최신 모델과 비교하여 시각적으로 성능이 향상된 것을 확인합니다. 세 번째 연구는 품질 인식 거리 학습과 노이즈에 강한 단계 인식 모델을 결합한 비디오 인식 방법을 제안하여 대장의 특성을 고려함으로써 대장내시경에서 보다 정확한 정량화를 가능하게 했습니다.

우리는 이 연구에서 개발된 방법론들이 유양돌기 절제 수술 및 대장내시경 비디오뿐만 아니라 더 넓은 범위의 의료 비디오 분석 분야에도 적용될 수 있을 것이라고 믿습니다.