자율운항선박 및 무인선의 항해를 위해서는 타선과 지형 장애물 등의 정적 장애물에 대해서 충돌 회피를 성공적으로 수행해야 한다. 이는 여러 선박이 항해하는 해상에서 타선 및 자선의 안전을 위해서 필수적으로 확보되어야 하는 기능이다.
자율운항선박 및 무인선의 충돌 회피 알고리즘에 대한 기존 연구는 타선에 대해 VO(Velocity Obstacle) 기법을 활용하여 수행되어져 왔으나, 정적 장애물과 타선 조우 상황 시 회피 시점을 유연하게 대처하기 힘들다는 단점이 있다.
본 연구는 기존 충돌회피 알고리즘에서 대처하기 하기 힘들었던 다양한 정적 및 타선과 같은 동적 장애물에 대한 적절한 회피 시점을 선택하는 것을 연구목표로 설정하였다. 자율운항선박 및 무인선은 인지-판단-제어를 통해 상황 판단 및 회피 시점을 선택하게 된다. 본 연구는 인지단계에서 회피 시점 선택 및 적절한 경로 계획을 선택하는 데에 있어 심층강화학습을 이용하였다. 강화학습은 에이전트가 스스로 주어진 환경에서 최적의 행동을 통해 보상을 최대화 하는 기계학습의 기법 중 하나이다. 본 연구는 심층강화학습의 기법 중 하나인 액터-크리틱(Actor-Critic) 기법을 활용하여 타선에 대해 CORLEGs(Convention on the International Regulations for Preventing Collisions at Sea) 규칙 기반 회피 및 정적 장애물에 대한 회피하는 알고리즘을 구성하였다.
구성된 알고리즘은 타선 및 지형과 같은 정적 장애물이 구성되어 있는 다양한 시나리오를 통해 검증 및 시뮬레이션을 진행하였다. 이를 통해 자선의 적절한 속도 벡터, 주변 장애물 사이 거리 및 각도, 충돌 회피 시점 등을 통해 본 연구의 효용성을 확인하였다.