표제지
요약
Abstract
목차
Chapter 1. INTRODUCTION 12
1.1. Motivation and Problem Statement 12
1.2. Contribution and Outline of the Thesis 18
Chapter 2. RELATED WORK 21
2.1. General Process of Person Re-Identification 21
2.2. Feature Engineering for Discriminative Feature Embedding on Three Different Approach 30
2.2.1. Multi-scale Learning Approach 30
2.2.2. Part-based Learning Approach 34
2.2.3. Attention Mechanism-based Approach 38
Chapter 3. Attentive Dual Pyramid for Person Re-Identification 43
3.1. Network Architecture and Overall Process 43
3.2. Backbone Module 49
3.3. Attentive Scale Pyramid and Channel Attention Module 51
3.4. Attentive Local Pyramid and Multi-shot Attention Module 60
Chapter 4. Experiment 72
4.1. Dataset 72
4.2. Implementation Details 76
4.3. Metric for Evaluation 77
4.4. Ablation Tests 78
4.5. Discussion 97
Chapter 5 Conclusions 101
Reference 103
표 2.1. 기존 보행자 재식별 연구들[5-26]의 기반 특징 및 손실함수 구성 25
표 2.2. 기존 다중 크기 특징 기반의 보행자 재식별 방법의 구성 31
표 2.3. 기존 지역 기반 학습을 활용한 보행자 재식별 방법의 구성 35
표 4.1. 학습 및 평가를 위한 데이터 셋의 구성 72
표 4.2. 기존 연구들[6-10, 23, 24]에서 사용된 데이터 증량 기법의 구성 75
표 4.3. 백본에 대한 절제 실험 결과 78
표 4.4. 규모 피라미드 블록의 구성에 따른 절제 실험 결과 85
표 4.5. 지역 피라미드 블록의 구성에 따른 절제실험 결과 87
표 4.6. 다중 규모 특징의 선택을 위한 채널 어탠션 모듈 구성에 대한 절제 실험 결과 89
표 4.7. 지역별 전경 추출을 위한 다중 포착 모듈의 구성에 따른 절제 실험 결과 91
표 4.8. 각도 기반의 소프트맥스 손실함수를 학습에 사용한 절제 실험 결과 96
표 4.9. 데이터 셋의 변화에 따른 제안 방법의 성능 평가 결과 96
표 4.10. 최근의 연구들[3-14]과의 성능 비교표 98
표 4.11. 각도 기반의 소프트맥스 손실함수를 학습에 사용한 절제 실험 결과 100
그림 1.1. 제안하는 모델의 개념도 18
그림 2.1. 보행자 재식별의 일반적인 수행도 21
그림 2.2. 보행자 재식별을 위한 인공신경망의 일반적 구성도 22
그림 2.3. 보행자 이미지 및 ResNet 백본의 특징 추출지역을 표시한 각 이미지의 돌출맵 23
그림 2.4. 보행자 이미지에 나타난 정사각형(청색 파선) 및 직사각형(적색 파선) 모양의 시각적 요소 예시 34
그림 2.5. 지역별 특징 임베딩 추출을 위한 보행자 이미지 상의 (8/4) 분할 지역의 예 37
그림 2.6. 어탠션 기반 특징 추출 시 발생 가능한 보행자 신체 영역 탈락의 예 40
그림 3.1. 제안하는 보행자 재식별 모델의 신경망 구성도 45
그림 3.2. 제안하는 재식별 모델의 추론 단계 48
그림 3.3. 백본의 신경망 구조 49
그림 3.4. 어탠션 기반의 규모 피라미드의 신경망 구성도 51
그림 3.5. 규모 피라미드 블록의 신경망 구성도 52
그림 3.6. 규모 피라미드 블록에 의한 다중 규모 특징의 추출 예시 54
그림 3.7. 입력 이미지에 대해 규모 피라미드 블록이 부여하는 수용영역의 예시 55
그림 3.8. 어탠션 기반의 규모 피라미드에 사용된 채널 어탠션 모듈의 신경망 구성도 57
그림 3.9. 어탠션 기반의 규모 피라미드를 통한 다중규모 특징 선별의 예 59
그림 3.10. 어탠션 기반의 지역 피라미드의 신경망 구성도 61
그림 3.11. 지역 피라미드 블록의 신경망 구성도 63
그림 3.12. 지역 피라미드 블록에 의한 지역 특징맵들이 입력 이미지에서 담당하는 영역의 예 64
그림 3.13. 다중 포착 어탠션 모듈의 신경망 구성도 65
그림 3.14. 다중 포착 어탠션 모듈 내 공간 어탠션 모듈의 신경망 구성도 66
그림 3.15. 어탠션 기반의 지역 피라미드를 통한 지역 임베딩 추출의 예 67
그림 3.16. 어탠션 기반 이중 피라미드를 통한 지역별 전경 특징맵의 예 69
그림 3.17. 지역별 특징 임베딩 추출을 위한 제안 모델의 알고리즘 71
그림 4.1. 데이터 증량 과정을 통해 변환된 보행자 이미지의 예 74
그림 4.2. 1:2 비율부터 1:7 비율까지 크기를 재조정한 입력 이미지들의 예시 80
그림 4.3. 입력 이미지의 크기에 따른 절제 실험 결과 81
그림 4.4. (128 * 512) 크기의 입력 이미지에 부여되는 수용영역들의 예시 83
그림 4.5. 다중 포착 모듈에 의해 만들어진 전경 특징맵의 돌출맵 예 92
그림 4.6. 각도 기반 손실함수를 사용하는 헤드 계층의 구성 예 93