표제지
목차
국문초록 9
ABSTRACT 11
제1장 서론 13
1.1. 연구 개요 및 목적 13
제2장 관련연구 15
2.1. 파운데이션 모델 15
2.2. SAM 16
2.3. 대화형 분할 18
제3장 제안 모델 19
3.1. SAM as the Backbone 19
3.2. DT-SAM 21
3.2.1. Multi-level feature fusion 22
3.2.2. Domain Token 24
3.2.3. Ensemble Module 25
제4장 실험 및 결과 26
4.1. 실험 설정 26
4.1.1. 데이터셋 26
4.1.2. 실험 환경 27
4.1.3. 평가 지표 27
4.1.4. 훈련&추론 설정 28
4.2. 실험 결과 및 분석 29
제5장 결론 34
참고문헌 35
[표 3-1] SAM 버전에 따른 이미지 인코더와 마스크 디코더의 파라미터 수 20
[표 4-1] 실험에 사용한 데이터셋 26
[표 4-2] 실험 환경 27
[표 4-3] 훈련&추론에 대한 SAM과 DT-SAM 비교 29
[표 4-4] Mutli-level Fusion에 대한 Ablation study 30
[표 4-5] 6가지 데이터셋에 대한 실험 결과 31
[그림 2-1] SAM 구조 17
[그림 3-1] 제안하는 모델(DT-SAM) 구조 21
[그림 3-2] SAM의 Image Encoder와 Multi-level Feature Fusion 구조 23
[그림 3-3] SAM의 마스크 디코더와 Ensemble Module 구조 25
[그림 4-1] The Visualization Results of Industrial Anomaly Segmentation 32
[그림 4-2] The Visualization Results of 4 datasets(Thin-object 5K, COIFT, DIS, HRSOD) 33