목차

표제지

목차

국문초록 9

ABSTRACT 11

제1장 서론 13

1.1. 연구 개요 및 목적 13

제2장 관련연구 15

2.1. 파운데이션 모델 15

2.2. SAM 16

2.3. 대화형 분할 18

제3장 제안 모델 19

3.1. SAM as the Backbone 19

3.2. DT-SAM 21

3.2.1. Multi-level feature fusion 22

3.2.2. Domain Token 24

3.2.3. Ensemble Module 25

제4장 실험 및 결과 26

4.1. 실험 설정 26

4.1.1. 데이터셋 26

4.1.2. 실험 환경 27

4.1.3. 평가 지표 27

4.1.4. 훈련&추론 설정 28

4.2. 실험 결과 및 분석 29

제5장 결론 34

참고문헌 35

[표 3-1] SAM 버전에 따른 이미지 인코더와 마스크 디코더의 파라미터 수 20

[표 4-1] 실험에 사용한 데이터셋 26

[표 4-2] 실험 환경 27

[표 4-3] 훈련&추론에 대한 SAM과 DT-SAM 비교 29

[표 4-4] Mutli-level Fusion에 대한 Ablation study 30

[표 4-5] 6가지 데이터셋에 대한 실험 결과 31

[그림 2-1] SAM 구조 17

[그림 3-1] 제안하는 모델(DT-SAM) 구조 21

[그림 3-2] SAM의 Image Encoder와 Multi-level Feature Fusion 구조 23

[그림 3-3] SAM의 마스크 디코더와 Ensemble Module 구조 25

[그림 4-1] The Visualization Results of Industrial Anomaly Segmentation 32

[그림 4-2] The Visualization Results of 4 datasets(Thin-object 5K, COIFT, DIS, HRSOD) 33