표제지
목차
요약 8
제1장 서론 9
1.1. 개요 9
1.2. 관련 연구 11
1) 합성곱 신경망 11
2) 트랜스포머 모델 18
3) 의료 이미지 캡셔닝 21
4) 3차원 합성곱 신경망 21
제2장 방법론 23
2.1. 인코더 24
2.2. 디코더 25
2.3. 페널티가 적용된 손실함수 26
2.4. 텍스트 생성 전략 27
제3장 실험결과 28
3.1. 실험 환경 설정 28
3.2. 데이터 셋 28
1) 이미지 캡션 29
2) 3D CT 영상 30
3.3. 평가 방법 31
3.4. 전체 테스트 데이터에 대한 실험결과 34
3.5. 뇌내출혈 환자의 테스트 데이터에 대한 실험결과 36
3.6. 모델이 생성한 텍스트 결과 39
제4장 논의 41
제5장 결론 44
참고문헌 45
요약 51
표 1. 판독문 예시 29
표 2. 최종 데이터 셋 예시 31
표 3. l 손실 함수 적용 모델의 전체 테스트 데이터에 대한 실험결과 34
표 4. L 손실 함수 적용 모델의 전체 테스트 데이터에 대한 실험결과 35
표 5. 뇌내출혈 환자의 테스트 데이터에 대한 실험결과 37
표 6. EfficientNet-B5+B 모델 생성 텍스트 예시 39
그림 1. 합성곱 연산 예시 12
그림 2. 풀링 과정 예시 13
그림 3. ResNet-50 모델의 전체구조 예시 14
그림 4. DenseNet-201 모델의 전체구조 예시 15
그림 5. EfficientNet-B0 모델의 전체구조 예시 16
그림 6. ConvNeXt 모델의 전체구조 예시 17
그림 7. 트랜스포머 모델 구조 예시 18
그림 8. GPT-2 모델의 문장 생성 과정 예시 20
그림 9. 제안 방법 23
그림 10. 의료 이미지 예시 30
그림 11. 3D CT 영상 전처리 과정 30
그림 12. 판독문 예시 36