표제지
목차
국문요약 9
I. 서론 11
II. 관련연구 17
2.1. 레이블 임베딩 17
2.2. 오토인코더 및 오토인코더 기반 레이블 임베딩 18
2.3. 스킵 연결 23
III. 제안 방법론 24
3.1. 제안 방법론 개요 24
3.2. 텍스트 전처리 25
3.3. 스킵 연결 오토인코더 학습 27
3.4. 다중 타겟 회귀 모델 학습 및 레이블 벡터 복원 28
IV. 실험 및 결과 30
4.1. 실험 개요 30
4.2. 원문 전처리 및 키워드 레이블 임베딩 30
4.3. 다중 타겟 회귀 모델 학습 33
4.4. 분류 정확도 평가 34
4.5. 제안 방법론의 활용성 38
4.5.1. 도메인 특성에 따른 성능 비교 38
4.5.2. 잠재 레이블 공간 최적 차원 수 탐색 39
V. 결론 41
참고문헌 43
Abstract 47
〈표 1〉 전처리된 초록 예시 31
〈표 2〉 임베딩된 토큰 예시 32
〈표 3〉 원래 레이블 공간 예시 33
〈표 4〉 잠재 레이블 공간 예시 33
〈표 5〉 성능 결과 36
〈그림 1〉 분류 유형 12
〈그림 2〉 다중 레이블 분류 예시 12
〈그림 3〉 레이블 임베딩 과정 예시 13
〈그림 4〉 전통적인 오토인코더와 스킵 연결 오토인코더 비교 15
〈그림 5〉 오토인코더 종류 19
〈그림 6〉 MANIAC(Multi-lAbel classificatioN usIng AutoenCoders) 20
〈그림 7〉 C2AE(Canonical-Correlated Autoencoder) 구조 21
〈그림 8〉 BSAE(Binary Stochastic AutoEncoder) 구조 22
〈그림 9〉 Rank-AE 구조 22
〈그림 10〉 제안 방법론 개요 25
〈그림 11〉 문서 파싱 예시 26
〈그림 12〉 멀티-핫 인코딩 변환 후 오토인코더 학습 과정 예시 27
〈그림 13〉 일반적인 스킵 연결 방법 28
〈그림 14〉 제안된 스킵 연결 오토인코더 구조 28
〈그림 15〉 다중 레이블 텍스트 분류 학습 및 추론 예시 34
〈그림 16〉 성능 평가 과정 개요 35
〈그림 17〉 레이블 임베딩 성능 비교 37
〈그림 18〉 다중 레이블 텍스트 분류 성능 비교 37
〈그림 19〉 도메인 특성에 따른 다중 레이블 텍스트 분류 성능 비교 39
〈그림 20〉 잠재 레이블 공간 차원 수에 따른 정확도 및 F1 점수 40