목차

표제지

국문 요약

목차

1. 서론 10

1.1. 연구 배경 10

1.2. 관련 연구 13

1.2.1. 감성 분석 13

1.2.2. BERT 15

2. 어휘의미망과 어휘의 관계 정보 16

2.1. 한국어 어휘의미망 17

2.1.1. UWordMap 17

2.1.2. 용언어휘망 19

2.2. 자질 설정 방식 21

2.2.1. 명사 22

2.2.2. 용언 28

2.3. 자질 생성 알고리즘 35

3. 감성 표현 영역 추출 모델 37

3.1. UBERT 37

3.2. baseline 모델 개요 38

3.3. 제안 모델 개요 39

4. 실험 및 평가 41

4.1. 감성 표현 영역 데이터 41

4.2. 실험 환경 44

4.3. 실험 결과 45

4.3.1. baseline 모델과 제안 모델 성능 비교 45

4.3.2. 임베딩별 자질 결합 성능 비교 47

4.3.3. 자질별 제안 모델 성능 비교 48

4.3.4. 오류 분석 52

5. 결론 55

참고 문헌 56

Abstract 58

〈표 1〉 문장 내 다양한 감성 표현 영역을 가진 예시 문장 11

〈표 2〉 동일한 단어를 포함한 문장 예시 12

〈표 3〉 '안스럽다_000000'의 계층 구조 20

〈표 4〉 1계층을 명사 대표 계층으로 선정했을 때 주제별 대표 단어 25

〈표 5〉 2계층을 명사 대표 계층으로 선정했을 때 주제별 대표 단어 25

〈표 6〉 3계층을 명사 대표 계층으로 선정했을 때 주제별 대표 단어 26

〈표 7〉 주제별 명사 대표 단어 결과 27

〈표 8〉 1계층을 용언 대표 계층으로 선정했을 때 주제별 대표 의미부류와 단어 31

〈표 9〉 2계층을 용언 대표 계층으로 선정했을 때 주제별 대표 의미부류와 단어 31

〈표 10〉 3계층을 용언 대표 계층으로 선정했을 때 주제별 대표 의미부류와 단어 32

〈표 11〉 주제별 용언 대표 의미부류와 단어 결과 33

〈표 12〉 모두의 말뭉치 감성분석 데이터 예시 41

〈표 13〉 가공된 데이터 예시 42

〈표 14〉 데이터 길이 변환 예시 43

〈표 15〉 학습 실험 환경 44

〈표 16〉 학습에 사용된 hyper parameter 44

〈표 17〉 단위별 baseline 모델과 제안 모델 성능 45

〈표 18〉 임베딩별 문장 주제 자질 결합 성능 비교 47

〈표 19〉 baseline 모델과 사전 품사별 제안 모델의 어절 단위 성능 비교 48

〈표 20〉 데이터와 사전 품사별 제안 모델 어절 단위 성능 50

〈표 21〉 데이터와 사전 품사별 주제 재현율 51

〈표 22〉 문장의 주제 예측을 실패한 예시 52

〈표 23〉 감성 표현 영역을 정답보다 좁게 예측한 예시 52

〈표 24〉 감성 표현 영역을 정답보다 넓게 예측한 예시 53

〈표 25〉 감성 표현 영역을 예측 실패한 예시 54

〈표 26〉 감성 표현 영역이 아닌 영역을 예측한 예시 54

[그림 1] 네이버 쇼핑 〈카메라〉 리뷰 예시 10

[그림 2] BERT 모델 구조 15

[그림 3] WordNet에 'pretty' 검색 결과 16

[그림 4] UWordMap에서 '분위기' 검색 결과 17

[그림 5] 주제별 명사 최상위어 비율 분포 22

[그림 6] 주제별 데이터 명사 최상위어 빈도수 23

[그림 7] 주제별 명사어휘망 계층 비율 분포 24

[그림 8] 주제별 최상위 용언의미부류 비율 분포 28

[그림 9] 주제별 데이터 최상위 용언의미부류 빈도수 29

[그림 10] 주제별 용언어휘망 계층 비율 분포 30

[그림 11] 문장 주제 자질 생성 알고리즘 35

[그림 12] UBERT 모델 구조 37

[그림 13] 토큰 단위 baseline 모델 구조 38

[그림 14] 어절 단위 baseline 모델 구조 38

[그림 15] 어절 단위 제안 모델 구조 39

[그림 16] 문장 주제 자질 생성 구조 40