목차

표제지

요약

목차

1. 서론 9

2. 선행 연구 12

2.1. 개체명 인식 12

2.2. Text 임베딩 13

3. 모델 17

3.1. BERT 17

3.2. ELECTRA 19

4. 실험 21

4.1. 데이터 및 실험 구성 21

4.2. Phrase 추출 23

4.3. Key-Phrase 추출 25

4.3.1. Phrase 임베딩 26

4.3.2. 클러스터 개수 K 최적화 26

4.3.3. 클러스터링 27

4.3.4. 대푯값 및 Key-Phrase 추출 29

5. 결론 및 향후 과제 31

참고문헌 32

[표 2.1] 한국어 Sentence-BERT 학습데이터 예시 15

[표 3.1] NSMC 문서 분류 모델별 성능 비교 19

[표 3.2] Naver NER 모델별 성능 비교 20

[표 4.1] Phrase 정의 21

[표 4.2] 후기 데이터 예시 22

[표 4.3] 학습, 검증 데이터 통계량 22

[표 4.4] Fine-Tuning 하이퍼파라미터 23

[표 4.5] 모델별 검증 데이터 성능 24

[표 4.6] Phrase 추출 결과 예시 25

[그림 1.1] 온라인쇼핑 이용 후기 소비자 인식도 설문조사 결과 10

[그림 2.1] 각 태깅 시스템에 따른 태깅 결과 예시 13

[그림 2.2] Word2Vec 학습 방식(CBOW, Skip-gram) 14

[그림 2.3] Sentence-BERT 학습 구조 16

[그림 3.1] BERT와 GPT 아키텍처 비교 17

[그림 3.2] Transformer의 Encoder, Decoder 18

[그림 3.3] ELECTRA 아키텍처 20

[그림 4.1] Key-Phrase 추출 프로세스 26

[그림 4.2] 병합 클러스터링 과정 시각화 28

[그림 4.3] 소비자 후기 Phrase 클러스터링 결과 시각화 29

[그림 4.4] 소비자 후기 Key-Phrase 추출 결과 예시 30