표제지
요약
목차
1. 서론 9
2. 선행 연구 12
2.1. 개체명 인식 12
2.2. Text 임베딩 13
3. 모델 17
3.1. BERT 17
3.2. ELECTRA 19
4. 실험 21
4.1. 데이터 및 실험 구성 21
4.2. Phrase 추출 23
4.3. Key-Phrase 추출 25
4.3.1. Phrase 임베딩 26
4.3.2. 클러스터 개수 K 최적화 26
4.3.3. 클러스터링 27
4.3.4. 대푯값 및 Key-Phrase 추출 29
5. 결론 및 향후 과제 31
참고문헌 32
[표 2.1] 한국어 Sentence-BERT 학습데이터 예시 15
[표 3.1] NSMC 문서 분류 모델별 성능 비교 19
[표 3.2] Naver NER 모델별 성능 비교 20
[표 4.1] Phrase 정의 21
[표 4.2] 후기 데이터 예시 22
[표 4.3] 학습, 검증 데이터 통계량 22
[표 4.4] Fine-Tuning 하이퍼파라미터 23
[표 4.5] 모델별 검증 데이터 성능 24
[표 4.6] Phrase 추출 결과 예시 25
[그림 1.1] 온라인쇼핑 이용 후기 소비자 인식도 설문조사 결과 10
[그림 2.1] 각 태깅 시스템에 따른 태깅 결과 예시 13
[그림 2.2] Word2Vec 학습 방식(CBOW, Skip-gram) 14
[그림 2.3] Sentence-BERT 학습 구조 16
[그림 3.1] BERT와 GPT 아키텍처 비교 17
[그림 3.2] Transformer의 Encoder, Decoder 18
[그림 3.3] ELECTRA 아키텍처 20
[그림 4.1] Key-Phrase 추출 프로세스 26
[그림 4.2] 병합 클러스터링 과정 시각화 28
[그림 4.3] 소비자 후기 Phrase 클러스터링 결과 시각화 29
[그림 4.4] 소비자 후기 Key-Phrase 추출 결과 예시 30