표제지
목차
국문초록 14
제1장 서론 18
제1절 연구의 배경 18
제2절 연구의 목적 23
제3절 연구의 방법 및 구성 25
제2장 이론적 배경 30
제1절 화장품 선택속성과 고객 만족 30
1. 화장품 선택속성 30
2. 고객 만족 40
제2절 온라인 리뷰 43
1. 온라인 리뷰의 개념 43
2. 온라인 리뷰의 현황 46
3. 화장품 리뷰의 활용 현황 48
제3절 텍스트 마이닝과 감성분석 51
1. 텍스트 마이닝의 개요 51
2. 텍스트마이닝 과정 54
3. 화장품산업에서 텍스트 마이닝의 의의 55
4. 자연어 처리(NLP) 56
5. 키워드 빈도 분석 58
6. 토픽모델링 60
7. 감성분석 64
8. 설문조사와 빅데이터 분석의 차이점 67
제3장 연구 방법 69
제1절 연구문제의 설정 69
1. 기초 화장품 유형별 비교 69
2. 기초 화장품 선택속성별 만족도 영향관계 70
제2절 연구 절차 71
제3절 자료 수집 72
1. 데이터 수집 대상 72
2. 감성극성값과 평점 만족도 73
제4절 데이터 수집방법 76
1. 개요 76
2. 웹 크룰링을 통한 수집 76
3. 텍스트 리뷰(정성 정보)와 평점(정량 정보) 77
4. 빅데이터 분석 도구 선정 80
제5절 분석 방법 82
1. 데이터 분석 절차 82
2. 한국어 자연어처리 83
3. 감성분석 84
4. LDA 토픽모델링 86
5. 감성극성값 87
제4장 연구의 결과 88
제1절 기조 화장품 유형별 단어 빈도분석 88
1. 마스크팩 단어 빈도분석 89
2. 선케어 단어 빈도분석 91
3. 스킨케어 단어 빈도분석 94
4. 클린징 단어 빈도분석 96
제2절 기초 화장품 유형별 TF-IDF 분석 99
제3절 LDA 토픽 분석 103
1. 토픽 개수 선정 103
2. 토픽 추출 104
제4절 기초 화장품 유형별 감성분석 122
제5절 연구문제 검증 128
제6절 화장품 선택속성과 고객 만족도의 선형회귀분석 134
6.1. 기초 화장품 선택속성별 리뷰의 감성극성값과 전체평점 만족도의 회귀분석 134
6.2. 전체 리뷰의 감성극성값과 전체평점 만족도의 회귀분석 140
6.3. 전체 리뷰의 감성극성값과 전체평점 만족도의 다중선형회귀분석 141
6.4. 전체 리뷰의 감성극성값과 전체평점 만족도의 다중선형회귀분석 및 단계별 변수 선택 142
제7절 선행연구 분석 결과의 비교 145
제5장 결론 147
제1절 연구결과의 요약 147
제2절 연구의 시사점 149
1. 학문적 시사점 149
2. 실무적 시사점 151
제3절 연구의 한계 및 향후 연구 방향 153
참고문헌 156
ABSTRACT 178
〈표 2-1〉 화장품 선택속성과 관련된 선행연구 32
〈표 2-2〉 서비스품질에 대한 선행연구 37
〈표 2-3〉 선행연구에서 제시된 주요 화장품 선택속성 39
〈표 2-4〉 고객만족도 선행연구 41
〈표 2-5〉 전통적 구전과 온라인 구전의 비교 46
〈표 2-6〉 뷰티 분야 텍스트마이닝 선행연구 53
〈표 3-1〉 데이터 수집대상 73
〈표 3-2〉 변수의 특징 75
〈표 3-3〉 화장품 유형별 리뷰 내용 분량 79
〈표 4-1〉 마스크팩 빈도수 분석 결과 90
〈표 4-2〉 선케어 빈도수 분석 결과 93
〈표 4-3〉 스킨케어 빈도수 분석 결과 95
〈표 4-4〉 클린징 빈도수 분석 결과 98
〈표 4-5〉 기초 화장품 유형별 TF-IDF 분석 100
〈표 4-6〉 기초 화장품 유형별 TF-IDF 분석 결과 102
〈표 4-7〉 클린징 토픽 분류 105
〈표 4-8〉 클린징 토픽 분류 세분화 107
〈표 4-9〉 마스크팩 토픽 분류 109
〈표 4-10〉 마스크팩 토픽 분류 세분화 112
〈표 4-11〉 선크립 토픽 분류 114
〈표 4-12〉 선크림 토픽 분류 세분화 116
〈표 4-13〉 스킨케어 토픽 분류 118
〈표 4-14〉 스킨케어 토픽 분류 세분화 120
〈표 4-15〉 클린징 긍정·부정 단어 회귀계수 124
〈표 4-16〉 스킨케어 긍정·부정 단어 회귀계수 125
〈표 4-17〉 선크림 긍정·부정 단어 회귀계수 126
〈표 4-18〉 마스크 긍정·부정 단어 회귀계수 127
〈표 4-19〉 가격 리뷰 데이터 ANOVA 분석 결과 128
〈표 4-20〉 가격 리뷰 데이터 Turkey 분석 결과 129
〈표 4-21〉 향기 리뷰 데이터 ANOVA 분석 결과 130
〈표 4-22〉 향기 리뷰 데이터 Turkey 분석 결과 130
〈표 4-23〉 성분 리뷰 데이터 ANOVA 분석 결과 131
〈표 4-24〉 성분 리뷰 데이터 Turkey 분석 결과 132
〈표 4-25〉 용량 리뷰 데이터 ANOVA 분석 결과 132
〈표 4-26〉 용량 리뷰 데이터 Turkey 분석 결과 133
〈표 4-27〉 브랜드 리뷰 데이터 ANOVA 분석 결과 133
〈표 4-28〉 브랜드 리뷰 데이터 Turkey 분석 결과 134
〈표 4-29〉 가격 리뷰의 감성극성값에 따른 평점 만족도의 영향 136
〈표 4-30〉 브랜드 리뷰의 감성극성값에 따른 평점 만족도의 영향 137
〈표 4-31〉 성분 리뷰의 감성극성값에 따른 평점 만족도의 영향 138
〈표 4-32〉 용량 리뷰의 감성극성값에 따른 평점 만족도의 영향 139
〈표 4-33〉 향기 리뷰의 감성극성값에 따른 평점 만족도의 영향 140
〈표 4-34〉 전체 리뷰의 감성극성값에 따른 평점 만족도의 영향 141
〈표 4-35〉 전체 리뷰의 감성극성값에 따른 평점 만족도의 영향 142
〈표 4-36〉 전체 리뷰의 감성극성값에 따른 평점 만족도의 영향 144
〈표 4-36〉 특정/전체 리뷰에 따른 결정계수, 예측 N배 정보 145
〈그림 1-1〉 연구 프로세스 27
〈그림 1-2〉 연구 구성 29
〈그림 2-1〉 LDA (Latent Dirichlet Allocation) 문서 생성과정 62
〈그림 2-2〉 LDA (Latent Dirichlet Allocation) 확률적 토픽 추출 예시 63
〈그림 3-1〉 대상 사이트 화면 75
〈그림 3-2〉 OLIVEYOUNG 텍스트 리뷰와 평점 화면 77
〈그림 3-3〉 OLIVEYOUNG 리뷰 및 정보 입력 화면 78
〈그림 3-4〉 OLIVEYOUNG에서 수집 가능한 데이터 79
〈그림 3-5〉 OLIVEYOUNG에서 추출한 리뷰 데이터 예시 80
〈그림 3-6〉 리뷰 데이터 전처리 과정 84
〈그림 3-7〉 Tf-idf 적용을 위해 각 토큰을 문자열 84
〈그림 3-8〉 형태소를 맵핑한 결과 예시 85
〈그림 3-9〉 coherence score 추출 86
〈그림 4-1〉 마스크팩 빈도수 Wordcloud 시각화 90
〈그림 4-2〉 선크림 빈도수 Wordcloud 시각화 92
〈그림 4-3〉 스킨케어 빈도수 Wordcloud 시각화 95
〈그림 4-4〉 클린징 빈도수 Wordcloud 시각화 97
〈그림 4-5〉 기초 화장품 Coherence Score 104
〈그림 4-6〉 클린징 제품 LDA 시각화 106
〈그림 4-7〉 마스크팩 제품 LDA 시각화 111
〈그림 4-8〉 선크림 제품 LDA 시각화 115
〈그림 4-9〉 스킨케어 제품 LDA 시각화 119