4차 산업혁명의 발달과 함께 사람들의 미(美)에 대한 욕구가 증가함에 따라 온라인 화장품 구매는 일반인들의 일상(日常)이 되었으며, 사람들은 온라인을 통해 언제 어디서나 쇼핑 리뷰를 공유할 수 있는 시대에 살고 있다. 특히 2019년 말에 시작된 COVID-19로 인해 사람들의 쇼핑 방법이 오프라인에서 온라인으로 점차 바뀌었으며, 화장품을 구매하려는 고객에게는 특히 다른 고객들의 쇼핑 후기가 중요하게 생각되어지고 있다.
고객들의 쇼핑 리뷰는 다른 고객이 제품을 선택하는 데 도움이 될 뿐만 아니라 고객들의 쇼핑 리뷰의 진실성은 기업이 제품의 장단점을 더 잘 이해하는 데 도움이 될 수 있다. 따라서 어떤 산업이든 고객들의 쇼핑 리뷰를 파악하는 것은 회사의 제품 및 서비스 개선을 위해 특히 중요하다.
본 연구에서는 텍스트 마이닝을 활용하여 기초 화장품 유형별 선택속성의 차이를 비교하였고, 감성분석을 통한 제품 유형별의 만족·불만족 요인을 분석하였다. 또한, 기존의 연구들에서는 LDA 토픽 분석을 통해서 토픽 개수 및 주제만 정하였으나, 본 연구에서는 분류된 토픽 주제 및 연관도 높은 키워드를 분석하여 토픽 주제를 세분화하였고 그 세분화 결과 중 나타난 요소를 통해서 고객이 제품에 대한 사용감을 더 자세히 알 수 있고, 이해하기 힘든 화장품 성분 요소를 자세히 설명하였고, 제품들이 고객들한테 인기 얻은 이유, 제품 만들 때 고려해야 할 성분, 디자인, 성분을 잘 못 표시하는 제품, 홍보 마케팅 이유 등을 제시하였다.
실무적으로도 기초 화장품 제조사의 입장에서 고객이 언급한 핵심키워드가 실제로 만족하여 제품을 선택하는지, 불만족해서 평점을 낮게 하는지 구분하여 고객을 만족시키기 위한 전략 수립에 기여할 것을 기대해볼 수 있다.
또한 본 연구에서는 기존의 설문지를 통한 정량적 분석과는 다르게 고객 온라인 리뷰의 비정형데이터 분석을 통하여 기초 화장품 키워드를 분석하여 고객들의 생각을 더 심층적으로 분석하였다.
연구결과를 요약하면 다음과 같다.
첫째, 한국어 자연어처리는 Python의 Mecab 형태소 분석기를 활용하여 데이터 전처리 과정을 진행하였다.
둘째, 키워드 빈도분석과 어휘빈도-문서역빈도(TF-IDF) 분석을 이용하여 기초 화장품 유형별 핵심 키워드 추출하였으며, 이를 통해서 고객은 어떤 요인을 중요시하는지를 파악해 보았다.
셋째, 토픽모델링 LDA(Latent Dirichlet allocation)기법을 활용하여 기초 화장품 리뷰 문장을 선택속성별로 분류하였고 토픽 세분화 분석을 진행하였다.
넷째, 수집한 리뷰를 감성분석 통하여 데이터를 분류하고 고객의 만족·불만족 요인을 파악하였다.
다섯째, 가격, 용량, 향기, 브랜드, 성분 선택속성 감성극성값이 기초 화장품 유형별로 차이가 있는지 분석하였고 기초 화장품 유형별 간의 각 선택속성별 감성극성값이 차이가 있는지도 분석하였다.
ANOVA로 분석한 결과는 선택속성 중 브랜드와 가격, 용량, 향기, 성분등 모든 선택속성은 감성극성값과 유의한 차이가 나타났다.
여섯째, 기초 화장품 선택속성 감성극성값은 만족도에 영향을 미치는지 선형회귀분석 및 다중선형회귀분석을 실시하여 검증한 결과 가격, 용량, 향기, 브랜드, 성분등은 고객만족의 유의한 정(+)의 영향을 미치는 것을 확인할 수 있었다. 하지만 다중선형회귀분석은 브랜드, 성분, 용량, 향이 높을수록 평점 만족도를 감소하는 경향을 띠며 특히, 용량의 경우 가장 크게 감소시키는 특성을 지닌다는 분석결과가 나왔다.
본 연구에서는 감성분석을 활용하여 기초 화장품 온라인 리뷰를 분석하여 고객의 감성과 고객들 만족·불만족요인 파악하였고, 그 감성의 전체평점 간의 연관성도 분석하여, 화장품 기업에게 중요한 정보가 될 수 있음을 알 수 있었다. 특히 본 연구는 선행연구에 없는 LDA 토픽세분화 분석을 통해 화장품 기업들에게 제품제조 및 효과적인 마케팅 전략 수립과 관련하여 유용한 정보를 제공할 수 있다는 점에서 의의를 갖는다.
또한, 요즘 화장품분야 전문리뷰분석기가 출시되었는데 이런 분석기는 트랜드 추이의 목표분석에 더 효과적이라는 특징이 있는 반면, 본 연구에서는 토픽에 대한 세분화 및 소비자리뷰에 대한 감성분석을 하는 것이 목표라는 큰 차이점이 있다.