표제지
목차
논문요약 12
제1장 서론 14
1. 연구의 배경 및 목적 14
가. 연구의 배경 14
나. 연구의 목적 16
2. 연구 방법 및 논문 구성 17
가. 연구 방법 17
나. 논문 구성 18
제2장 이론적 배경 19
1. 추천 시스템(Recommender System) 19
가. 추천 시스템의 개념 19
나. 추천 시스템의 종류 19
2. 머신 러닝 모델(Machine Learning Model) 21
가. Random Forest 21
나. Extreme Gradient Boosting (XGBoost) 22
다. Light Gradient Boosting Machine (LGBM) 22
3. Target Encoding 23
4. 관련 연구 24
가. 머신 러닝 알고리즘을 이용한 추천 시스템 24
나. 관심사 변화를 반영하는 추천 시스템 24
다. OTT 서비스의 사용자 경험 개선을 위한 연구 25
제3장 연구 방법 26
1. 데이터 선정 27
가. 데이터의 특성 27
나. 데이터의 구성 28
2. 데이터 전처리 29
가. 데이터 월별 그룹화 29
나. 복수 장르의 분할 30
다. 데이터 필터링 30
3. 관심사를 반영하는 변수 개발 31
4. Target 변수 개발 34
가. 다음 달의 장르별 평균 평점 34
나. 평균 평점의 선호 여부 분류 36
5. 범주형 변수의 인코딩 38
6. 모델 학습용, 검증용 데이터셋 생성 39
7. 머신 러닝을 이용한 추천 시스템 40
제4장 연구 결과 42
1. 데이터 전처리 결과 42
가. 관심사가 변화한 사용자의 비율 42
나. Target 변수의 클래스별 데이터 개수 43
2. 평가 방법 43
가. 정확도 43
나. 적중률(hit-rate) 44
다. 다양성 44
3. 실험 환경 45
가. 하드웨어 및 소프트웨어 환경 45
나. 모델 파라미터 45
4. 실험 결과 47
가. 알고리즘의 정확도 47
나. 추천 장르 적중률(hit-rate) 48
다. 추천 장르의 다양성 49
제5장 결론 51
1. 결론 51
2. 연구적 의의 및 추후 연구 과제 53
참고문헌 56
ABSTRACT 60
[표 3-1] 데이터셋에 존재하는 장르(genre)의 종류 28
[표 3-2] 본 논문에서 사용한 MovieLens 데이터셋의 예시 29
[표 3-3] 전처리 후 데이터셋의 형태 31
[표 3-4] 본 연구에서 사용한 파생변수와 그 의미 32
[표 3-5] 61 개 변수에 대한 변수명과 의미 32
[표 3-6] 전처리 후 데이터셋 예시 33
[표 3-7] melt 함수 적용 전 데이터셋 형태 예시 36
[표 3-8] melt 함수 적용 후 데이터셋 형태 예시 36
[표 3-9] 평균 평점의 선호(like), 비선호(dislike) 분류 예시 37
[표 3-10] 변수별 각 장르의 인코딩 결과 예시 39
[표 3-11] 본 논문에서 이용한 데이터 개수 40
[표 4-1] 선호도 변화 여부에 대한 건수 및 비율 42
[표 4-2] Target 변수의 클래스별 데이터 개수 및 비율 43
[표 4-3] 하드웨어 및 소프트웨어 환경 45
[표 4-4] 알고리즘별 설정한 파라미터 46
[표 4-5] 알고리즘별 적중률(hit-rate) 표 49
[표 4-6] 알고리즘별 다양성 지표 표 50
[표 5-1] 머신러닝 모델과 아이템 기반 모델 예측 결과 비교 52
[그림 3-1] 제안하는 추천 시스템의 구현 단계 27
[그림 3-2] melt 함수 적용의 예시 35
[그림 4-1] 3 가지 알고리즘의 테스트(Test), 검증(Prediction) 정확도 47
[그림 4-2] 알고리즘별 적중률(hit-rate) 그래프 48
[그림 4-3] 알고리즘별 다양성 지표 그래프 50