표제지
목차
요약문 10
제1장 서론 17
제1절 연구의 필요성 및 목적 17
1. 연구의 필요성 17
2. 연구내용 21
제2장 추천시스템 알고리즘의 현황 및 문제점 22
제1절 알고리즘 기반의 추천시스템 22
1. 알고리즘 기반 추천시스템의 개념 22
2. 알고리즘 기반 추천시스템의 사용 현황 24
제2절 추천시스템의 공정성 개념과 탐지방법 36
1. 추천시스템 공정성의 개념 36
2. 추천시스템 공정성 기존 연구 41
3. 공정성 탐지 노력의 예: 순위의 공정성(fair ranking) 44
4. 추천시스템 공정성 탐지방법 48
5. 추천시스템 공정성 평가에 대한 기존 접근 55
제3장 추천시스템 공정성 확보를 위한 정책 및 제도적 논의 60
제1절 개발단계에서의 투명성 확보 방안 60
1. 개발자를 위한 오픈소스 툴킷 60
제2절 자율규제활동과 공정성 66
1. 기업차원의 자율활동 66
2. 정부차원의 제도적 활동 73
3. 알고리즘 영향성 평가 77
제4장 시뮬레이션 기반 실험방법론의 적용과 공정성 평가 80
제1절 추천시스템 공정성 관련 선행 실험 80
1. (주요연구1) Gajane, P. and Pechenizkiy, M.(2018) 연구 81
2. (주요연구2) Yao, S. and Huang, B(2017) 연구 82
3. (주요연구3) Tsintzou, V 외 (2018) 연구 82
4. (주요연구4) Mansoury, M. 외 (2019) 연구 83
제2절 추천시스템 공정성 실험설계와 절차 84
1. 연구문제 및 연구방법 84
제3절 실험결과와 함의 86
1. 정의 및 모델 86
2. 가상의 데이터를 이용한 편향성 차이 실험 결과 89
3. 데이터 증대 방법을 통한 편향성 보정 94
4. 결과 및 함의 104
제5장 추천시스템 공정성을 평가 및 보정 방법론에 대한 전문가의견 106
제1절 전문가 조사 방법 및 연구문제 106
1. 전문가 심층조사 목적 106
2. 연구문제 107
3. 연구방법 107
제2절 전문가 조사 결과 108
1. (연구문제1: 개념적 접근) 알고리즘 공정성에 관한 보편적 정의가 가능한가? 108
2. (연구문제2: 방법론적 접근) 알고리즘 공정성을 분석하기 위한 가장 적합한 분석방법은 무엇인가? 112
3. (연구문제3: 제도적 접근) 알고리즘 공정성 보장방안을 위한 영향성 평가 제도가 필요한가? 115
4. 추가적인 전문가의견 119
제6장 결론 및 제언 123
제1절 주요 연구요약 123
1. 추천시스템 알고리즘의 현황 및 문제점 123
2. 추천시스템 공정성 확보를 위한 정책 제도적 방향 125
3. 추천시스템 공정성 보정을 위한 시뮬레이션 기반 실험 127
4. 추천시스템 공정성을 평가 및 보정 방법론에 대한 전문가의견 128
제2절 제언 129
1. 추천시스템 공정성 보정을 위한 방법론적 제언 129
2. 추천시스템의 공정성 보정을 위한 정책적 제언 131
참고문헌 135
[부록] 추천시스템의 편향보정 및 공정성 보장방안 연구 139
판권기 144
〈표 2-1〉 대표적인 추천시스템에서의 공정성 문제 30
〈표 2-2〉 편향 개념 40
〈표 2-3〉 각 성별 구분 알고리즘의 피부색과 성별에 따른 인식률 (eg., DF=Darker Female) 54
〈표 4-1〉 실제 데이터에 대한 User-KNN(위)과 SVD(아래)의 편향성 차이 100
〈표 4-2〉 실제 데이터를 이용한 User-KNN(위)와 SVD(아래)과 우리가 제안한 4가지 방법을 적용한 추천시스템의 편향성 차이 비교 101
〈표 5-1〉 전문가 조사 리스트 107
〈표 5-2〉 개념적 측면 전문가 의견 111
〈표 5-3〉 방법론적 측면 전문가 의견 115
〈표 5-4〉 제도적 측면 영향성 평가제도에 대한 전문가 의견 119
[그림 2-1] UserKNN과 GULM 43
[그림 2-2] TREC 2020 Fair Ranking Track 47
[그림 2-3] 닌넨버스와 윌렘센(2015)의 이용자 중심 평가 모델 49
[그림 2-4] 대규모 온라인 통제실험방법 50
[그림 2-5] COMPASS에 의한 백인과 흑인의 위험평가 점수분포 51
[그림 2-6] COMPASS의 스코어에 따른 인종별 재범확률 52
[그림 2-7] 인물 데이터세트별 표본의 성별 및 피부색 54
[그림 2-8] 커뮤니티와 미디어 채널에 대한 활동량 증가 57
[그림 2-9] 사용자 교차점 분석 57
[그림 2-10] 사용자의 콘텐츠 이동양상 58
[그림 2-11] 채널과 영상에 대한 임의 행로(random-walks)시뮬레이션 결과 58
[그림 3-1] 〈AI Fairness 360〉의 AI 모델 사이클 전반에 대한 툴킷 작동원리 62
[그림 3-2] 〈what-if〉 공정성 툴킷의 시각화 기능 63
[그림 3-3] 〈LiFT〉의 공정성 측정 프레임워크 플로우 차트 64
[그림 3-4] 캐나다의 알고리즘 영향성 평가(Algorithmic Impact Assessment) 79
[그림 4-1] 사용자의 선호도에 대한 추천 결과물 선호도 90
[그림 4-2] 비대칭적 선호도를 가지는 경우, 두 집단의 사용자 선호도에 따른 추천 결과물 선호도 92
[그림 4-3] 두 집단의 크기 비율에 따른 추천 결과물 선호도 93
[그림 4-4] 두 카테고리의 크기 비율에 따른 추천 결과물 선호도 94
[그림 4-5] 데이터 증대 방법을 통한 추천알고리즘(User-KNN알고리즘)의 결과물 선호도 보정결과 97
[그림 4-6] 데이터 증대방법을 통한 추천알고리즘(SVD알고리즘)의 결과물 선호도 보정 결과 98
[그림 4-7] 실제 데이터 사용자 집단 비율을 조절한 데이터 SVD 추천알고리즘 이용한 편향성 차이 102
[그림 4-8] 실제 데이터 사용자 집단 비율을 조절한 데이터 User-KNN 편향성 차이 결과 103