표제지
국문초록
목차
제1장 서론 8
제2장 관련 연구 11
제3장 자료 수집 14
3.1. 온라인 댓글 수집 14
3.2. 크라우드소싱을 위한 소스데이터 구축 15
3.3. 크라우드소싱을 통한 고정관념 평정 자료 수집 18
3.4. 고정관념 평정 자료 병합 19
제4장 연구 1: 고정관념 범주화 21
4.1. 고정관념 대상 응답 임베딩 21
4.2. 클러스터링: 가우시안 혼합 모형 25
4.3. 토픽모델링: BERTopic 28
4.4. 결과 29
제5장 연구 2: 고정관념 범주의 특성 51
5.1. 고정관념 대범주 간 유사도 51
5.2. 고정관념 범주의 조합 52
5.3. 부정적이지 않은 고정관념 53
제6장 논의 및 결론 56
참고문헌 59
Abstract 61
[표 1] 토큰화 결과 및 NLI 형식의 데이터 예시 24
[표 2] 고정관념 대범주와 소범주 41
[표 3] 사건/사고 대범주 내 소범주별 키워드와 예시문장 42
[표 4] 산업/직업 대범주 내 소범주별 키워드와 예시문장 43
[표 5] 국제사회 대범주 내 소범주별 키워드와 예시문장 44
[표 6] 지역 대범주 내 소범주별 키워드와 예시문장 46
[표 7] 대인관계 대범주 내 소범주별 키워드와 예시문장 46
[표 8] 인터넷 사이트 대범주 내 소범주별 키워드와 예시문장 47
[표 9] 연령 대범주 내 소범주별 키워드와 예시문장 48
[표 10] 정치이념 대범주 내 소범주별 키워드와 예시문장 48
[표 11] 엔터테인먼트 산업 대범주 내 소범주별 키워드와 예시문장 49
[표 12] 종교/사상 대범주 내 소범주별 키워드와 예시문장 49
[표 13] KOTE의 44개 정서 통합 54
[표 14] 부정적이지 않은 고정관념 예시 문장 55
[그림 1] 범주화 분석 순서도 13
[그림 2] 고정관념 유무와 심리적 거리감의 가중치 합 분포 20
[그림 3] 각 attention head의 문장구조 추출방식 21
[그림 4] 임베딩 결과 시각화(위: 미세조정 모델, 아래: 기본 모델) 25
[그림 5] 가우시안 혼합 모형 BIC, AIC, Silhouette Score 27
[그림 6] 가우시안 혼합 모형 결과 클러스터 시각화 28
[그림 7] 가우시안 혼합 모형의 클러스터별 BERTopic 결과 36
[그림 8] 10개(기타 범주 제외)의 고정관념 범주 간 유사도 51
[그림 9] 고정관념 대상 범주별 부정적 문장과 부정적이지 않은 문장 54