표제지
목차
국문초록 4
제1장 연구의 개요 10
1.1. 연구의 목적 11
1.2. 연구의 대상 및 범위 13
제2장 조사 방법 19
2.1. 사회적 인식 조사를 위한 비윤리적 표현 유형 분류 기준 설정 20
2.1.1. 말뭉치 언어의 비윤리적 표현 유형 분류 기준 제시 20
2.1.2. 말뭉치 언어의 비윤리적 표현 유형 분류 기준의 타당성 확보 22
2.2. 사회적 인식 조사의 평가 절차 26
2.2.1. 사회적 인식 조사를 위한 평가자용 가이드라인 및 평가 절차 제시 26
2.2.2. 평가자 조사 수행 지침 설명 27
2.3. 사회적 인식 조사 평가 도구 자체 개발 및 적용 29
제3장 조사 진행 과정 및 내용 38
3.1. 사회적 인식 조사 평가 계획 및 일정 수립 40
3.1.1. 사회적 인식 조사 평가자 선발 40
3.1.2. 사회적 인식 조사 평가 진행 일정 수립 42
3.2. 사회적 인식 조사 평가자 모집 및 평가 가이드라인 배포 42
3.2.1. 평가자 모집 42
3.2.2. 평가자 평가 가이드라인 배포 44
3.3. 사회적 인식 조사 평가 실행 및 진행 교육 45
3.3.1. 조사 평가 실시 45
3.3.2. 조사 평가자 진행 교육 및 관리 47
3.4. 조사 현황 관리 49
3.5. 최종 조사 결과 분류 및 데이터 납품 51
제4장 조사 결과 분석 55
4.1. 평가자의 변인별 비윤리적 표현 유형 빈도 및 비율 분석 56
4.2. 말뭉치 문서 종류별 비윤리적 표현 유형 비율 분석 및 정제 수준 73
제5장 보고서 활용 방안 및 정책 제언 84
Abstract 87
참고문헌 89
판권기 91
〈표 1〉 말뭉치 언어의 사회적 인식 조사 연구 대상 문서 및 어절 14
〈표 2〉 말뭉치 언어의 사회적 인식 조사ㆍ분류 사업 범위 15
〈표 3〉 조직별 수행 내용 17
〈표 4〉 자문위원 위촉 및 활용 내역 18
〈표 5〉 비도덕적 문장 판별 모델 23
〈표 6〉 평가자 모집 일반 기준 41
〈표 7〉 평가자 모집 비율 및 현황 41
〈표 8〉 평가 진행 일정 계획표 42
〈표 9〉 평가자 재모집 사례 50
〈표 10〉 평가자 변인별 비윤리적 표현 유형 태깅 빈도 56
〈표 11〉 말뭉치 문서종류별 비윤리적 표현 유형 태깅 빈도 74
〈표 12〉 비윤리적 표현 유형 빈도에 따른 말뭉치 문서 종류별 정제 수준 분류 82
[그림 1] 과업 수행 조직 16
[그림 2] 비도덕적 문장 판별 온톨로지 24
[그림 3] 비윤리적 표현 평가 체계 26
[그림 4] 주관 기관이 제공한 JSON 원문을 파싱한 이후 평가 도구에 웹 문서로 변환한 화면 30
[그림 5] 평가 도구에서 이루어진 태깅 정보를 반영하여 생성한 산출물 예시 30
[그림 6] 관리자 기능의 평가자별 진척 상황 관리 화면 31
[그림 7] 관리자 기능의 평가 문서별 작업 상태 관리 화면 31
[그림 8] 관리자 기능의 평가자 작업 내용 확인 및 수정 화면 32
[그림 9] 평가 도구의 공지 사항과 프로젝트 개요 설명 화면 32
[그림 10] 평가 도구의 평가자 작업 현황 화면 33
[그림 11] 레이블링 진행 화면 34
[그림 12] 레이블링 선택 및 결과 반영 화면 34
[그림 13] 평가 도구 기능 개선 및 개선 사항에 대한 설명 예시 35
[그림 14] 관리자 기능의 평가자별 작업 진행률 확인 화면 36
[그림 15] 관리자 기능의 평가자 평가 내용 확인 및 수정 화면 37
[그림 16] 사업 홍보 홈페이지 43
[그림 17] 사업 소개 43
[그림 18] 사업 홍보 이벤트 43
[그림 19] 작업 독려 이벤트 43
[그림 20] 작업 가이드 배포용 사이트 44
[그림 21] 평가 도구 메인화면 45
[그림 22] 평가 도구 작업 현황 조회 화면 46
[그림 23] 평가 도구 활용 화면 1 46
[그림 24] 평가 도구 활용 화면 2 47
[그림 25] 평가자 교육 영상 캡처 화면 1 48
[그림 26] 평가자 교육 영상 캡처 화면 2 49
[그림 27] 데이터 입력과 산출물 생성 52
[그림 28] XLSX 형식 산출물 예시 53
[그림 29] 최종 산출물 JSON 형식 예시 54
[그림 30] 전체 조사 대상 발화 중 비윤리적 표현 유형별 비율 57
[그림 31] 성별에 따른 혐오 표현 태깅 비율 59
[그림 32] 성별에 따른 성적 표현 태깅 비율 59
[그림 33] 성별에 따른 욕설 표현 태깅 비율 60
[그림 34] 성별에 따른 차별 표현 태깅 비율 60
[그림 35] 성별에 따른 기타 비윤리적 표현 태깅 비율 61
[그림 36] 성별에 따른 개인정보 노출 태깅 비율 61
[그림 37] 연령대에 따른 혐오 표현 태깅 비율 62
[그림 38] 연령대에 따른 성적 표현 태깅 비율 62
[그림 39] 연령대에 따른 욕설 표현 태깅 비율 63
[그림 40] 연령대에 따른 차별 표현 태깅 비율 63
[그림 41] 연령대에 따른 기타 비윤리적 표현 태깅 비율 64
[그림 42] 연령대에 따른 개인정보 노출 태깅 비율 64
[그림 43] 지역에 따른 혐오 표현 태깅 비율 66
[그림 44] 지역에 따른 성적 표현 태깅 비율 66
[그림 45] 지역에 따른 욕설 표현 태깅 비율 67
[그림 46] 지역에 따른 차별 표현 태깅 비율 67
[그림 47] 지역에 따른 기타 비윤리적 표현 태깅 비율 68
[그림 48] 지역에 따른 개인정보 태깅 비율 68
[그림 49] 직업에 따른 혐오 표현 태깅 비율 70
[그림 50] 직업에 따른 성적 표현 태깅 비율 70
[그림 51] 직업에 따른 욕설 표현 태깅 빈도 71
[그림 52] 직업에 따른 차별 표현 태깅 비율 71
[그림 53] 직업에 따른 기타 비윤리적 표현 태깅 비율 72
[그림 54] 직업에 따른 개인정보 노출 태깅 비율 72
[그림 55] 문서 종류별 혐오 표현 태깅 분포 비율 77
[그림 56] 문서 종류별 성적 표현 태깅 분포 비율 77
[그림 57] 문서 종류별 욕설 표현 태깅 분포 비율 78
[그림 58] 문서 종류별 차별 표현 태깅 분포 비율 78
[그림 59] 문서 종류별 기타 비윤리적 표현 태깅 분포 비율 79
[그림 60] 문서 종류별 개인정보 노출 태깅 분포 비율 79