목차

표제지

논문 개요

목차

I. 서론 10

1. 연구 배경 및 목적 10

2. 논문 구성 11

II. 한국어 악성댓글 분류 13

1. 악성댓글 분류 연구 13

2. 악성댓글 데이터셋 14

III. 한국어 자연어처리 모델 18

1. Transformer 18

2. BERT 모델 19

3. ELECTRA 모델 21

4. GPT Model 22

IV. 악성댓글 분류 모델 설계 24

1. Ordinal Regression 24

2. CORAL 25

3. CORN 27

V. 실험 결과 30

1. 실험 환경 30

2. 실험 모델 구성 34

1) 데이터 전처리 34

2) 실험 모델 구성 34

3. 혐오 발언 분류 결과 37

1) 기본 분류 모형 성능 37

2) CORAL 분류 모형 성능 38

3) CORN 분류 모형 성능 39

4) KOCO-hate Test 분류 성능 39

VI. 결론 및 향후 연구 41

참고 문헌 44

ABSTRACT 47

[표 1] KOCO 데이터셋 예시 15

[표 2] KOCO-hate 데이터셋 구성 16

[표 3] KOCO-bias 데이터셋 구성 17

[표 4] 실험 환경 30

[표 5] 이진 분류 오차 행렬 32

[표 6] 모델별 데이터 전처리 설정 34

[표 7] 기본 분류 모형의 KOCO-hate 분류성능 38

[표 8] CORAL 모형의 KOCO-hate 분류성능 38

[표 9] CORN 분류 모형의 KOCO-hate 분류 성능 39

[표 10] 모델별 KOCO-hate test 데이터 분류 성능 40

[그림 1] Transformer 모델 구조도 18

[그림 2] BERT Classificaion 모델 구조도 20

[그림 3] ELECTRA 모델 구조도 21

[그림 4] GPT 모델 구조도 23

[그림 5] Ordinal Regression 모형 구조도 24

[그림 6] CORAL 프레임워크 구조 27

[그림 7] CORN 프레임워크 구조 29

[그림 8] 기본 분류 모형 구조도 35

[그림 9] CORAL 분류 모형 구조도 36

[그림 10] CORN 분류 모형 구조도 37