목차

목차

Abstract 1

Ⅰ. 서론 1

Ⅱ. 알고리즘 4

1. Natural Language Understanding: DialogBERT 5

2. Retrieval Part: Response Candidates 8

3. Ranker Part: Response Selection 9

Ⅲ. 데이터 11

1. 데이터 수집 11

2. 수집된 실 데이터의 Github 공유 12

Ⅳ/Ⅵ. 학습 과정과 적대성 공격(Adversarial Attack) 12

1. 마이크로소프트社 AI챗봇 'Tay'와 중독 공격(Poisoning attack) 13

2. 스캐터랩社 AI챗봇 '이루다'와 학습 데이터 추출 공격(Model Inversion Attack) 14

Ⅴ. 결론 16

참고문헌 17

그림 1. AI챗봇 '이루다'에 대한 소개 2

그림 2. AI챗봇 '이루다'의 알고리즘 5

그림 3. BERT에서 사전학습-재학습(pre-training and fine-tuning procedures for BERT) 6

그림 4. DialogBERT 7

그림 5. query-reply paired data의 예시(턴 인지 후 10턴의 답변) 9

그림 6. 평가지표 SSA의 값 도출에 대한 예시 10

그림 7. 평가지표 SSA와 Perplexity의 상관관계 10

그림 8. 연애의 과학 개인정보 취급방침 11

그림 9. 마이크로소프트社 AI챗봇 Tay의 트위터 14

그림 10. 학습 데이터 추출 공격 사례 15

그림 11. 이루다의 학습 데이터 추출 공격 사례 16