표제지 1
제출문 5
국문 초록 7
목차 9
제1장 서론 13
1. 사업의 목적 14
2. 사업의 범위 15
2.1. 맞춤법 교정 지침 수립 15
2.2. 개인정보 및 부적절한 표현 등에 대한 처리 방안 제시 15
2.3. 맞춤법 교정 병렬 말뭉치 구축 16
제2장 맞춤법 교정 말뭉치의 구축 18
1. 맞춤법 교정 말뭉치의 유형과 특성 20
1.1. 교정 대상 말뭉치의 유형과 특성 20
1.2. 맞춤법 교정 말뭉치의 구축 방향 20
2. 맞춤법 교정 말뭉치의 구축 단계 21
2.1. 맞춤법 교정용 말뭉치 변환 22
2.2. 자동 교정 및 후처리 23
2.3. 작업자 교육 25
2.4. 수작업 전수 교정 28
2.5. 개인정보와 부적절한 표현의 비식별화 33
2.6. 품질 검수 34
2.7. 최종 결과물 산출 36
2.8. 결과물 납품 39
제3장 교정 말뭉치 교정 지침 수립 40
1. 기본 지침과 지침 연구 42
1.1. 기본 지침 42
1.2. 지침 연구 43
2. 맞춤법 교정 말뭉치 교정 지침 45
제4장 결론 88
결론 90
참고문헌 92
Abstract 95
판권기 99
뒷표지 100
〈표 1〉 교정 대상 말뭉치의 유형과 규모 20
〈표 2〉 맞춤법 자동 교정 도구 성능 비교 24
〈표 3〉 맞춤법 검사기로 과교정 또는 오교정된 예 25
〈표 4〉 맞춤법 교정 말뭉치의 JSON 형식 기본 구조 38
〈표 5〉 메신저 맞춤법 교정 말뭉치의 JSON 양식 39
〈표 6〉 교정 단계와 단계별 교정 내용 48
〈표 7〉 널리 통용되는 비규범 표기에 대한 규범형 목록 82
〈그림 1〉 맞춤법 교정 말뭉치 구축 단계 22
〈그림 2〉 메신저 원시 말뭉치(좌)와 웹 원시 말뭉치(우)의 JSON 구조 23
〈그림 3〉 구글 문서로 공유한 교정 지침 예시 26
〈그림 4〉 작업자 대상 1차 교육 자료 일부(좌)와 Kronoth 작업 도구 사용 방법 안내 영상(우) 26
〈그림 5〉 작업자 대상 2차 교육 자료 일부 27
〈그림 6〉 검토자의 피드백 예시 27
〈그림 7〉 질의응답용 구글 시트 예시 28
〈그림 8〉 Kronoth(v1.0) 작업 화면 29
〈그림 9〉 Kronoth의 작업 현황 관리 화면 31
〈그림 10〉 Kronoth의 작업자별 작업 현황 31
〈그림 11〉 Kronoth의 전체 현황 통계 화면 32
〈그림 12〉 엑셀(Excel)을 이용한 작업자 화면 33
〈그림 13〉 엑셀(Excel)을 이용한 작업자 화면 33
〈그림 14〉 고빈도 통용 방언 검색 예시 72
〈그림 15〉 비교정 대상 구어체 방언형 수집 구글 시트 73
〈그림 16〉 방언:표준어 대응쌍 수집 구글 시트 예시 73
〈그림 17〉 웹 말뭉치 원 문장:교정 문장 예시 80
〈그림 18〉 외래어/외국어 관련 원 문장:교정 문장 예시 82
〈그림 19〉 기호, 문장부호 관련 원 문장:교정 문장 예시 84