목차

국문목차

표제지=0,1,4

목차=i,5,3

그림목차=iv,8,2

표목차=vi,10,1

논문 개요=vii,11,2

I. 서론=1,13,1

1.1 연구 배경=1,13,3

1.1.1 연구목적 및 내용=3,15,5

1.1.2 논문의 구성=8,20,1

1.2 문서 분류의 연구 동향=9,21,5

1.3 웹 기반 이메일 시스템=13,25,4

II. 관련 연구=17,29,1

2.1 이메일 문서분류를 위한 전처리 방법=17,29,1

2.1.1 자동분류를 위한 일반적 방법=17,29,2

2.1.2 이메일 문서의 전처리 설계=18,30,3

2.2 문서 분류의 규칙 생성을 위한 특징 추출=20,32,3

2.2.1 문서 빈도(DF, Document Frequency)에 의한 수치벡터 축약=22,34,2

2.2.2 정보 이득(IG, Information Gain)에 의한 수치벡터 축약=23,35,1

2.2.3 상호 정보량(MI, Mutual Information)에 의한 수치벡터 축약=23,35,2

2.2.4 X²통계(X²-Statistics)에 의한 수치벡터 축약=24,36,2

2.2.5 수치벡터 축약을 위한 기타 방법=25,37,2

2.3 문서 추천을 위한 정보 필터링 알고리즘=26,38,1

2.3.1 내용기반 필터링과 사회기반 필터링 알고리즘=26,38,4

2.3.2 웹 문서 분류 시스템 연구 사례=29,41,3

2.4 베이지안 알고리즘을 적용한 필터링의 특징=32,44,1

2.5 문서 분류를 위한 Naive Bayes 알고리즘=33,45,3

III. 이메일 문서 분류를 위한 전처리과정 설계=36,48,1

3.1 이메일 문서 특징에 의한 가중치 부여 방법=37,49,2

3.1.1 색인어 추출을 위한 전처리 과정=39,51,2

3.1.2 속성별 가중치 부여 방법=40,52,2

3.2 불확실성 기반 샘플링 알고리즘(Uncertainty based Sampling Algorithm)=42,54,3

3.2.1 불확실성 기반 샘플링 알고리즘=44,56,5

3.3 동적 임계치(Dynamic Threshold)=48,60,4

IV. 룰 필터링 컴포넌트 설계=52,64,1

4.1 모듈별 설계(Modular Design)=52,64,2

4.1.1 WMI(Web Mail Interface Module)=53,65,2

4.1.2 CRG(Category Rule Generation Module)=54,66,3

4.1.3 MCR(Mail Classification＆Recommendation) Module=56,68,2

4.1.4 특징 추출 알고리즘=57,69,4

4.2 CBD(Component_Based Development)=60,72,3

4.2.1 룰 필터링 컴포넌트의 세부 구성=62,74,4

V. 개인화된 추천 에이전트 시스템 설계 및 구현(Personalized Recommendation Agent System)=66,78,1

5.1 개인화된 추천 에이전트 시스템(PRAS:Personalized Recommendation Agent System)의 특징=67,79,5

5.2 시스템 구현 및 평가=71,83,3

5.2.1 웹 기반 메일 시스템 구축=73,85,2

5.2.2 사용자 인터페이스=74,86,3

5.2.3 DB의 구현=76,88,3

5.3 가상 메일시스템 기반 시스템 성능 시뮬레이션=78,90,6

VI. 실험 및 결과 분석=84,96,1

6.1 성능 평가 기준=84,96,3

6.2 문서 분류의 실험 설계=86,98,3

6.3 실험 및 결과 분석=89,101,9

VII. 결론 및 향후 연구 과제=98,110,1

7.1 결론=98,110,3

7.2 향후 연구 과제=101,113,2

참고문헌=103,115,6

ABSTRACT=109,121,3

감사의 글=112,124,2

그림1.1 PRAS를 이용한 사용자의 편리한 메일관리시스템=2,14,1

그림1.2 이메일 문서 분류를 위한 응용시스템의 단계별 구성도=6,18,1

그림1.3 이메일 시스템의 일반적인 구조=15,27,1

그림2.1 문서 분류 시스템의 구성도=19,31,1

그림2.2 특징 추출의 계통도(taxonomy)=21,33,1

그림3.1 반구조적인 이메일 문서의 특징을 이용한 가중치 부여=37,49,1

그림3.2 정형화된 색인어 추출을 위한 전처리=39,51,1

그림3.3 카테고리 분류를 위한 샘플링 문서=43,55,1

그림3.4 불확실성 기반 샘플링 알고리즘=44,56,1

그림3.5 불확실성 기반 샘플링 알고리즘 적용=48,60,1

그림4.1 WMI 모듈 구조도=54,66,1

그림4.2 CRG(Category Rule Generation) 모듈 구조도=55,67,1

그림4.3 CRG 모듈 알고리즘=56,68,1

그림4.4 MCR(Mail Classification＆Recommendation) 모듈 구조도=57,69,1

그림4.5 특징 추출 알고리즘=59,71,1

그림4.6 Approach of Feature Extraction=60,72,1

그림4.7 Component_Based Development 개념도=61,73,1

그림4.8 모듈별 설계 (WMI, CRG, MCR)=62,74,1

그림4.9 룰 필터링 컴포넌트(인터페이스, 메소드)=64,76,1

그림4.10 컴포넌트의 각 모듈별 기능의 메소드=65,77,1

그림5.1 에이전트(agent)의 개념=68,80,1

그림5.2 PRAS의 전체적인 흐름도=69,81,1

그림5.3 오분류의 계통도(A taxonomy of misclassification)=71,83,1

그림5.4 사용자측면에서 PRAS를 이용하는 절차=72,84,1

그림5.5 PRAS의 로그인 화면=74,86,1

그림5.6 PRAS 사용자 인터페이스=74,86,1

그림5.7 PRAS의 메시지 카테고리 모듈=75,87,1

그림5.8 DB 테이블=76,88,1

그림5.9 추천 카테고리=77,89,1

그림5.10 추천 카테고리(룰필터링기반)=78,90,1

그림5.11 테스트를 위한 데이터 포맷=80,92,1

그림5.12 실제 테스트용 메일 데이터=81,93,1

그림5.13 Filecheck 기능을 이용한 실험=82,94,1

그림5.14 FileCheck 결과 화면=82,94,1

그림6.1 단계별 전처리 알고리즘 적용도=91,103,1

그림6.2 속성별 가중치 부여 전처리 알고리즘 적용=93,105,1

그림6.3 샘플링 전처리 알고리즘 적용=95,107,1

그림6.4 3단계 전처리 알고리즘 적용=96,108,1

표3.1 이메일 헤더의 구성 요소=38,50,1

표3.2 불확실성(Uncertainty) 측정치=47,59,1

표4.1 PRAS의 각 모듈별 설계=63,75,1

표5.1 구현 환경=72,84,1

표5.2 카테고리별 테스트 정확도=83,95,1

표6.1 카테고리별 테스트 정확도=88,100,1

표6.2 속성별 가중치를 이용한 전처리 알고리즘 F₁측정치=92,104,1

표6.3 샘플링 알고리즘을 적용한 전처리 알고리즘 F₁측정치=94,106,1

표6.4 전처리 알고리즘 별 F₁측정치 비교=95,107,1