국문목차
표제지=0,1,4
목차=i,5,3
그림목차=iv,8,2
표목차=vi,10,1
논문 개요=vii,11,2
I. 서론=1,13,1
1.1 연구 배경=1,13,3
1.1.1 연구목적 및 내용=3,15,5
1.1.2 논문의 구성=8,20,1
1.2 문서 분류의 연구 동향=9,21,5
1.3 웹 기반 이메일 시스템=13,25,4
II. 관련 연구=17,29,1
2.1 이메일 문서분류를 위한 전처리 방법=17,29,1
2.1.1 자동분류를 위한 일반적 방법=17,29,2
2.1.2 이메일 문서의 전처리 설계=18,30,3
2.2 문서 분류의 규칙 생성을 위한 특징 추출=20,32,3
2.2.1 문서 빈도(DF, Document Frequency)에 의한 수치벡터 축약=22,34,2
2.2.2 정보 이득(IG, Information Gain)에 의한 수치벡터 축약=23,35,1
2.2.3 상호 정보량(MI, Mutual Information)에 의한 수치벡터 축약=23,35,2
2.2.4 X²통계(X²-Statistics)에 의한 수치벡터 축약=24,36,2
2.2.5 수치벡터 축약을 위한 기타 방법=25,37,2
2.3 문서 추천을 위한 정보 필터링 알고리즘=26,38,1
2.3.1 내용기반 필터링과 사회기반 필터링 알고리즘=26,38,4
2.3.2 웹 문서 분류 시스템 연구 사례=29,41,3
2.4 베이지안 알고리즘을 적용한 필터링의 특징=32,44,1
2.5 문서 분류를 위한 Naive Bayes 알고리즘=33,45,3
III. 이메일 문서 분류를 위한 전처리과정 설계=36,48,1
3.1 이메일 문서 특징에 의한 가중치 부여 방법=37,49,2
3.1.1 색인어 추출을 위한 전처리 과정=39,51,2
3.1.2 속성별 가중치 부여 방법=40,52,2
3.2 불확실성 기반 샘플링 알고리즘(Uncertainty based Sampling Algorithm)=42,54,3
3.2.1 불확실성 기반 샘플링 알고리즘=44,56,5
3.3 동적 임계치(Dynamic Threshold)=48,60,4
IV. 룰 필터링 컴포넌트 설계=52,64,1
4.1 모듈별 설계(Modular Design)=52,64,2
4.1.1 WMI(Web Mail Interface Module)=53,65,2
4.1.2 CRG(Category Rule Generation Module)=54,66,3
4.1.3 MCR(Mail Classification&Recommendation) Module=56,68,2
4.1.4 특징 추출 알고리즘=57,69,4
4.2 CBD(Component_Based Development)=60,72,3
4.2.1 룰 필터링 컴포넌트의 세부 구성=62,74,4
V. 개인화된 추천 에이전트 시스템 설계 및 구현(Personalized Recommendation Agent System)=66,78,1
5.1 개인화된 추천 에이전트 시스템(PRAS:Personalized Recommendation Agent System)의 특징=67,79,5
5.2 시스템 구현 및 평가=71,83,3
5.2.1 웹 기반 메일 시스템 구축=73,85,2
5.2.2 사용자 인터페이스=74,86,3
5.2.3 DB의 구현=76,88,3
5.3 가상 메일시스템 기반 시스템 성능 시뮬레이션=78,90,6
VI. 실험 및 결과 분석=84,96,1
6.1 성능 평가 기준=84,96,3
6.2 문서 분류의 실험 설계=86,98,3
6.3 실험 및 결과 분석=89,101,9
VII. 결론 및 향후 연구 과제=98,110,1
7.1 결론=98,110,3
7.2 향후 연구 과제=101,113,2
참고문헌=103,115,6
ABSTRACT=109,121,3
감사의 글=112,124,2
그림1.1 PRAS를 이용한 사용자의 편리한 메일관리시스템=2,14,1
그림1.2 이메일 문서 분류를 위한 응용시스템의 단계별 구성도=6,18,1
그림1.3 이메일 시스템의 일반적인 구조=15,27,1
그림2.1 문서 분류 시스템의 구성도=19,31,1
그림2.2 특징 추출의 계통도(taxonomy)=21,33,1
그림3.1 반구조적인 이메일 문서의 특징을 이용한 가중치 부여=37,49,1
그림3.2 정형화된 색인어 추출을 위한 전처리=39,51,1
그림3.3 카테고리 분류를 위한 샘플링 문서=43,55,1
그림3.4 불확실성 기반 샘플링 알고리즘=44,56,1
그림3.5 불확실성 기반 샘플링 알고리즘 적용=48,60,1
그림4.1 WMI 모듈 구조도=54,66,1
그림4.2 CRG(Category Rule Generation) 모듈 구조도=55,67,1
그림4.3 CRG 모듈 알고리즘=56,68,1
그림4.4 MCR(Mail Classification&Recommendation) 모듈 구조도=57,69,1
그림4.5 특징 추출 알고리즘=59,71,1
그림4.6 Approach of Feature Extraction=60,72,1
그림4.7 Component_Based Development 개념도=61,73,1
그림4.8 모듈별 설계 (WMI, CRG, MCR)=62,74,1
그림4.9 룰 필터링 컴포넌트(인터페이스, 메소드)=64,76,1
그림4.10 컴포넌트의 각 모듈별 기능의 메소드=65,77,1
그림5.1 에이전트(agent)의 개념=68,80,1
그림5.2 PRAS의 전체적인 흐름도=69,81,1
그림5.3 오분류의 계통도(A taxonomy of misclassification)=71,83,1
그림5.4 사용자측면에서 PRAS를 이용하는 절차=72,84,1
그림5.5 PRAS의 로그인 화면=74,86,1
그림5.6 PRAS 사용자 인터페이스=74,86,1
그림5.7 PRAS의 메시지 카테고리 모듈=75,87,1
그림5.8 DB 테이블=76,88,1
그림5.9 추천 카테고리=77,89,1
그림5.10 추천 카테고리(룰필터링기반)=78,90,1
그림5.11 테스트를 위한 데이터 포맷=80,92,1
그림5.12 실제 테스트용 메일 데이터=81,93,1
그림5.13 Filecheck 기능을 이용한 실험=82,94,1
그림5.14 FileCheck 결과 화면=82,94,1
그림6.1 단계별 전처리 알고리즘 적용도=91,103,1
그림6.2 속성별 가중치 부여 전처리 알고리즘 적용=93,105,1
그림6.3 샘플링 전처리 알고리즘 적용=95,107,1
그림6.4 3단계 전처리 알고리즘 적용=96,108,1
표3.1 이메일 헤더의 구성 요소=38,50,1
표3.2 불확실성(Uncertainty) 측정치=47,59,1
표4.1 PRAS의 각 모듈별 설계=63,75,1
표5.1 구현 환경=72,84,1
표5.2 카테고리별 테스트 정확도=83,95,1
표6.1 카테고리별 테스트 정확도=88,100,1
표6.2 속성별 가중치를 이용한 전처리 알고리즘 F₁측정치=92,104,1
표6.3 샘플링 알고리즘을 적용한 전처리 알고리즘 F₁측정치=94,106,1
표6.4 전처리 알고리즘 별 F₁측정치 비교=95,107,1