표제지
요약
목차
I. 서론 13
II. 관련 연구 15
2.1. 웹2.0과 태그 기반 시스템 15
2.1.1. 태그의 정의 16
2.1.2. 태깅 작업의 필요성 18
2.1.3. 웹2.0과 태그 기반 사이트 18
2.2. 태그 관련 연구 23
2.2.1. 태그 구름과 시각적 표현 24
2.2.2. 협업 태깅과 자동 태깅 27
2.2.3. 연관 태그 추출에 관한 연구 31
2.2.4. 온톨로지와 태깅의 통합 32
2.2.5. 소셜 태깅과 폭소노미 35
2.3. 태그 클러스터링 38
2.3.1. 클러스터링의 개념 및 필요성 38
2.3.2. 태그 클러스터링 기법 39
2.4. 태그 기반 검색 46
2.4.1. 태그 기반 검색 시스템 49
2.4.2. 태그 기반 검색 시스템의 한계 및 개선 방안 53
III. 다중 태그 기반 검색 시스템 54
3.1. 제안 시스템의 구조 54
3.2. 샘플 데이터의 수집 56
3.3. 태그 클러스터링 시스템 57
3.3.1. 가중치 매트릭스의 생성 58
3.3.2. 태그 클러스터링 알고리즘 60
3.4. 다중 태그 검색 시스템 62
3.4.1. 2-태그 검색 63
3.4.2. 3-태그 검색 67
3.4.3. 3-2 혼합 태그 검색 68
IV. 구현 및 평가 72
4.1. 시스템 환경 72
4.2. 실험 데이터의 수집 73
4.3. 태그 클러스터링 시스템의 구현 74
4.3.1. 가중치 매트릭스의 생성 결과 74
4.3.2. 클러스터 생성을 위한 실험 및 분석 75
4.4. 콘텐츠 검색 시스템의 구현 81
4.4.1. 2-태그 추출 81
4.4.2. 3-태그 추출 85
4.4.3. 3-2 혼합 태그 추출 89
4.5. 시스템 비교평가 93
V. 결론 및 향후 연구과제 106
참고문헌 108
ABSTRACT 117
표 2.1. 유형별 국내.외 웹2.0 사이트 19
표 4.1. 구현 및 실험 환경 72
표 4.2. 클러스터 1의 2-태그 추출 결과 82
표 4.3. 클러스터 1의 3-태그 추출 결과 86
표 4.4. 클러스터 1의 3-2 혼합 태그 추출 결과 90
표 4.5. 평가 태그 94
표 4.6. 표 4.5의 평가 태그를 제안 시스템에 적용한 결과 95
표 4.7. 키워드 및 검색 방법별 정확도 및 재현율 103
그림 2.1. 태깅의 예 16
그림 2.2. 태그들 간의 하이퍼링크 예 17
그림 2.3. Flickr의 태그 구름 24
그림 2.4. Yahoo의 tagline 서비스 26
그림 2.5. 확장된 태그 시각화의 예 27
그림 2.6. 협업 태깅 28
그림 2.7. 태그 간 동시출현 관계의 시각화 30
그림 2.8. 분류를 하는 인지적인 부담 34
그림 2.9. 태깅으로 인지적 부담을 경감시키는 과정 34
그림 2.10. 폭소노미의 동적인 특징 36
그림 2.11. 한 콘텐츠에 태깅된 태그별 빈도수 38
그림 2.12. CAST 알고리즘 41
그림 2.13. K-평균군집화 알고리즘 42
그림 2.14. Fuzzy C-means 알고리즘 43
그림 2.15. QT 클러스터링 알고리즘 45
그림 2.16. 계층적 클러스터링 알고리즘 46
그림 2.17. taxonomy와 folksonomy를 표현하는 Buzzillions 49
그림 3.1. 다중 태그 검색 시스템 구성도 55
그림 3.2. 키워드 'school'을 통해 추출된 상위 12개의 이미지 56
그림 3.3. 이미지에 태깅된 77개의 태그 57
그림 3.4. 연관 태그 맵핑 과정 58
그림 3.5. 빈도수 추출 및 가중치 매트릭스의 생성 과정 59
그림 3.6. 클러스터링 알고리즘 61
그림 3.7. 클러스터링 알고리즘의 진행 과정 62
그림 3.8. smartphone으로 검색한 태그 그래프의 예 63
그림 3.9. 클러스터 2의 연관 태그 그래프 64
그림 3.10. 2-태그 기반 검색 알고리즘 65
그림 3.11. 2-태그 기반 검색 과정 66
그림 3.12. 3-태그 기반 검색 알고리즘 67
그림 3.13. 3-태그 기반 검색 과정 68
그림 3.14. 3-2 혼합 태그 검색 알고리즘 70
그림 3.15. 3-2 혼합 태그 기반 검색 과정 71
그림 4.1. 수집된 실험 데이터 73
그림 4.2. 연관 태그 맵핑을 통해 생성된 태그 74
그림 4.3. 생성된 가중치 매트릭스 중 일부 75
그림 4.4. θ값에 따른 클러스터 및 태그 수 76
그림 4.5. θ값에 따른 클러스터 내 태그 수 평균 77
그림 4.6. θ값에 따른 클러스터별 응집도 77
그림 4.7. θ값에 따른 전체 클러스터의 응집도 평균 78
그림 4.8. θ=9 적용을 통해 생성된 클러스터 1 79
그림 4.9. θ=9 적용을 통해 생성된 클러스터 2 80
그림 4.10. θ=9 적용을 통해 생성된 클러스터 3 80
그림 4.11. 클러스터 1의 2-태그 검색 결과 83
그림 4.12. 클러스터 2의 2-태그 검색 결과 84
그림 4.13. 클러스터 3의 2-태그 검색 결과 84
그림 4.14. 클러스터 1의 3-태그 검색 결과 87
그림 4.15. 클러스터 2의 3-태그 검색 결과 88
그림 4.16. 클러스터 3의 3-태그 검색 결과 88
그림 4.17. 클러스터 1의 3-2 혼합 태그 검색 결과 91
그림 4.18. 클러스터 2의 3-2 혼합 태그 검색 결과 92
그림 4.19. 클러스터 3의 3-2 혼합 태그 검색 결과 92
그림 4.20. 키워드 computer의 평가 결과 96
그림 4.21. fruit 관점에서의 apple 평가 결과 99
그림 4.22. company 관점에서의 apple 평가 결과 100
그림 4.23. animal 관점에서의 jaguar 평가 결과 101
그림 4.24. car 관점에서의 jaguar 평가 결과 102
그림 4.25. 검색 방법별 정확도와 재현율 평균 105