Web 2.0은 서비스 제공자가 블로그, 검색, 지도, 태깅 등 다양한 기능을 제공하고 사용자들이 이를 직접 활용하는 '사용자 지향' 웹 플랫폼이다. Web 2.0 시대의 장점은 서비스 제공자들은 플랫폼만 제공하고, 사용자들은 자발적인 참여로 콘텐츠와 서비스의 정보를 만들어가는 방식이라는 것이다.
이러한 콘텐츠와 서비스를 효율적으로 검색하기 위한 방법의 하나로 태그를 이용한 방법들이 많이 사용되어지고 있다.
태깅은 현재 블로그와 같은 웹 문서에서부터 이미지, 동영상 등과 같은 멀티미디어 데이터에 이르기까지 폭넓게 적용되고 있으나, 태그가 가지는 근본적인 한계로 인해 만족스럽지 못한 검색 결과를 도출하고 있다. 이와 같은 한계로는 부정확한 태그로 인한 낮은 검색 결과의 도출과 비구조화된 태그 특성으로 인한 비효율적인 정보 네비게이션을 들 수 있다.
본 논문에서는 이러한 단점을 해결하고자 다중 태그 기반 검색 알고리즘을 제안하였다. 다중 태그 검색 알고리즘의 구현을 위하여 사용자 개개인이 태깅한 정보들을 기반으로 연관 태그들 간의 매칭을 수행하였으며, 연관 태그 및 빈도수를 추출하여, 그것을 기반으로 가중치 매트릭스를 생성하고, 이를 기반으로 클러스터링을 진행하였다. 본 논문에서 제안한 클러스터링 알고리즘은 CAST 알고리즘의 θ값을 기반으로 클러스터링을 수행하는 방법을 응용한 클러스터링 알고리즘을 제안하였으며, 그 결과를 다중 태그 검색 기법의 여러 검색 기법들과 비교·분석하여 이미지 검색의 정확도(precision)와 재현율(recall) 등을 통해 검색 결과를 비교·평가하였다.
다중 태그 기반 검색은 기존의 단일 태그 방식과는 다르게 2-태그 검색(2-태그 쌍 검색), 3-태그 검색(3-튜플 태그 검색), 3-2 혼합 태그 검색(3-2 혼합 튜플 태그 검색)을 사용하여 클러스터링 된 이미지의 정확도와 재현율을 비교·평가하였다. 이를 위하여 많은 사용자들이 이용하고 있는 대표적인 태그 사이트인 플리커의 검색 이미지를 이용하였으며, 기존의 단일 태그 방식에 비해 다중 태그 방식의 이미지가 정확도가 높게 나타나고 있는 것을 실험을 통해 확인할 수 있었다. 단일 태그 방식의 경우 정확도와 재현율이 46.8%인데 반하여, 제안한 다중 태그 방식의 경우 각 방식마다 조금씩 차이는 있지만 평균 88.1%의 정확도와 34.9%의 재현율을 나타내고 있다.
하지만 다중 태그 기반 검색은 기존 단일 태그 검색 방식에 비해 처리 시간이 좀 더 소요되고 재현율이 약간 떨어지는 단점이 있으나, 이러한 단점은 기존 결과에 비해 정확도가 상대적으로 높은 결과의 도출로 사용자 만족도에 미치는 영향은 상대적으로 적은 것으로 나타났다.
향후 연구에서는 이러한 정확도와 재현율을 높이기 위한 방법을 연구하여야 할 것이며, 사용자들의 만족도를 높일 수 있는 검색 기법을 제시하여야 할 것이다. 또한 그 수행 결과에 대해서는 플리커 사이트뿐만이 아니라 다양한 태그 검색 사이트에 적용하여 다중 태그 검색 기법의 정확도와 재현율의 평가를 수행해야 할 것이다.