본문바로가기

자료 카테고리

전체 1
도서자료 0
학위논문 1
연속간행물·학술기사 0
멀티미디어 0
동영상 0
국회자료 0
특화자료 0

도서 앰블럼

전체 (0)
일반도서 (0)
E-BOOK (0)
고서 (0)
세미나자료 (0)
웹자료 (0)
전체 (1)
학위논문 (1)
전체 (0)
국내기사 (0)
국외기사 (0)
학술지·잡지 (0)
신문 (0)
전자저널 (0)
전체 (0)
오디오자료 (0)
전자매체 (0)
마이크로폼자료 (0)
지도/기타자료 (0)
전체 (0)
동영상자료 (0)
전체 (0)
외국법률번역DB (0)
국회회의록 (0)
국회의안정보 (0)
전체 (0)
표·그림DB (0)
지식공유 (0)

도서 앰블럼

전체 1
국내공공정책정보
국외공공정책정보
국회자료
전체 ()
정부기관 ()
지방자치단체 ()
공공기관 ()
싱크탱크 ()
국제기구 ()
전체 ()
정부기관 ()
의회기관 ()
싱크탱크 ()
국제기구 ()
전체 ()
국회의원정책자료 ()
입법기관자료 ()

검색결과

검색결과 (전체 1건)

검색결과제한

열기
논문명/저자명
태그 연관성 분석을 통한 태그와 문서 단어의 동시출현빈도를 고려한 태그 추출 알고리즘 = Tag extract algorithm considering co-occurrence frequency of tags and words of a document through tag correlation analysis / 박기철 인기도
발행사항
서울 : 서강대학교 정보통신대학원, 2014.2
청구기호
TM 004 -14-15
형태사항
32 p. ; 26 cm
자료실
전자자료
제어번호
KDMT1201409657
주기사항
학위논문(석사) -- 서강대학교 정보통신대학원, 정보처리전공, 2014.2. 지도교수: 양지훈
원문

목차보기더보기

표제지

목차

Abstract 8

초록 10

1장. 서론 11

1.1. 연구의 배경 11

1.2. 연구 목적 13

1.3. 논문의 구성 14

2장. 관련연구 15

2.1. 태그 활용성 15

2.2. 태그 추출 기법에 관한 연구 16

2.3. SVD (Singular Value Decomposition) 18

3장. 태그 추출 기법 21

3.1. 연관태그 그룹 생성 22

3.2. 동시출현빈도수 가중치를 이용한 태그후보 추출 32

3.3. 태그 선택 방법 34

4장. 구현 및 분석 35

4.1. 실험 환경 및 데이터 집합 35

4.2. 제안 기법의 비교 실험 36

4.3. 실험 결과 38

5장. 결론 39

5.1. 연구 결론 39

5.2. 향후 연구방향 39

참고문헌 41

[표3-1] 연관태그 그룹을 생성하기 위한 문서들의 예 25

[표3-2] 표3-1의 문서 사용자 태그 25

[표3-3] 표3-2에 대한 태그-문서 행렬 26

[표3-4] 표3-3의 2차원 축소 28

[표3-5] 질의 태그 벡터 28

[표3-6] 질의 벡터(T06)와의 유사도 척도 31

[표4-1] 실험 데이터 35

[표4-2] 종합 성능 비교1 37

[표4-3] 종합 성능 비교2 37

[표4-4] 종합 성능 비교3 37

[그림2-1] A (m x n) 행렬의 SVD 표현 (k차원 축소시) 18

[그림2-2] SVD 차원축소 형태 20

[그림3-1] 태그 추출 기법 순서도 21

[그림3-2] 연관태그 그룹 생성 절차 23

[그림3-3] 연관태그 그룹 생성을 위한 행렬 분해 24

[그림3-4] 연관태그 그룹의 태그와 1:1 매칭하는 연관문서 그룹 32

초록보기 더보기

 웹 2.0 시대의 콘텐츠 중심의 웹 애플리케이션에서 사용자가 아이템에 키워드나 문구를 추가하는 식의 태그를 다는 행위는 웹사이트 어디서나 흔히 볼 수 있다. 이러한 태그들은 사람들이 웹 문서에 태깅을 할때, 문서에 대한 사람의 생각이 연결된 태그 단어로 나열된다는 특징을 가지고 있다. 나열된 태그들은 문서를 가장 대표할 수 있는 단어들이고, 서로간의 의미적인 연관성을 가지고 있다. 이러한 연관성을 분석하기 위해서 본 논문에서는 SVD 차원 축소를 통하여 분해된, 태그의 특성을 가지는 행렬을 이용하여, 태그간 유사도를 구한다. 태그를 추출해야 할 문서의 태그를 기준으로, 전체 문서그룹내의 각 태그들의 차원축소에 따른 유사 임계값을 이용하여 유사도를 구한다. 이러한 유사도 기법을 이용하여 유사성이 높은 태그들이 해당 문서내에 존재할 경우 태그 추출 후보로 등록하고 해당 태그의 연관태그 그룹을 생성하였다. 생성된 연관태그 그룹은 태그간의 연관 관계뿐만 아니라, 태그가 문서를 대표하는 추상적인 단어이기 때문에, 각 문서들에 대한 연관 정도를 나타낼 수 있다. 연관된 문서들의 모든 명사 단어들과 해당 태그를 이용하여 동시출현빈도수를 구하였다. 해당 태그와 연관 문서내 단어들의 동시출현빈도가 의미하는 것은 해당 태그가 문서에서 나타나는 단어들과 동시적으로 출현하는 횟수를 측정한 값이다. 이렇게 측정된 횟수가 높을수록 태그와 의미적으로 연관된 단어일 가능성이 높다. 동시출현빈도수와 연관태그 유사도를 통해 태그 추출 후보단어를 순위화하고, 전체 문서그룹의 태그 집합에서 존재하는 단어를 비교하여 태그를 추출하였다. 실험 결과 기존의 통계적인 기법으로 문서의 대표 단어를 태깅하는 방법과 비교했을때, 사람들이 태깅한 태그와 인지적으로 얼마나 비슷한가에 대해서 우위적인 결과를 얻을 수 있었다.

권호기사보기

권호기사 목록 테이블로 기사명, 저자명, 페이지, 원문, 기사목차 순으로 되어있습니다.
기사명 저자명 페이지 원문 기사목차
연속간행물 팝업 열기 연속간행물 팝업 열기