권호기사보기
기사명 | 저자명 | 페이지 | 원문 | 기사목차 |
---|
대표형(전거형, Authority) | 생물정보 | 이형(異形, Variant) | 소속 | 직위 | 직업 | 활동분야 | 주기 | 서지 | |
---|---|---|---|---|---|---|---|---|---|
연구/단체명을 입력해주세요. |
|
|
|
|
|
* 주제를 선택하시면 검색 상세로 이동합니다.
표제지
목차
국문초록 9
ABSTRACT 11
제1장 서론 13
1.1. 연구 배경 13
1.2. 논문의 구성 14
제2장 관련 연구 15
2.1. 토픽 추출 15
2.1.1. LDA(Latent Dirichlet Allocation) 15
2.1.2. Graph-based Word Clustering using a Web Search Engine 16
2.2. 단어 가중치 계산 방법 17
2.2.1. ICF-based 17
2.2.2. ECCD(Entropy based Category Coverage Difference) 18
제3장 지역별 토픽 추출 20
3.1. 텍스트 전처리 20
3.1.1. 명사 추출 모듈 21
3.1.2. 불용어 제거 모듈 22
3.2. 핵심어 추출 24
3.3. 시드 선정 25
3.4. 초기 군집화 26
3.5. 군집 병합 27
제4장 실험 및 결과 28
4.1. 데이터 수집 및 실험 방법 28
4.1.1. 데이터 수집 28
4.1.2. 실험 방법 29
4.2. 실험 결과 33
4.2.1. 단어 가중치 기법 선정 33
4.2.2. 초기 군집화를 위한 연관성 계산 기법 선정 36
4.2.3. 초기 군집화 및 군집 병합 파라미터 조정 39
4.2.4. 실험 결과 종합 46
제5장 결론 및 향후과제 48
참고문헌 49
[그림 2-1] LDA 계산과정 모식도 16
[그림 2-2] Graph-based Word Clustering 16
[그림 3-1] 지역별 토픽 추출 시스템 구조도 20
[그림 4-1] 지역별 인기 기사 29
[그림 4-2] 단어 가중치 계산 기법별 정답토픽 단어의 평균 순위 35
[그림 4-3] α와 β의 변화에 따른 추출된 토픽의 적합성 평가 결과 그래프 46
최근 사용자의 위치 정보를 활용하는 위치 기반 서비스가 대중화 되고 있다. 트위터와 페이스북은 사용자의 위치정보를 작성한 글에 기록하는 형태로 서비스를 제공하고 있다. 또한 국내 포털 업체인 다음은 제공하는 뉴스 기사를 조회한 사용자의 위치 정보를 토대로 지역별 인기 기사를 집계하는 서비스를 제공하고 있다. 이렇듯 다양한 형태의 위치 기반 서비스로부터 위치 정보를 포함한 데이터가 빠르게 생성되고 있다.
그 중 위치 정보가 포함된 텍스트 데이터는 지역별 사용자들이 표현한 관심사와 같은 특성을 내포하고 있으며 지역 간 비교를 통해 각 특성의 차이를 파악할 수 있다. 이러한 지역 간 특성의 차이는 기업의 지역 마케팅이나, 국가의 정책 수립과 같은 의사 결정에 도움이 될 수 있다.
본 연구에서는 지역별 토픽을 추출하기 위한 단어 군집화 방법을 제안한다. 제안 방법에서는 지역별 토픽 추출을 위하여 지역별 인기 뉴스 문서들을 수집한다. 수집된 지역별 인기 뉴스 문서 집합에서 지역별 문서 집합을 대표할 수 있는 단어인 핵심어를 추출하고, 핵심어 중 단어 군집화를 위한 시드를 선정한다. 핵심어와 시드가 결정되면 지역별 토픽 추출을 위한 단어 군집화를 수행한다. 우선 선정된 시드를 중심으로 함께 등장한 핵심어들과의 연관성을 기준으로 초기 군집들을 생성한다. 생성된 군집 중에는 유사한 내용의 군집이 있을 수 있기 때문에 유사 군집을 병합하는 과정을 거쳐 최종적으로 지역별 토픽을 추출한다. 또한, 본 연구에서는 지역별로 추출된 토픽의 적합성을 평가할 수 있는 새로운 평가기준을 제안하고, 최적의 지역별 토픽 추출을 위한 파라미터 조합을 실험을 통해 제시한다.*표시는 필수 입력사항입니다.
전화번호 |
---|
기사명 | 저자명 | 페이지 | 원문 | 기사목차 |
---|
번호 | 발행일자 | 권호명 | 제본정보 | 자료실 | 원문 | 신청 페이지 |
---|
도서위치안내: / 서가번호:
우편복사 목록담기를 완료하였습니다.
*표시는 필수 입력사항입니다.
저장 되었습니다.