생몰정보
소속
직위
직업
활동분야
주기
서지
국회도서관 서비스 이용에 대한 안내를 해드립니다.
검색결과 (전체 1건)
원문 있는 자료 (1) 열기
원문 아이콘이 없는 경우 국회도서관 방문 시 책자로 이용 가능
목차보기더보기
표제지
목차
Ⅰ. 서론 11
Ⅱ. 색인어 추출 관련 연구 13
2.1 통계적 기법 14
2.2 구축된 데이터를 이용하는 방법 17
Ⅲ. 제안된 방법을 이용한 색인어 추출 20
3.1 토큰화 21
3.2 불용어 필터링 22
3.3 출현빈도 추출 24
3.4 카테고리 분류 25
1) 복합어를 위한 토큰의 연결 26
2) 축약형이 포함된 토큰의 처리 27
3) 도치된 토큰의 처리 28
3.5 상호 연관성의 적용 및 후처리 29
3.6 제안된 색인어 추출 방법의 구조 32
Ⅳ. 실험 결과 및 분석 33
4.1 실험 자료 33
4.2 시소러스의 구축 35
4.3 출현 빈도와 상호 연관성의 적용 36
4.3.1 상호 연관성이 적용된 카테고리의 색인어 추출 38
4.3.2 상호 연관성 미적용 카테고리의 색인어 추출 40
4.4 실험 분석 및 평가 46
Ⅴ. 결론 50
참고문헌
52
Abstract 55
Table 1. Example of the frequency based extraction 16
Table 2. List of stop words 23
Table 3. Design of the frequency table 24
Table 4. Statistics of the experimental documents 33
Table 5. Number of query results for each compound 40
Table 6. Keywords that are extracted by the proposed system and real keywords of text001
42
Table 7. Extracted keywords and real keywords of a portion of sample documents
43
Table 8. Precision and recall of each method 47
그림목차
Figure 1. Flowchart of the frequency based keyword extraction 16
Figure 2. Example of lexical chains 18
Figure 3. Example of the tokenizing process 22
Figure 4. Word frequency diagram 23
Figure 5. Example of the frequency check flow 25
Figure 6. Example of the compound keywords extraction 27
Figure 7. Example of processing tokens that contain abbreviations 28
Figure 8. Example of word inversions 28
Figure 9. Example of processing inverted tokens 29
Figure 10. Flowchart of the keyword extraction by applying correlation
31
Figure 11. Block diagram of the proposed method 32
Figure 12. Example of the full text LMO document 34
Figure 13. A portion of the data list in the thesaurus 36
Figure 14. The Extraction process of text001 37
Figure 15. Extracted keyword candidates of text001 37
Figure 16. Keyword candidates for 'trait' category 39
Figure 17. Keyword candidates for 'organism name' category 39
Figure 18. Keyword candidates for 'country' category 41
Figure 19. Keyword candidates for 'year' category 41
Figure 20. Chart of precision and recall of each method 48
Figure 21. Chart of average precision of each category 49
원문구축 및 2018년 이후 자료는 524호에서 직접 열람하십시요.
도서위치안내: / 서가번호:
우편복사 목록담기를 완료하였습니다.
* 표시는 필수사항 입니다.
* 주의: 국회도서관 이용자 모두에게 공유서재로 서비스 됩니다.
저장 되었습니다.
로그인을 하시려면 아이디와 비밀번호를 입력해주세요. 모바일 간편 열람증으로 입실한 경우 회원가입을 해야합니다.
공용 PC이므로 한번 더 로그인 해 주시기 바랍니다.
아이디 또는 비밀번호를 확인해주세요