목차

표제지

목차

연구요약 3

Summary 6

제1장 연구개요 16

1.1. 연구의 필요성 및 목적 17

1.2. 연구의 내용 및 범위 19

1.3. 연구의 방법 22

제2장 빅데이터 기반 서비스 로드맵 및 정보화 전략 수립 25

2.1. 도서관장애인서비스 모델을 위한 개념 연구 및 상세 아키텍처 설계 26

2.1.1. 도서관장애인서비스 사례 조사 26

2.1.2. 빅데이터 활용 도서관 서비스 사례 조사 29

2.2. 대규모의 이질적 데이터 수집/가공/관리 체제 수립 31

2.2.1. 장애인도서관의 대체자료 현황 32

2.2.2. 멀티미디어 빅데이터 플랫폼 조사 33

2.2.3. 장애인도서관의 빅데이터 플랫폼 36

2.3. 서비스 구축을 위한 상세 실행 계획 수립 44

제3장 이용자 참여형 도서 추천 큐레이션 플랫폼 설계 48

3.1. 이용자 분석/모델링 기법 연구 49

3.1.1. 장애인도서관의 현재 이용자 프로파일링 방법 분석 49

3.1.2. 이용자의 선호도 및 관심분야 정보 수집을 위한 웹 기반의 프로파일링 모델 연구 51

3.2. 이용자 성향 및 상황 기반의 정보 추천 모델 개발 연구 52

3.2.1. 성격유형 기반 도서자동분류를 위한 기반 데이터 확보 53

3.2.2. 정보 추천을 위한 도서자동분류엔진 개발 54

3.3. 이용자 선호도 기반의 대체자료 선정 방법론 개발 55

3.3.1. 이용자 선호 주제 분야 및 주제별 관심 키워드 분석 56

3.3.2. 대체자료 선정 방법론 개발 97

3.4. 다양한 외부 서비스 및 정보 원천과의 연계방안 마련 100

제4장 빅데이터 분석기반 장애인 정보정책수립 지원방안 연구 101

4.1. 토픽 모델링 및 이슈 분석을 위한 사회 미디어 자원 수집 103

4.2. 대상 이슈 중심의 토픽 추출 및 개념화 연구 107

4.2.1. '장애인' 신문기사 자원을 기반으로 한 핵심 토픽 추출 107

4.2.2. 키워드 간의 유사성 및 연관성 계산을 위한 워드임베딩 벡터 구축 114

4.3. 장애인 정보정책 관련 신규 사회적 이슈 도출 시범 시스템 개발 연구 124

4.3.1. 워드 임베딩을 활용한 유사 키워드 간의 군집화(Clustering) 124

4.3.2. 워드 임베딩을 활용한 유사 키워드 간의 시각화(Visualizing) 132

제5장 결론 141

참고문헌 145

[부록 1] 연령대 및 성별 구분에 따른 이용자 관심 키워드 148

[부록 2] 이용자 관심 키워드를 반영한 대체자료 제작 대상 리스트 172

[부록 3] 워드 임베딩을 활용한 유사 키워드 간의 군집화(Clustering) 결과 196

판권기 225

〈표 2-1〉 국내 도서관의 장애인 서비스 27

〈표 2-2〉 국외 도서관의 장애인 서비스 28

〈표 2-3〉 국내 빅데이터 기반의 도서관 서비스 30

〈표 2-4〉 국외 빅데이터 기반의 도서관 서비스 31

〈표 2-5〉 대체자료 유형에 따른 데이터 저장 방식 32

〈표 2-6〉 대표적인 빅데이터 플랫폼 기술 35

〈표 3-1〉 국립장애인도서관 웹 회원가입을 통해 수집되는 이용자 정보 50

〈표 3-2〉 웹을 통해 수집 가능한 이용자 로그정보 51

〈표 3-3〉 에니어그램 성격 유형 및 유형별 특징 53

〈표 3-4〉 성격유형에 따른 도서 분류를 위해 수집된 데이터 54

〈표 3-5〉 DREAM 이용 내역 데이터의 데이터 수 55

〈표 3-6〉 이용자 그룹별 데이터 구성 56

〈표 3-7〉 형태소 분석 결과 예시 57

〈표 3-8〉 Naver 책 카테고리 예시 57

〈표 3-9〉 전체 이용자의 주제별 관심 키워드(문학 외) 60

〈표 3-10〉 전체 이용자의 주제별 관심 키워드(문학) 61

〈표 3-11〉 10대 이하 남성 이용자의 주제별 관심 키워드(문학 외) 63

〈표 3-12〉 10대 이하 남성 이용자의 주제별 관심 키워드(문학) 64

〈표 3-13〉 10대 이하 여성 이용자의 주제별 관심 키워드(문학 외) 66

〈표 3-14〉 10대 이하 여성 이용자의 주제별 관심 키워드(문학) 67

〈표 3-15〉 20대 남성 이용자의 주제별 관심 키워드(문학 외) 68

〈표 3-16〉 20대 남성 이용자의 주제별 관심 키워드(문학) 70

〈표 3-17〉 20대 여성 이용자의 주제별 관심 키워드(문학 외) 71

〈표 3-18〉 20대 여성 이용자의 주제별 관심 키워드(문학) 73

〈표 3-19〉 30대 남성 이용자의 주제별 관심 키워드(문학 외) 74

〈표 3-20〉 30대 남성 이용자의 주제별 관심 키워드(문학) 76

〈표 3-21〉 30대 여성 이용자의 주제별 관심 키워드(문학 외) 77

〈표 3-22〉 30대 여성 이용자의 주제별 관심 키워드(문학) 79

〈표 3-23〉 40대 남성 이용자의 주제별 관심 키워드(문학 외) 80

〈표 3-24〉 40대 남성 이용자의 주제별 관심 키워드(문학) 82

〈표 3-25〉 40대 여성 이용자의 주제별 관심 키워드(문학 외) 83

〈표 3-26〉 40대 여성 이용자의 주제별 관심 키워드(문학) 85

〈표 3-27〉 50대 남성 이용자의 주제별 관심 키워드(문학 외) 86

〈표 3-28〉 50대 남성 이용자의 주제별 관심 키워드(문학) 88

〈표 3-29〉 50대 여성 이용자의 주제별 관심 키워드(문학 외) 89

〈표 3-30〉 50대 여성 이용자의 주제별 관심 키워드(문학) 91

〈표 3-31〉 60대 이상 남성 이용자의 주제별 관심 키워드(문학 외) 92

〈표 3-32〉 60대 이상 남성 이용자의 주제별 관심 키워드(문학) 94

〈표 3-33〉 60대 이상 여성 이용자의 주제별 관심 키워드(문학 외) 95

〈표 3-34〉 60대 이상 여성 이용자의 주제별 관심 키워드(문학) 97

〈표 3-35〉 '전체' 이용자 대상의 대체자료 제작 대상 리스트 예시 99

〈표 4-1〉 키워드 '장애인' 관련 사회 미디어 자원 수집 결과 105

〈표 4-2〉 수집 후 가공된 신문기사 자원에 대한 예시 106

〈표 4-3〉 KoNLP 형태소 분석 패키지 성능 비교 108

〈표 4-4〉 기본 TF-IDF 가중치 모델 공식 109

〈표 4-5〉 변형된 TF-IDF 가중치 모델 공식 110

〈표 4-6〉 변형된 TF-IDF 가중치 계산을 통한 키워드 추출 결과 비교 110

〈표 4-7〉 NTFIDF 가중치 계산을 통해 추출된 키워드 상위 100개 111

〈표 4-8〉 NTFIDF 가중치 계산을 통해 추출된 특정기간 키워드 상위 100개 113

〈표 4-9〉 세종코퍼스 형태소 단위 데이터 워드 임베딩 정보 120

〈표 4-10〉 네이버 뉴스 기사 어절 단위 데이터 워드 임베딩 정보 121

〈표 4-11〉 NTFIDF 추출 키워드 세종말뭉치 벡터 매핑 시 탈락된 키워드 122

〈표 4-12〉 NTFIDF 추출 키워드 뉴스 벡터 매핑 시 탈락된 키워드 123

〈표 4-13〉 K-평균 클러스터링에 사용된 파라미터 값 125

〈표 4-14〉 토픽 별 키워드의 개수 125

〈표 4-15〉 키워드 간의 관계가 뚜렷한 토픽 16개의 키워드 126

〈표 4-16〉 '뉴스 벡터' 기반의 키워드 '장애인' 유사 키워드 상위 20개 134

〈표 4-17〉 '뉴스 벡터' 기반의 키워드 '복지' 유사 키워드 상위 20개 135

〈표 4-18〉 '뉴스 벡터' 기반의 키워드 '장애' 유사 키워드 상위 20개 136

〈표 4-19〉 '뉴스 벡터' 기반의 키워드 '패럴림픽' 유사 키워드 상위 20개 138

〈표 4-20〉 '뉴스 벡터' 기반의 키워드 '일자리' 유사 키워드 상위 20개 139

〈그림 1-1〉 2013-2016년 국내 빅데이터 시장 규모 17

〈그림 1-2〉 연구 내용의 전반 개요 20

〈그림 1-3〉 이용자 참여형 도서 추천 큐레이션 플랫폼의 전반적인 구조 21

〈그림 1-4〉 장애인 정보 정책 관련 사회적 이슈 도출 시범 시스템의 개요 22

〈그림 2-1〉 장애인도서관의 빅데이터 플랫폼 개요 37

〈그림 2-2〉 정보 분석 결과를 통한 기존의 도서관 서비스 지원 38

〈그림 2-3〉 이용자 모델링 및 개인화 서비스의 구축 과정 40

〈그림 2-4〉 대체자료 추천 서비스의 구축 과정 41

〈그림 2-5〉 정책 지원 서비스의 구축 과정 42

〈그림 2-6〉 빅데이터 기반의 서비스 구축을 위한 상세 실행 계획 44

〈그림 3-1〉 이용자 선호도 및 관심분야 정보 수집을 위한 웹 프로파일링 52

〈그림 3-2〉 성격유형에 따른 정보 추천을 위한 도서 자동분류 엔진 54

〈그림 3-3〉 DREAM에서 서비스 되고 있는 국립중앙도서관 대체자료의 주제 구성 58

〈그림 3-4〉 전체 이용자의 선호 주제 분야 분석 결과 59

〈그림 3-5〉 10대 이하 남성 이용자의 선호 주제 분야 분석 결과 62

〈그림 3-6〉 10대 이하 여성 이용자의 선호 주제 분야 분석 결과 65

〈그림 3-7〉 20대 남성 이용자의 선호 주제 분야 분석 결과 68

〈그림 3-8〉 20대 여성 이용자의 선호 주제 분야 분석 결과 71

〈그림 3-9〉 30대 남성 이용자의 선호 주제 분야 분석 결과 74

〈그림 3-10〉 30대 여성 이용자의 선호 주제 분야 분석 결과 77

〈그림 3-11〉 40대 남성 이용자의 선호 주제 분야 분석 결과 80

〈그림 3-12〉 40대 여성 이용자의 선호 주제 분야 분석 결과 83

〈그림 3-13〉 50대 남성 이용자의 선호 주제 분야 분석 결과 86

〈그림 3-14〉 50대 여성 이용자의 선호 주제 분야 분석 결과 89

〈그림 3-15〉 60대 이상 남성 이용자의 선호 주제 분야 분석 결과 92

〈그림 3-16〉 60대 이상 여성 이용자의 선호 주제 분야 분석 결과 95

〈그림 3-17〉 이용자 선호도 기반의 대체자료 선정 방법론 개요 98

〈그림 3-18〉 다양한 외부 서비스 및 정보 원천과의 연계 방안 100

〈그림 4-1〉 빅데이터 분석기반 장애인 정보정책수립 지원 방안 연구의 전체 개요 102

〈그림 4-2〉 사회 미디어 자원 수집 및 가공 과정 104

〈그림 4-3〉 관련 미디어 자원에 기반 한 핵심 키워드 추출 과정 107

〈그림 4-4〉 성별 관계 벡터 오프셋(Offset) 예시 115

〈그림 4-5〉 CBOW(Continuous Bag-of-Words) 모델 구조 예시 116

〈그림 4-6〉 Skip-Gram 모델 구조 예시 117

〈그림 4-7〉 세종코퍼스 1차 가공 데이터 예시 119

〈그림 4-8〉 세종코퍼스 2차 가공 데이터 예시 119

〈그림 4-9〉 네이버 신문 기사 2차 가공 데이터 예시 120

〈그림 4-10〉 NTFIDF 추출 키워드 벡터 매핑 데이터 예시 122

〈그림 4-11〉 주성분 분석을 통해 2차원으로 변형된 키워드 모습 133

〈그림 4-12〉 유사 키워드 제공 예시 133

〈그림 4-13〉 PCA 알고리즘을 이용한 '장애인' 유사 키워드 시각화 135

〈그림 4-14〉 PCA 알고리즘을 이용한 '복지' 유사 키워드 시각화 136

〈그림 4-15〉 PCA 알고리즘을 이용한 '장애' 유사 키워드 시각화 137

〈그림 4-16〉 PCA 알고리즘을 이용한 '패럴림픽' 유사 키워드 시각화 139

〈그림 4-17〉 PCA 알고리즘을 이용한 '일자리' 유사 키워드 시각화 140