본문바로가기

자료 카테고리

전체 1
도서자료 0
학위논문 1
연속간행물·학술기사 0
멀티미디어 0
동영상 0
국회자료 0
특화자료 0

도서 앰블럼

전체 (0)
일반도서 (0)
E-BOOK (0)
고서 (0)
세미나자료 (0)
웹자료 (0)
전체 (1)
학위논문 (1)
전체 (0)
국내기사 (0)
국외기사 (0)
학술지·잡지 (0)
신문 (0)
전자저널 (0)
전체 (0)
오디오자료 (0)
전자매체 (0)
마이크로폼자료 (0)
지도/기타자료 (0)
전체 (0)
동영상자료 (0)
전체 (0)
외국법률번역DB (0)
국회회의록 (0)
국회의안정보 (0)
전체 (0)
표·그림DB (0)
지식공유 (0)

도서 앰블럼

전체 1
국내공공정책정보
국외공공정책정보
국회자료
전체 ()
정부기관 ()
지방자치단체 ()
공공기관 ()
싱크탱크 ()
국제기구 ()
전체 ()
정부기관 ()
의회기관 ()
싱크탱크 ()
국제기구 ()
전체 ()
국회의원정책자료 ()
입법기관자료 ()

검색결과

검색결과 (전체 1건)

검색결과제한

열기
논문명/저자명
SDedup : Spark Streaming 기반의 분산 병렬 중복 유전자 리드 제거 방법 = SDedup : distributed and parallel method to remove duplicate DNA reads based on spark streaming / 김응진 인기도
발행사항
충주 : 한국교통대학교 대학원, 2017.2
청구기호
TM 621.3 -17-122
형태사항
v, 38 p. ; 26 cm
자료실
전자자료
제어번호
KDMT1201711229
주기사항
학위논문(석사) -- 한국교통대학교 대학원, 정보기술융합학과, 2017.2. 지도교수: 송석일
원문

목차보기더보기

표제지

요약

목차

I. 서론 10

II. 관련 연구 14

1. NGS(Next Generation Sequencing) 14

2. PCR(Polymerase Chain Reaction) 16

3. BWA(Borrow-wheeler Alignment Tool) 18

4. SAM 파일 형식 20

5. 중복 제거 기법 21

1) ParDRe 21

2) SAMBLASTER 22

6. 스파크 및 스파크 스트리밍 24

1) 스파크 24

2) 스파크 스트리밍 26

III. SDedup(Spark Streaming based De-duplication for DNA Reads) 28

1. SDedup 개요 28

2. 중복 제거 절차 31

1) 마이크로 배치 데이터 수신 32

2) Duplicate 검출을 위한 형태로 변환 32

3) Duplicate 검출 33

3. SDedup 구현 35

IV. 성능평가 37

1. 실험 환경 37

2. 성능 평가 방법 37

3. 실험 결과 39

V. 결론 41

참고문헌 43

Abstract 46

표 2-1. SAM 파일 형식의 필수 항목 20

표 2-2. 스파크에서 사용하는 RDD 연산 25

표 3-1. SAM 형식에 따른 클래스 구조 33

표 3-2. 제안하는 방법 알고리즘 35

표 3-3. 제안하는 중복 리드 검출 방법 알고리즘 36

표 4-1. 노드 별 사양 37

표 4-2. 실험 Dataset 크기 39

표 4-3. 실험 결과 40

그림 1-1. 제안하는 기존 도구 한계점 개선 방법 12

그림 2-1. NGS 파이프라인 15

그림 2-2. PCR에서 유전체 증폭 준비 과정 16

그림 2-3. PCR에서 유전체 증폭 과정 17

그림 2-4. PCR에서 유전체 데이터를 읽는 과정 17

그림 2-5. 레퍼런스 게놈 및 PCR 결과 데이터 18

그림 2-6. BWA index 수행 19

그림 2-7. SAMBLASTER에서 시그니쳐 계산 과정 23

그림 2-8. 맵 리듀스와 스파크 성능 비교 24

그림 3-1. 제안하는 중복 리드 검출 과정 28

그림 3-2. 기존 파이프라인 도구 간 입·출력 29

그림 3-3. 제안하는 중복 데이터 처리 방안 29

그림 3-4. SDedup을 위한 클러스터 구성도 30

그림 3-5. 마이크로 배치 입력 처리 과정 31

그림 4-1. 성능 평가 진행 과정 38

그림 4-2. 성능 평가를 위한 수행 시간 측정 방법 38

권호기사보기

권호기사 목록 테이블로 기사명, 저자명, 페이지, 원문, 기사목차 순으로 되어있습니다.
기사명 저자명 페이지 원문 기사목차
연속간행물 팝업 열기 연속간행물 팝업 열기