본문 바로가기 주메뉴 바로가기
국회도서관 홈으로 정보검색 소장정보 검색

목차보기

Title Page

Contents

CHAPTER Ⅰ. Literature review 8

1.1. Introduction 8

1.2. Genomic-wide association study 11

1.3. Text-mining 12

1.4. Quantitative Trait Loci Database 14

CHAPTER Ⅱ. Validation of genome-wide association study utilized text-mining approach to detect fatty-acid related genes of Hanwoo cattle 16

2.1. Introduction 16

2.2. Materials and Methods 19

2.2.1. Animal and phenotype data 19

2.2.2. Genotyping and quality control 20

2.2.3. Text-mining and SNP extraction 21

2.2.4. Gene Ontology analysis and karyotyping 24

2.2.5. Genome-Wide Association Study using the imputed whole and text-mined SNPs 24

2.2.6. BayesR using the imputed 777K and test-mined SNPs 25

2.3. Results 26

2.3.1. Phenotype 26

2.3.2. Text-mined gene and SNP extraction 27

2.3.3. Detailed functional studies by Gene Ontology analysis used Text-mined genes 32

2.3.4. The QTL regions between cattle QTL database and text-mined-genes 37

2.3.5. Genome-wide association study using the imputed whole and text-mined SNPs 40

2.3.6. BayesR using text-mined SNPs 41

2.4. DISCUSSION 50

2.4.1. Text-mining 50

2.4.2. Genome-Wide Association Study 51

2.4.3. Limitation of Text-mining 54

2.5. Conclusions 55

REFERENCES 56

ABSTRACT 64

초록 67

List of Tables

Table 2.1. Fatty acids composition in Hanwoo 27

Table 2.2. Summary statistics of text-mined genes and SNP calling 28

Table 2.3. The top five significant biological processes for each trait 34

Table 2.4. Significant SNPs in genome-wide association study for myristic acid in Hanwoo cattle 45

List of Figures

Figure 2.1. Workflow of text-mining 23

Figure 2.2. The top 30 text-mined genes 29

Figure 2.3. The karyotype of QTL regions registered in QTLDB, text-mined region and the intersection of both regions 39

Figure 2.4. Manhattan plots with results of genome-wide association study, GWAS using text-mined SNPs and BayesR for Myristic acid 43

초록보기

 근내지방은 육류의 부드러움과 풍미와 같은 육질에 영향을 미치는 가장 중요한 요소이며 육질은 육류의 지방산 유형에 따라 영향을 받는다. GWAS는 형질의 유전적인 구조에 대한 정보를 제공하고 SNP와 형질 사이의 연관성을 탐지하는데, 이러한 GWAS를 통해 근내지방 형질과 SNP 간의 연관성을 확인할 수 있다. 본 연구의 목적은 텍스트 마이닝을 사용하여 6개의 지방산(Myristic acid, Palmitic acid, Stearic acid, Oleic acid, Linoleic acid, Eicosenoic acid)과 관련된 유전자를 검출하고 생물학적 정보를 가진 텍스트 마이닝된 유전자와 QTLdb를 이용해 한우의 지방산 특성에 대한 GWAS 결과를 검증하는 데에 있다.

이를 위해 각 지방산과 관련된 유전자의 빈도는 높은 정확도를 가진 PubTator 텍스트 마이닝 시스템을 이용하여 추출했다. 텍스트 마이닝 결과, Linoleic acid, Oleic acid, Palmitic acid, Stearic acid, Myristic acid, Eicosenoic acid 관련 유전자 수는 각각 214개, 113개, 111개, 53개, 25개, 1개였다. 또한 텍스트 마이닝 결과의 유효성과 신뢰성을 확인하기 위해 유전자 온톨로지 (GO) 분석을 수행했다. 그 결과 'GO:0006629, 지질 대사 과정 및 'GO:0008610, 지질 생합성 과정' 용어 등이 유의미한 p 값을 가졌다.

텍스트 마이닝 된 유전자와 비교하여 지방산 QTLdb를 확인한 결과 Linoleic acid, Oleic acid, Palmitic acid, Stearic acid, Myristic acid, Eicosenoic acid의 중복된 QTL 수는 각각 0개, 4개, 1개, 2개, 2개, 0개였다. Oleic acid에는 4개의 영역(BTA16:4402474-4406421,BTA19:51243972-51255385, BTA19 :51384922-51403614, BTA29 :18084681-18090529)이 있으며 Myristic acid에는 두 영역 (BTA19:51384922-51403614 및 BTA26:21141592-21148318)이 있다. Stearic acid에는 두 개의 영역이 있다 (BTA2:125065946-125101312 및 BTA29 :18084681-18090529). Palmitic acid의 경우, 하나의 겹치는 QTL 영역이 발견되었다 (BTA19:51384922-51403614).

Whole genome으로 imputed 시킨 GWAS 결과 Myristic acid의 19번 염색체에서 78개의 유의적인 SNP와 CCDC57, FASN, DUS1L 후보 유전자가 확인되었다. 텍스트 마이닝 된 유전자들을 이용한 Myristic GWAS와 BayesR 결과 역시 19번 염색체에서 유의성을 확인 할 수 있었고 모든 결과에서 중복된 후보 유전자와 유의적인 SNP는 FASN의 Upstream에 위치한 SNP(BTA19:51,380,689) 이다.

이러한 결과 텍스트 마이닝을 통해 GWAS 분석 전후의 유효성을 검사하려는 시도는 여전히 가치 있는 것으로 보인다. 또한, 텍스트 마이닝에 의한 유전자 모니터링은 특정 개체군의 표현형이나 유전 정보를 사용하지 않았기 때문에 다양한 개체군이나 품종에 사용할 수 있을 것이다.