근내지방은 육류의 부드러움과 풍미와 같은 육질에 영향을 미치는 가장 중요한 요소이며 육질은 육류의 지방산 유형에 따라 영향을 받는다. GWAS는 형질의 유전적인 구조에 대한 정보를 제공하고 SNP와 형질 사이의 연관성을 탐지하는데, 이러한 GWAS를 통해 근내지방 형질과 SNP 간의 연관성을 확인할 수 있다. 본 연구의 목적은 텍스트 마이닝을 사용하여 6개의 지방산(Myristic acid, Palmitic acid, Stearic acid, Oleic acid, Linoleic acid, Eicosenoic acid)과 관련된 유전자를 검출하고 생물학적 정보를 가진 텍스트 마이닝된 유전자와 QTLdb를 이용해 한우의 지방산 특성에 대한 GWAS 결과를 검증하는 데에 있다.
이를 위해 각 지방산과 관련된 유전자의 빈도는 높은 정확도를 가진 PubTator 텍스트 마이닝 시스템을 이용하여 추출했다. 텍스트 마이닝 결과, Linoleic acid, Oleic acid, Palmitic acid, Stearic acid, Myristic acid, Eicosenoic acid 관련 유전자 수는 각각 214개, 113개, 111개, 53개, 25개, 1개였다. 또한 텍스트 마이닝 결과의 유효성과 신뢰성을 확인하기 위해 유전자 온톨로지 (GO) 분석을 수행했다. 그 결과 'GO:0006629, 지질 대사 과정 및 'GO:0008610, 지질 생합성 과정' 용어 등이 유의미한 p 값을 가졌다.
텍스트 마이닝 된 유전자와 비교하여 지방산 QTLdb를 확인한 결과 Linoleic acid, Oleic acid, Palmitic acid, Stearic acid, Myristic acid, Eicosenoic acid의 중복된 QTL 수는 각각 0개, 4개, 1개, 2개, 2개, 0개였다. Oleic acid에는 4개의 영역(BTA16:4402474-4406421,BTA19:51243972-51255385, BTA19 :51384922-51403614, BTA29 :18084681-18090529)이 있으며 Myristic acid에는 두 영역 (BTA19:51384922-51403614 및 BTA26:21141592-21148318)이 있다. Stearic acid에는 두 개의 영역이 있다 (BTA2:125065946-125101312 및 BTA29 :18084681-18090529). Palmitic acid의 경우, 하나의 겹치는 QTL 영역이 발견되었다 (BTA19:51384922-51403614).
Whole genome으로 imputed 시킨 GWAS 결과 Myristic acid의 19번 염색체에서 78개의 유의적인 SNP와 CCDC57, FASN, DUS1L 후보 유전자가 확인되었다. 텍스트 마이닝 된 유전자들을 이용한 Myristic GWAS와 BayesR 결과 역시 19번 염색체에서 유의성을 확인 할 수 있었고 모든 결과에서 중복된 후보 유전자와 유의적인 SNP는 FASN의 Upstream에 위치한 SNP(BTA19:51,380,689) 이다.
이러한 결과 텍스트 마이닝을 통해 GWAS 분석 전후의 유효성을 검사하려는 시도는 여전히 가치 있는 것으로 보인다. 또한, 텍스트 마이닝에 의한 유전자 모니터링은 특정 개체군의 표현형이나 유전 정보를 사용하지 않았기 때문에 다양한 개체군이나 품종에 사용할 수 있을 것이다.