참조 유전체에 존재하는 조립 오류는 생물학적 해석의 오류로 이어진다. 최근 염기서열 해독 기술의 발전과 더불어 대규모 유전체 프로젝트가 진행중이다. 척추동물 유전체 프로젝트(VGP)의 경우 척추동물 6 만 6 천여종의 염기서열을 해독하는 것을 목표로 한다. 또한, 유전체 해독 시 염기서열 분석 오류와 유전체 조립을 최소화하는 고품질 표준유전체 구축을 추구한다. 최근의 Telomere to Telomere 컨소시엄, Earth Biogenome Project 등 국제 규모 유전체 프로젝트 역시 VGP 가 추구하는 고품질 표준유전체 구축의 중요성을 강조하는 등 유전체의 오류를 개선하기 위한 노력이 연구자들 사이에서 활발하다. 제 2 장에선 VGP 와의 협업을 통해 유전체 조립오류에서 발생하는 허위 복제 오류를 과거 짧은 염기서열 길이를 기반으로 구축된 유전체와 최근의 긴 길이 염기서열 분석기법을 통해 구축된 참조 유전체 내에서 발견하였다. 그 결과, 짧은 길이 기반의 염기서열 분석법에서 수천개에 달하는 허위 복제 유전자를 발견하였다. 또한 이형접합성 및 염기서열 분석 오류가 허위 복제 오류를 발생시키는 중요한 요인으로 작용 한다는 것을 확인하였으며, 이를 통해 향후 참조유전체 구축 시 허위 복제 오류를 감소시키기 위한 방향을 제시하였다. 뿐만 아니라 허위 복제가 포함된 표준유전체를 바탕으로 이루어진 연구사례를 제시하여, 허위 복제 교정의 중요성을 강조하였다. 제 3장에선 VGP 및 Galaxy Project와의 협업을 통해 최근 각광받는 PacBio HiFi 염기서열 분석법의 이점을 허위 복제 및 손실 두가지 측면에서 PacBio CLR 염기서열 분석방법과 비교하였다. 제 4 장에선 허위 복제 교정 프로그램을 새롭게 개발하였으며, 가상의 유전체를 생산을 통해 기존 허위 복제 교정 프로그램과의 성능을 비교하였다. 새롭게 개발된 프로그램 Purge mers 는 기존의 염기서열 리드 깊이(depth)기반 분석법과 더불어 유전체상의 허위복제 및 손실 여부를 k-mer 단위에서 알 수 있는 K*를 허위 복제 탐색에 이용한다. 그 결과, Purge mers의 성능이 기존의 프로그램보다 뛰어난 몇몇 경우를 발견하였다. 제 5 장에선 유전체상의 높은 GC 비율에 의해 염기서열 리드에서 계산된 k-mer의 빈도가 적게 측정되는 편향을 보정하는 방법론을 제시하였다. 편향이 제거되지 않은 k-mer 측정결과는 GC 비율이 80%이상인 유전체 지역에서 K*가 -1 일때의 빈도가 가장 높은 결과를 나타냈다. 반면, 이 연구에서 제시한 편향이 제거된 k-mer 측정결과는 GC 비율이 80%이상인 유전체 지역에서 K*가 0 일때의 빈도가 가장 높은 결과를 나타냈다. 앞선 연구결과들을 종합하여 정리하자면 이 연구에서는 허위 복제 오류 교정의 중요성을 강조하였으며, 최적화된 염기서열 해독 기법 및 유전체 구축 방법 제시, 프로그램 및 방법론 개발 등을 통해 표준유전체 내 허위 복제 오류 해결방법을 제안하였다.