한국인 표준게놈지도, '코레프' 완성됐다

오희나 기자I 2016.11.24 19:00:00

UNIST 박종화 교수팀, Nature Communications 24일 게재
한국인 41명 게놈 정보 통합.."정확한 질병 원인 예측 기대"

박종화 교수가 한국인 최초 표준 게놈지도인 코레프에 대해 설명하고 있다.
[이데일리 오희나 기자] 한국인을 대표하는 표준 게놈지도가 나왔다. 전국 각지에 사는 한국인 41명의 게놈 정보가 통합된 ‘국민 대표 게놈지도’다. 한국인의 특이적 질병연구에 가속도가 붙을 전망이다.

UNIST 게놈연구소가 국민 표준 게놈지도 ‘코레프(KOREF: KORean REFerence)’를 네이처 커뮤니케이션(Nature Communications) 24일자에 공개했다.

코레프는 울산에서 추진 중인 ‘게놈 코리아 프로젝트’의 일부로, 정밀 의료 기술 개발에 활용될 빅데이터다. 이 자료는 한국인을 대표하는 유전적인 특징으로서 한국인 ‘참조표준’으로도 활용될 예정이다.

이번 논문의 제1저자인 조윤성 UNIST 생명과학부 박사과정 연구원은 “코레프는 한국인 41명의 게놈 정보를 통합해 공통 게놈 서열을 융합하는 새로운 기법으로 제작됐다”며 “세계 최초로 인구집단을 대표하는 표준 게놈지도를 만들었다는 점이 가장 큰 특징”이라고 강조했다.

박종화 교수팀은 한국인 41명의 게놈을 이용해, 약 30억 개의 염기서열을 한국인의 고유한 특징이 드러나도록 정리했다.

인간 게놈지도는 2003년 인간 게놈 프로젝트(Human Genome Project)를 통해 완성됐다. 그러나 백인 중심의 자료라 인종별 특징을 제대로 담지 못했다. 2009년 중국에서 중국인 1명과 흑인 1명의 게놈지도 초안을 발표했지만, 완성도와 정확도가 낮아 활용도가 적었다.

기존 백인 중심의 인간 표준 게놈(GRCh38)을 기준으로 삼으면, 30억쌍의 염기서열 가운은 한국인 1명의 돌연변이 수치가 400만 개로 나타난다. 그런데 코레프를 활용하자 이 수치가 300만 개로 25% 감소했다.

이는 100만 개의 돌연변이가 단순히 인종 차이에서 발생한다는 걸 보여준다.

박종화 교수는 “인종 차이로 인한 돌연변이와 질병에 따른 돌연변이를 구분하는 일은 정확한 질병 원인 규명과 예측에 반드시 필요하다”며 “한국 국민의 대표성을 갖춘 최초의 표준 게놈지도, 코레프는 국민 건강에도 크게 기여할 것”이라고 밝혔다.

표준 게놈지도의 작성은 두 단계를 거친다. 먼저 첨단 DNA 해독기를 통해 다양한 종류의 게놈 정보를 생산한다. 이후 ‘생정보학(Bioinformatics)’ 기술을 적용해 컴퓨터로 게놈지도를 완성한다.

코레프는 이미 공개된 9개의 다른 인간 표준 게놈지도와 정밀하게 비교, 분석됐다. 표준게놈을 서로 비교하면 기존에 알 수 없던 민족 간 게놈 차이가 극명하게 드러난다. 예를 들어, 미국인은 가지고 있지만 한국인에겐 없는 염색체상의 큰 영역을 더 쉽게 찾을 수가 있는 것이다. 이런 결손 영역에 중요한 유전자가 있을 경우, 질병에 걸릴 확률이 올라갈 수 있다.

특히 이번 연구는 게놈지도 작성의 대중화도 이끌 것으로 보인다. 기존 인간 표준 게놈지도는 13년간 3조원을 들여서 완성됐지만, 코레프는 아주 적은 비용으로 게놈을 매우 정확히 조립하는 데 성공한 것이다.

박 교수는 “코레프는 지금까지 나온 표준 게놈지도 중에서 가격 대비 정확도가 가장 높다”며 “모든 인간이 각자의 게놈 정보를 갖고, 일반인도 정밀한 게놈지도를 가지게 되는 미래를 앞당기는 기술이 될 것”이라고 말했다.

채균식 한국표준과학연구원 국가참조표준센터장은 “코레프는 국가참조표준체계에 따른 엄격한 표준절차와 평가를 거쳐 제작했다”며 “신뢰도와 정확도가 확보된 데이터로 국가참조표준으로 등록될 예정”이라고 말했다. 국가 참조표준은 국가사회의 모든 분야에서 널리 지속적으로 사용되거나 반복사용이 가능한 국가 공인 자료다.

UNIST 게놈연구소가 공개한 코레프는 한국표준게놈지도 홈페이지(http://koreanreference.org)에서 내려받을 수 있다. 미국 국가생명정보센터(NCBI)에서도 KOREF(Korean Reference Genome)란 이름으로 확인 가능하다.

지난 2014년 7월 개소된 UNIST 게놈연구소는 표준 게놈지도의 정밀화와 활용을 통해 게놈 산업기술의 국산화를 위해 연구 중이다. 2015년 울산시와 공동으로 만 명 이상의 한국인 게놈을 해독, 분석하는 ‘게놈 코리아 프로젝트’를 추진하고 있다.

게놈해독기에서 나온 짧은 서열을 오버랩 정보를 활용해 컨티그로 조립한다. 조립된 컨티그는 긴 짝서열 데이터(점핑 라이브러리)를 활용해 스캐폴드 수준으로 확장되고, 옵티컬 맵핑 데이터를 활용해 슈퍼 스캐폴드 수준으로 확장된다. 이후 긴 서열을 활용한 갭 클로징 작업과 맵핑 데이터를 활용한 정확도 검증을 하고, 염색체 맵핑, 한국인 공통서열 치환 과정을 거쳐, 최종의 참조표준 게놈지도가 완성됐다. UNIST 제공


주요 뉴스

ⓒ종합 경제정보 미디어 이데일리 - 상업적 무단전재 & 재배포 금지