본문 바로가기
BT/Lab

NCBI에서 계통수 phylogenetic tree 만들기 / Orthologs / COBALT

by 르미르미 2021. 5. 27.

계통수 (phylogenetic tree)는 생물이 진화의 결과 여러 종이나 분류군 사이에서 나타나는 신체적이거나 유전적 특징의 유사성과 차이를 바탕으로 친연 관계를 수형도로 나타낸 다이어그램이다.-위키

 

NCBI에서 Phylogenetic tree 만들기에 대해서 해보도록 하겠다! 

-

 

1. NCBI에서 내가 궁금한 gene 검색하기 

그냥 All databases로 검색해도 되고 아래의 링크의 homologene으로 해서 검색해도 된다. 

 

Home - HomoloGene - NCBI

 

www.ncbi.nlm.nih.gov

요즘 human corona virus spike protein (SARS-CoV-2 등)의 receptor로 잘 알려진 ACE2를 가지고 계통수를 만들어보도록 하겠다. 

 

먼저 ACE2 검색하기

그러면 이렇게 gene 정보가 뜨고 orthologs를 클릭하면 된다. 

ACE2에 관한 간단한 정보와 함께 orthoogs 정보가 나오게 된다. 

자세히 보면 다양한 종이 있고 이때 내가 비교하고자 하는 종을 클릭 클릭해서 protein alignment를 누른다. 

one sequence per gene인지 all sequences per gene인지 선택하고 align 누르면 

아래와 같은 화면이 나온다. 

위와 같이 내가 클릭한 종들의 protein ID가 들어간다. 

protein ID에 관한 정보가 모두 있다면 그 정보를 넣어서 align할 수 있다.

또한 내가 원하는 종에 어떤 variant가 있을때 내가 원하는 variant의 ID를 넣을 수도 있다. 

 

Align 버튼을 누르면~

위와 같은 화면을 만날 수 있다.

conserve된 sequence에 관한 정보를 얻을 수 있다. 

ACE2는 위와 같이 conserve 되어 있다. 

이 때, phylogenetic tree 를 만드려면 phylogenetic tree 버튼을 누르면 된다! 

이렇게 완성~~

format (Rectangle, Circular..)이나 기타 등등 설정은 오른쪽 클릭으로 가능하고 export도 다 된다~~~ 

 

 

COBALT:Multiple Alignment Tool

0.6 0.65 0.7 0.75 0.8 0.85 0.9 0.95 [?] Maximum allowed distance between two sequences in a cluster. This threshold prvents COBALT from forming clusters o unrelated sequences. The distance between two sequences is computed as a fraction of words that appea

www.ncbi.nlm.nih.gov

ID에 대한 정보가 모두 있다면 바로 위의 링크로 들어가서 align을 진행하면 된다~ 

 

 

Reference

위키피디아-Pulves 외, 이광웅 외 역, 생명 생물의 과학, 2006, 교보문고, ISBN 89-7085-516-5, 제 3부 진화의 과정, 제 23장 계통의 재구성과 활용

댓글