clustalw로 여러 염기서열을 alignment하기

2023. 1. 11. 11:11리눅스

728x90
반응형

비슷한 DNA 염기서열이나 단백질 아미노산서열을 alignment하여 차이나는 부분과 일치하는 부분을 각각 확인하기 쉽도록 sequence alignment하는 방법 중 가장 대표적인 방법이 clustalw이다. Clustal Omega는 웹에서도 작동되어서 염기서열을 직접 복사 붙여넣기로 입력하거나 파일을 업로드하여 웹에서 돌릴 수도 있다. 장점은 프로그램을 설치하지 않아도 되고 명령어를 몰라도 쉽게 사용할 수 있지만, 단점은 염기서열의 크기가 클 경우에는 업로드 및 작동이 되지 않는다. https://www.ebi.ac.uk/Tools/msa/clustalo/

 

Clustal Omega < Multiple Sequence Alignment < EMBL-EBI

Clustal Omega is a new multiple sequence alignment program that uses seeded guide trees and HMM profile-profile techniques to generate alignments between three or more sequences. For the alignment of two sequences please instead use our pairwise sequence a

www.ebi.ac.uk

자신의 리눅스 컴퓨터에 clustalw를 설치하여 직접 수행할 수도 있다. 장점은 업로드 시간도 없어서 바로 분석이 가능하고 컴퓨터 사양에 따라서 큰 용량의 염기서열도 분석가능하다.

 

1. clustalw 설치

기본적으로 홈페이지에서 자신의 운영체제에 맞는 설치 파일을 다운로드 받아서 설치 가능하다. http://www.clustal.org/clustal2/

 

Clustal W and Clustal X Multiple Sequence Alignment

ups...you need javascript to uncloak the email Clustal is currently maintained at the Conway Institute UCD Dublin by Des Higgins, Fabian Sievers, David Dineen, and Andreas Wilm. You can reach us at If you want to report a bug please make sure, that you are

www.clustal.org

 

또는 명령어를 이용해서 설치 가능하다. (우분투 기준)

sudo apt-get update

sudo apt-get -y install clustalw

 

2. 명령어

clustalw [-infile] 분석파일.fasta [옵션]

기본적으로 clustalw 분석파일.fasta 로 진행하면 되지만, 추가적인 옵션을 넣을 수도 있다. https://manpages.ubuntu.com/manpages/jammy/man1/clustalw.1.html

 

Ubuntu Manpage: clustalw - Multiple alignment of nucleic acid and protein sequences

Powered by the Ubuntu Manpage Repository, file bugs in Launchpad © 2019 Canonical Ltd. Ubuntu and Canonical are registered trademarks of Canonical Ltd.

manpages.ubuntu.com

 

분석을 진행하면 다음과 같이 진행된다.

리눅스 터미널에서 분석이 진행되는 모습

분석이 끝나면 guide tree 파일인 dnd파일과 alignment 파일인 aln파일이 나온다. aln파일을 MEGA와 같은 염기서열 관련 프로그램이나 따로 사용하는 것이 없다면 메모장(텍스트)에서 열어보면 된다.

clustalw 결과

 

728x90
반응형