염기서열(2)
-
clustalw로 여러 염기서열을 alignment하기
비슷한 DNA 염기서열이나 단백질 아미노산서열을 alignment하여 차이나는 부분과 일치하는 부분을 각각 확인하기 쉽도록 sequence alignment하는 방법 중 가장 대표적인 방법이 clustalw이다. Clustal Omega는 웹에서도 작동되어서 염기서열을 직접 복사 붙여넣기로 입력하거나 파일을 업로드하여 웹에서 돌릴 수도 있다. 장점은 프로그램을 설치하지 않아도 되고 명령어를 몰라도 쉽게 사용할 수 있지만, 단점은 염기서열의 크기가 클 경우에는 업로드 및 작동이 되지 않는다. https://www.ebi.ac.uk/Tools/msa/clustalo/ Clustal Omega < Multiple Sequence Alignment < EMBL-EBI Clustal Omega is a new m..
2023.01.11 -
bcftools를 이용해서 BAM파일로부터 공통염기배열(consensus sequence) 생성하기
NGS분석을 진행하면 mapping결과 BAM파일이 생성된다. BAM파일은 SAM파일을 binary형태로 바꾼 파일로, reference genome과 위치 정보를 불러와서, NGS로 sequencing한 조각들이 각각 어디에 위치하게 되는 것인지, reference genome과 sequence차이(SNP, InDel 등)이 어떻게 나타나는지 등을 확인 가능하다. BAM파일은 여러 가지 조각들을 reference genome에 맞춰서 배열한 것이기 때문에 용량도 크고, 단일 염기서열의 파일인 fa나 fasta파일과는 차이가 있다. BAM파일을 분석한 결과, 해당 분석이 잘 진행되어서 BAM을 통해서 reference genome이 아닌 분석된 샘플의 유전체에 대한 예상되는 염기서열을 추출하고 싶을 때는..
2022.12.06