Bioinformatics(10)
-
[BioPython] BLAST
0. BLAST란? BLAST란 Basic Local Alignment Search Tool의 줄임말이다. 쉽게 말해서, 내가 알고 있는 Seq와 유사한 Seq가 있는지 찾아주는 알고리즘이다. "바이오파이썬으로 만나는 생물정보학"에 좋은 예시가 있어, 여기서 설명한다. 어떤 질병이 있는 환자 A가 있다. 우리는 이 질병이 어떤 seq가 변이가 되어, 생긴 건지 알고 싶다. 따라서, 환자의 seq를 채취해 , sequencing 회사에 보냈다. 결과 파일을 받았고, Alignment 한 결과, 인간의 genome과 matching 되지 않는 부분이 있음을 발견했다. 그렇다면, 이 부분은 과연 어떤 종에서 유래된 seq란 말인가? 이때, BLAST를 이용한다. BLAST결과 streptococcus pneu..
2024.09.18 -
[BioPython] FASTA,FASTQ,GENBANK : SeqIO,Entrez
0. SeqIO를 이용하면, SeqRecord 객체가 만들어진다. ■ 단순히 시퀀스만 handling 할 때는 Seq 객체를 생성하고, 추가적인 정보(ID , name)등을 이용하여야 할 때는 SeqRecord 객체를 생성해 준다. SeqRecord 객체를 만드는 방법은 3가지다. 첫 번째, Seq() 객체를 만든 후, SeqRecord(Seq 객체)를 해준다. 두 번째, fasta파일을 SeqIO.read()를 이용해서 만든다. 세 번째, genbank파일을 SeqIO.read()를 이용해 만든다. Entrez는 NCBI에서 온라인으로 데이터를 받아올 때 사용한다.# Entrez 사용방법 from Bio import SeqIO from Bio import Entrez Entrez.email = 본인..
2024.09.13 -
[BioPython] wget을 이용해 github 데이터를 다운받을때
1. 그냥 링크를 이용해서 wget을 하면, 오류가 발생한다. 내가 원하는 데이터 파일이 아닌, 웹 인터페이스 파일이 도착한다. 따라서, 원하는 결과를 얻지 못한다. 2. raw에서 링크를 복사하면, url에 raw가 들어가 있는 것을 볼 수 있다. 이렇게 되어야, 내가 원하는 데이터를 얻을 수 있다.
2024.09.12 -
[BioPython] 1. Seq 객체를 생성
0. 개요 라이브러리: BioPython은 생물학 관련 기능을 제공하는 여러 모듈이 포함된 라이브러리입니다.모듈: Bio.Seq 모듈은 DNA 서열 관련 클래스와 함수들을 제공합니다.클래스: Seq 클래스는 생물학적 서열을 나타내며, 관련 메서드와 속성을 정의합니다.인스턴스: seq = Seq("ATGC")는 Seq 클래스의 인스턴스입니다.속성: seq 인스턴스의 data 속성은 "ATGC"라는 서열 데이터를 저장합니다.메서드: seq.reverse_complement()는 해당 서열의 역상보 서열을 반환하는 메서드입니다. 1. 사용법>>> from Bio.Seq import Seq>>> seq = Seq("ATGaacGGCUGA")>>> seqSeq('ATGaacGGCUGA')>>> # seq to u..
2024.09.11