# **Blast**

O Blast (Basic Local Alignment Search Tool), que do inglês siginifica "Ferramenta básica de pesquisa de alinhamento local", é um algoritmo muito utilizado na Bioinformática e como seu já sugere, este realiza um outro tipo alinhamento, o alinhamento local.

O Blast realiza o alinhamento de regiões da sequência alvo ou de interesse do usuário comparando-as com as sequências depositadas no banco de dados, seja de proteínas ou DNA. Além disso, o fato de ser um alinhamento local permite realizar inferências evolutivas, ou seja, é possível verificar a homologia entre as sequências.

Existem algumas variações do Blast. O usuário pode realizar: 

* uma consulta ao banco de dados de nucleotídeos utilizando uma sequência de consulta também de nucleotídeos (Blastn); 

* uma consulta ao banco de dados de proteínas utilizando uma sequência de consulta de aminoácidos (Blastp);

* uma consulta ao banco de dados de proteínas utilizando uma sequência de consulta de nucleotídeos (Blastx);

* uma consulta ao banco de dados de proteínas utilizando uma sequência de nucleotídeos traduzida (tBlastn);

* uma consulta ao banco de dados de nucleotídeos traduzidos usando uma sequência consulta de nucleotídeo traduzida (tblastx).

Vejamos exemplo de códigos para cada uma dessas variações.

#### Blastn

In [1]:
from Bio.Blast import NCBIWWW, NCBIXML

# Realizando uma pesquisa BLASTN com a sequência de entrada
fasta_string = ">Minha sequência de teste\nACCGGCCAGATCTCGATGCTGGCGGGTCTCAGATTCGAGAATCTA"
result_handle = NCBIWWW.qblast("blastn", "nt", fasta_string)

# Analisando os resultados do BLASTN
blast_record = NCBIXML.read(result_handle)
for alignment in blast_record.alignments:
    for hsp in alignment.hsps:
        print("****Alinhamento****")
        print("Sequência: ", alignment.title)
        print("Tamanho do alinhamento: ", alignment.length)
        print("Score: ", hsp.score)
        print("Identidade: ", hsp.identities)
        print("E-value: ", hsp.expect)

****Alinhamento****
Sequência:  gi|1511273659|gb|CP029520.1| Leishmania donovani strain LdCL chromosome LdCL_21, complete sequence
Tamanho do alinhamento:  764178
Score:  90.0
Identidade:  45
E-value:  1.77071e-12
****Alinhamento****
Sequência:  gi|1371035928|gb|CP027820.1| Leishmania infantum strain TR01 isolate Lin_TR01 chromosome 21, complete sequence
Tamanho do alinhamento:  762179
Score:  90.0
Identidade:  45
E-value:  1.77071e-12
****Alinhamento****
Sequência:  gi|1229082202|gb|CP022636.1| Leishmania donovani strain pasteur chromosome 21, complete sequence
Tamanho do alinhamento:  770314
Score:  90.0
Identidade:  45
E-value:  1.77071e-12
****Alinhamento****
Sequência:  gi|1143012453|gb|CP019529.1| Leishmania donovani strain MHOM/IN/1983/AG83 isolate late passage chromosome 21, partial sequence
Tamanho do alinhamento:  760147
Score:  90.0
Identidade:  45
E-value:  1.77071e-12
****Alinhamento****
Sequência:  gi|1143012273|gb|CP018588.1| Leishmania donovani strain MHOM/IN/1983/AG83 

#### Blastp

In [2]:
from Bio.Blast import NCBIWWW, NCBIXML

# Realizando uma pesquisa BLASTP com a sequência de entrada
fasta_string = ">Minha sequência de teste\nAEAAEAPISYDNPLIIISVLK\
                                            GSYIFTSDFIRYLGDCGLPH\
                                            VVDFVRLASYNSGTKSTGQI\
                                            SMLAGLRFENLRGKHVLIVE\
                                            DVCDSGRTLRFLRDYIMEKF\
                                            QPKSIKTLVMVNKEQAARKV\
                                            DFD\n"
result_handle = NCBIWWW.qblast("blastp", "nr", fasta_string)

# Analisando os resultados do BLASTP
blast_record = NCBIXML.read(result_handle)
for alignment in blast_record.alignments:
    for hsp in alignment.hsps:
        print("****Alinhamento****")
        print("Sequência: ", alignment.title)
        print("Tamanho do alinhamento: ", alignment.length)
        print("Score: ", hsp.score)
        print("Identidade: ", hsp.identities)
        print("E-value: ", hsp.expect)

****Alinhamento****
Sequência:  ref|XP_003392448.1| xanthine phosphoribosyltransferase [Leishmania infantum JPCM5] >gb|AAD50967.1| xanthine phosphoribosyltransferase XPRT [Leishmania donovani] >emb|CAC9485907.1| xanthine_phosphoribosyltransferase [Leishmania infantum] >gb|AYU78560.1| xanthine phosphoribosyltransferase [Leishmania donovani] >emb|CAC5429833.1| xanthine_phosphoribosyltransferase|GeneDB:LmjF.21.0850 [Leishmania donovani] >emb|CBZ08611.1| xanthine phosphoribosyltransferase [Leishmania infantum JPCM5]
Tamanho do alinhamento:  241
Score:  654.0
Identidade:  124
E-value:  3.21488e-84
****Alinhamento****
Sequência:  ref|XP_003860616.1| xanthine phosphoribosyltransferase [Leishmania donovani] >gb|TPP49324.1| Phosphoribosyl transferase domain family protein [Leishmania donovani] >emb|CBZ33911.1| xanthine phosphoribosyltransferase [Leishmania donovani]
Tamanho do alinhamento:  241
Score:  649.0
Identidade:  123
E-value:  2.09021e-83
****Alinhamento****
Sequência:  ref|XP_003875332

#### Blastx

In [3]:
from Bio.Blast import NCBIWWW, NCBIXML

# Realizando uma pesquisa BLASTX com a sequência de entrada
fasta_string = ">Minha sequência de teste\nATGAGTGTCGTAGTCGATGCTAGCTAGCT\
                  AGTCAGCTGACGATGCTAGTCGATGCTAGTC\n"
result_handle = NCBIWWW.qblast("blastx", "nr", fasta_string)

# Analisando os resultados do BLASTX
blast_record = NCBIXML.read(result_handle)
for alignment in blast_record.alignments:
    for hsp in alignment.hsps:
        print("****Alinhamento****")
        print("Sequência: ", alignment.title)
        print("Tamanho do alinhamento: ", alignment.length)
        print("Score: ", hsp.score)
        print("Identidade: ", hsp.identities)
        print("E-value: ", hsp.expect)

#### tBlastn

In [4]:
from Bio.Blast import NCBIWWW, NCBIXML

# Realizando uma pesquisa TBLASTN com as sequências de entrada
query_seq = ">Minha sequência de teste\nMNLKILVFLFLLSFTPNITFLATGLFYT\n"
sbjct_seq = ">Minha sequência de referência\n>gi|15605613|ref|NP_215440.1|\
                  eukaryotic translation initiation factor 4G [Xenopus laevis]\n\
                  MEIKKSKRPLRKRKDSLVPAEDPSEDEEDPSCNPTTQPPRSVSIRSQIKTFTTNNYRPT\
                  KSYLSSDQEDEEDDEDDDDEEDDEEDDEEEDEQDDEDEDDDEDDDEDDDEEDEEEDEDDDE\
                  EEDDDEDDDEDDDEDDDEDDDEEDDEEDEEEEDEEEDEEEEEEEEEEKKKDDDDDDDKS\
                  SKSSVRGGRRRGKGSQQ\n"
result_handle = NCBIWWW.qblast("tblastn", "nr", query_seq, sbjct_seq)

# Analisando os resultados do TBLASTN
blast_record = NCBIXML.read(result_handle)
for alignment in blast_record.alignments:
    for hsp in alignment.hsps:
        print("****Alinhamento****")
        print("Sequência: ", alignment.title)
        print("Tamanho do alinhamento: ", alignment.length)
        print("Score: ", hsp.score)
        print("Identidade: ", hsp.identities)
        print("E-value: ", hsp.expect)

ValueError: unknown url type: '>Minha sequência de referência\n>gi|15605613|ref|NP_215440.1|                  eukaryotic translation initiation factor 4G [Xenopus laevis]\n                  MEIKKSKRPLRKRKDSLVPAEDPSEDEEDPSCNPTTQPPRSVSIRSQIKTFTTNNYRPT                  KSYLSSDQEDEEDDEDDDDEEDDEEDDEEEDEQDDEDEDDDEDDDEDDDEEDEEEDEDDDE                  EEDDDEDDDEDDDEDDDEDDDEEDDEEDEEEEDEEEDEEEEEEEEEEKKKDDDDDDDKS                  SKSSVRGGRRRGKGSQQ'

#### tBlastx

In [None]:
from Bio.Blast import NCBIWWW, NCBIXML

# Realizando uma pesquisa TBLASTX com as sequências de entrada
query_seq = ">Minha sequência de teste\nATGAGTGTCGTAGTCGATGCTAGCTAGCT\
                  AGTCAGCTGACGATGCTAGTCGATGCTAGTC\n"
sbjct_seq = ">Minha sequência de referência\nATGCGTCTCGTAGTCGACTGCTAGCTAGC\
                  TCGTAGCTGACTGATGCTAGCTGATGCTAGCT\n"
result_handle = NCBIWWW.qblast("tblastx", "nr", query_seq, sbjct_seq)

# Analisando os resultados do TBLASTX
blast_record = NCBIXML.read(result_handle)
for alignment in blast_record.alignments:
    for hsp in alignment.hsps:
        print("****Alinhamento****")
        print("Sequência: ", alignment.title)
        print("Tamanho do alinhamento: ", alignment.length)
        print("Score: ", hsp.score)
        print("Identidade: ", hsp.identities)
        print("E-value: ", hsp.expect)