[![Open In Colab](https://colab.research.google.com/assets/colab-badge.svg)](https://colab.research.google.com/github/alessandronascimento/BioMolComp/blob/main/P02/Pratica_02C.ipynb)

# Alinhamento de um Par de Sequências de Proteínas Usando Matriz de Substituição

Nesta seção vamos fazer um novo alinhamento. Desta vez, usaremos a matriz de
substituição BLOSUM62 para alinhar as sequências de duas proteínas. 

Primeiramente, instalaremos o BioPython e definiremos nossa matriz de substituição como a matriz BLOSUM62. Esta matriz ficará definida no objeto *aligner*.

In [None]:
!pip3 install biopython
import sys, os
from Bio import Align

from Bio.Align import substitution_matrices

matrix = substitution_matrices.load("BLOSUM62")
# print(matrix)
aligner = Align.PairwiseAligner()
aligner.substitution_matrix = matrix

## Entrada de Sequências

Aqui faremos a entrada com as sequências que queremos alinhar. A matriz de substituição possui um dicionário para lidar com os 20 tipos de aminoácidos. Caracteres outros que apareçam na sequência resultarão em erro. Para evitar os erros, também substituiremos (removeremos) os espaços eventualmente presentes na sequência.

In [None]:
seq1 = "" #@param {type:"string"}
seq2 = "" #@param {type:"string"}

seq1 = seq1.replace(' ', '')
seq2 = seq2.replace(' ', '')

print("A sequencia 1 tem %d residuos" % len(seq1))
print("A sequencia 2 tem %d residuos" % len(seq2))


# Alinhamento Local

Nesta etapa fazemos o alinhamento (local) das duas sequências. 

In [None]:
aligner.mode = 'global'
alignments = aligner.align(seq1, seq2)

print(alignments[0])

score = aligner.score(seq1, seq2)
print("Score = %d" % score)
print("Algoritmo: %s" % aligner.algorithm)

# Análise do Resultado

1. Experimente alinhar a sequência do [receptor de mineralocorticóide humano](https://www.ncbi.nlm.nih.gov/protein/AAA59571.1?report=fasta) com a sequência do [receptor de progesterona humano](https://www.ncbi.nlm.nih.gov/protein/AAA60081.1?report=fasta) usando o algoritmo de PD **global**. O alinhamento que você obteve é razoável? Por que?

2. Altere o algoritmo para o modo **local**. Que diferenças você pôde
observar? O que podemos concluir até agora sobre as duas sequências?

3. Experimente aumentar o peso do *gap* para −10, utilizando o próximo campo
do Google Colab. O que mudou no alinhamento obtido? O que podemos
concluir sobre o alinhamento das duas proteínas ? O que as diferenças
no código nos ensinam sobre o alinhamento de sequências?
(**Q4**)

# Alinhamento Local - Parte 2

Aqui, repetimos o alinhamento local, mas definimos manualmente o escore para a abertura de um gap e para a extensão do gap.

In [None]:
aligner.mode = 'global'
aligner.open_gap_score = -10
aligner.extend_gap_score = -0.5
alignments = aligner.align(seq1, seq2)

print(alignments[0])

score = aligner.score(seq1, seq2)
print("Score = %d" % score)
print("Algoritmo: %s" % aligner.algorithm)