# **Alinhamento de Sequências**

### Alinhamento **_Pairwise_**

No Biopython temos a possibilidade de realizar um alinhamento par a par entre duas sequências utilizando o algoritmo **Needleman-Wunsch**. Este algoritmo cria uma matriz de penalidade na qual um _gap_ e ou a não correspondência entre um par de nucleotídeos ou de amininoácidos são penalisados. Assim, de acordo com a melhor pontuação (**_Score_**) será retornado o melhor alinhamento.

In [1]:
from Bio.pairwise2 import align
from Bio.pairwise2 import format_alignment

seq1 = "MKQHKAMIVALIVICITAVVAALVTRKDLCEVHIRTGQTEVAVF"
seq2 = "MKK--KLVIALIVICITAVVAALVTRYDLCKVHIRTGQTEVAVF"

alignments = align.globalxx(seq1, seq2)
print(format_alignment(*alignments[0]))

MKQHKAMI----V-ALIVICITAVVAALVTRK-DLCE-VHIRTGQTEVAVF
||  |   ||  | |||||||||||||||||  |||  |||||||||||||
MK--K-----KLVIALIVICITAVVAALVTR-YDLC-KVHIRTGQTEVAVF
  Score=37





A função **format_alignment** permite que a saída seja formatada para que sejam exibidas as correspondências, gaps (ou lacunas) bem como a semelhanças entre duas bases nucleotídicas ou aminoácidos.

Os gaps são representados por ífens (**-**), enquanto que as correspondências entre os aminoácidos são representados por barras (**|**). Se houvessem dois pontos (**:**), então isso significaria que os pares de bases ou de aminoácidos são semelhantes, mas não iguais (por exemplo, se os aminoácidos fenilalanina e tirosina estivessem alinhados), demonstrando assim a correspondência entre similares.

### Alinhamento múltiplo utilizando o **_ClustalW_** e o **_Muscle_**

Os algoritmos _ClustalW_ (http://www.clustal.org/) e _Muscle_ (http://www.drive5.com/muscle/) são de alinhamento múltiplo, ou seja, permitem que o usário realize o alinhamento de duas ou mais sequências. Ambos algoritmos realizam alinhamento global, assim as sequências são alinhadas em sua totalidade a fim de se encontrar a correspndência global entre elas.

#### Executando o ClustalW

Para utilizar o Clustal, será necessário instalar o programa eu seu desktop. Para isso, acesse a página de downloads do site oficial do Clustal: http://www.clustal.org/download.

Se você utiliza o sistema operacional Windowns, faça o download do executável (clustalw-2.1-win.msi) e execute-o como administrador. Siga os passos para instalação e após instalado siga os próximos passos do notebook.

Você também pode instalar o ClustalW através do gerenciador Anaconda (https://anaconda.org/bioconda/clustalw), desde que você tenha também instalado em seu desktop o Anaconda.

In [2]:
# Importar a biblioteca BioPython
from Bio import AlignIO
from Bio.Align.Applications import ClustalwCommandline


# Criar um objeto ClustalwCommandline com o caminho do executável do ClustalW e o nome do arquivo de entrada
clustalw = ClustalwCommandline("clustalw2", infile="query_3.fasta")

# Executar o comando Clustalw e capturar a saída e o erro
stdout, stderr = clustalw()

# Ler o arquivo de alinhamento gerado pelo Clustalw no formato clustal
align = AlignIO.read("query_3.aln", "clustal")

# Imprimir o alinhamento na tela
print(align)

Alignment with 5 rows and 306 columns
MGSSHHHHHHDYDIPTTENLYFQGHMASMTGGQQMGRGSHSGHP...--- 6AR9_B
MGSSHHHHHHDYDIPTTENLYFQGHMASMTGGQQMGRGSHSGHP...--- 6AQO_A
MGSSHHHHHHDYDIPTTENLYFQGHMASMTGGQQMGRGSHSGHP...--- 7SCR_A
------------MLPT--------------------------HS...--- AAD50967.1
--------------------------------------------...SKY 1TC1_A


Ao abrir o arquivo **_query_3.aln_** você notará que na presença de asteríscos (*) significa que ouve correspondência entre todos os aminoácidos naquela posição. Quando há dois pontos (:) os aminoácidos não são iguais, porém há uma alta correspondência. No caso da presença de pontos (.), significa que os aminoácidos não possuem correspondência.

* Nota: Estes caractéres também são aplicados em um alinhamento de sequências de nucleotídeos.

#### Executando o Muscle

Para utilizar o Muscle, será necessário instalar o programa eu seu desktop. Para isso, acesse a página de downloads do site oficial do Muscle: https://www.drive5.com/muscle/.

Se você utiliza o sistema operacional Windowns, faça o download do executável (muscle5.1.win64.exe) e execute-o como administrador. Siga os passos para instalação e após instalado siga os próximos passos do notebook.

Você também pode instalar o Muscle através do gerenciador Anaconda (https://anaconda.org/bioconda/muscle), desde que você tenha também instalado em seu desktop o Anaconda.

In [3]:
from Bio.Align.Applications import MuscleCommandline
from Bio import SeqIO
from Bio import AlignIO

# Leitura das sequências do arquivo fasta
sequences = SeqIO.parse("query_3.fasta", "fasta")

# Executando o MUSCLE para alinhamento das sequências
muscle_cline = MuscleCommandline(input="query_3.fasta")
stdout, stderr = muscle_cline()

# Gravando o resultado do alinhamento em um arquivo fasta
with open("alinhamento.fasta", "w") as file:
    file.write(stdout)

align = AlignIO.read("alinhamento.fasta", "fasta")
print(align)

Alignment with 5 rows and 306 columns
--------------------------------------------...SKY 1TC1_A
------------MLPTHSCKGFV---------------------...AKL AAD50967.1
MGSSHHHHHHDYDIPTTENLYFQGHMASMTGGQQMGRGSHSGHP...SKL 7SCR_A
MGSSHHHHHHDYDIPTTENLYFQGHMASMTGGQQMGRGSHSGHP...SKL 6AQO_A
MGSSHHHHHHDYDIPTTENLYFQGHMASMTGGQQMGRGSHSGHP...SKL 6AR9_B
