# Curso Introdução à Programação para Bioinformática com Python

## Módulo - Biopython


### Declarando uma sequências com biopython

In [2]:
from Bio.Seq import Seq
# Do pacote de análise de sequência (Bio.Seq) importa o módulo de análise de sequência (Seq)
# É válido frisar que em Biopython sequência são declaradas como objetos.

In [3]:
minha_primeira_sequencia = Seq("ATGAATTGCCGCGGT")
# crie uma variável que recebe do método Seq a sequência

print (minha_primeira_sequencia)
#imprimir a variável

ATGAATTGCCGCGGT


### Complementar e reverso complementar

In [6]:
seq_complementar = minha_primeira_sequencia.complement()
# A partir da variável existente, gera uma segunda variável que receberá do método complement() a seqência complementar da 
# 1ª variável.

print(seq_complementar)

TACTTAACGGCGCC


In [8]:
reversa_complementar = minha_primeira_sequencia.reverse_complement()
# Esse código gera a sequência reversa complementar da 1ª variável ao usar o métod reverse_complement.

print(reversa_complementar)

CCGCGGCAATTCAT


![image.png](attachment:image.png)

### Transcrição com Biopython

In [20]:
print("Minha Sequência de DNA: ", minha_primeira_sequencia)
seq_rna = minha_primeira_sequencia.transcribe()
# A partir do método transcribe() geramos transcrição da 1ª variável para RNA.
print()
print("Minha Sequência de RNA: ", seq_rna)

Minha Sequência de DNA:  ATGAATTGCCGCGGT

Minha Sequência de RNA:  AUGAAUUGCCGCGGU


In [21]:
seq_dna = seq_rna.back_transcribe()
# A partir da variável (seq_rna) aplicamos o método back_transcribe() para obter o DNA dessa sequência de RNA.
# O método back_transcribe() é como se fosse uma transcriptase reversa.
print(seq_dna)

ATGAATTGCCGCGGT


![image.png](attachment:image.png)

### Tradução com Biopython

In [23]:
my_seq = Seq ("ATG")
seq_rna = my_seq.transcribe()

seq_proteina = seq_rna.translate()
# o método translate() fará a tradução da sequência de RNA

print(seq_proteina)
# A impressão de uma único aminoácido Metionina (M). 

M


In [24]:
seq_dna = seq_rna.back_transcribe()
seq_proteina_dna = seq_dna.translate()
# o método translate() fará a tradução da sequência de DNA
print(seq_proteina_dna)

M


### Analisando arquivos FASTA

In [26]:
from Bio import SeqIO
# Importando o módulo de análise de arquivo FASTA

In [30]:
for f in SeqIO.parse("my_seq.fasta","fasta"):
    # nesse laço temos a definição do nome do arquivo e o argumento colocamos o tipo de arquivo
    print (fasta.id)
    print ()
    print (fasta.seq)

Titulo_cabecalho_sequencia

CGATCGATCGACTATCAGCATCGATCG


### Estrutura de proteína com Biopython

Busque uma sequência de proteína no [PDB](https://www.rcsb.org/). Exemplo, pesquise o id **1BGA**.
 - Instrução: faça download no formato PDB (.pdb) e salva o arquivo no mesmo diretório onde está o script/código.

In [32]:
from Bio.PDB import *
# Bio.PDB é um módulo que permite a manipulação de estruturas de proteínas salva no formato PDB. 
# Ele foi desenvolvido por Thomas Bernard Mandelbrot.

In [38]:
parser = PDBParser()
estrutura = parser.get_structure("1BGA","pdb1bga.ent")



In [39]:
modelo = estrutura[0]
cadeia_A = modelo['A']
residuo_100 = cadeia_A[100]
ca_residuo_100 = residuo_100['CA']
atomo_101 = estrutura[0]['A'][101]['CA'] # resumão do que foi feito anteriormente, ao criar as variáveis (modelo, cadeia_A, 
# residuo_100, ca_residuo_100), mas, considerando outro carbono (CA) na posição 101.

#Cálculo da distância Euclidiana
distancia = atomo_101 - ca_residuo_100
print(distancia)

3.7942057
