<a href="https://colab.research.google.com/github/rplop/curso_pet_biologia_2023/blob/main/intro_python_genetica_molecular.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# **I Curso de Verão - PET Biologia UFC**
### **Introdução à programação com Python: explorando as bases da Genética Molecular**

## **Objetivos da oficina**

* Apresentar conceitos básicos da ***programação***.

* Introduzir os fundamentos da linguagem de programação ***Python***.

* Demonstrar a aplicabilidade da programação na manipulação de ***dados de sequência de DNA***.

## **Lógica de programação**


### A travessia do rio

![River Crossing Puzzle](https://upload.wikimedia.org/wikipedia/commons/5/5e/Animation_of_Cabbage%2C_Sheep_and_Dog_Crossing_the_River.png)

### A torre de Hanói

![2](https://upload.wikimedia.org/wikipedia/commons/6/60/Tower_of_Hanoi_4.gif)

### O cubo mágico

![Rubik's Cube|50](https://i84.servimg.com/u/f84/11/20/06/58/cube_s14.jpg)

***Então o que esses problemas têm em comum?***

### Estapas da lógica de programação

* **Decomposição**: dividir o problema em partes menores e mais gerenciáveis;

* **Padronização**: estabelecer regras e convenções que tornem o código mais legível e organizado;

* **Abstração**: simplificar o problema, identificar os elementos essenciais e ocultar os detalhes desnecessários;

* **Algoritmo**: sequência ordenada, finita e objetiva de instruções que leva, passo a passo, à resolução de um determinado problema ou tarefa;

## **Sobre o Python**

O Python é uma linguagem de programação de **alto nível**, de **propósito geral** e **orientada a objetos**.

É uma linguagem **open source** e tem uma **comunidade** bastante ativa e colaborativa.

[Site do Python](https://www.python.org/).

[Manual em português](https://docs.python.org/pt-br/3/).


## **Sobre o Colab**

O Google Colaboratory é um ambiente de desenvolvimento integrado armazenado em **nuvem**;

Permite escrever e executar código Python em **cadernos interativos**.

É possível executar os códigos diretamente do **navegador**, sem a necessidade de instalações e configurações adicionais.


[Mais informações sobre o Google Colaboratory.](https://colab.research.google.com/notebooks/intro.ipynb)

## **O primeiro programa**


Vamos criar um programa que exiba uma mensagem na tela.

Para isso, usaremos a função nativa `print()`.

In [None]:
print("Olá, mundo!")

In [1071]:
## ESCREVA AQUI
## Crie um programa que exiba uma mensagem na tela

*Fazendo de outra maneira...*

Podemos criar uma **variável** e atribuir a ela um **valor**.

Ou seja, vamos *decompor o problema*, dividi-lo em etapas menores.

In [None]:
mensagem="Olá, mundo!"
print(mensagem)

*Qual a vantagem do segundo método?*

Vamos supor que eu queira exibir a mensagem três vezes seguidas...

E se eu quiser mudar o valor dentro dos parênteses?

In [None]:
## Primeiro método: escrevendo diretamente na função
print("Biolgoia")
print("Biolgoia")
print("Biolgoia")

In [None]:
## Segundo método: criando uma variável
disciplina="Biolgoia"
print(disciplina)
print(disciplina)
print(disciplina)

***Mas o que são variáveis?***

## **Variáveis**

**Variável** é um elemento que armazena uma informação (dado). Assim, podemos acessar essa informação a partir de um nome atribuído por nós.

Existem vários tipos de valores que podem ser armazenados e referenciados por uma variável:

* **Números inteiros** (`integer`)
* **Números com casa decimal** (`float`)
* **Textos** (`string`)
* **Valores binários** (`boolean`): True/False

[Mais informações sobre os tipos de dados nativos do Python.](https://docs.python.org/pt-br/3/library/stdtypes.html#built-in-types)

Variáveis são criadas a partir de **instruções de atribuição**.

Vamos criar uma variável e atribuir um valor a ela usando o **operador** de atribuição `=`.

In [1075]:
x=3
# x é um rótulo que eu escolhi arbitrariamente
# = é o operador de atribuição
# 3 é a informação que eu quero armazenar

A função `type()` mostra o tipo de dado que aquela variável armazena.

In [None]:
type(x)

Vamos criar uma variável do tipo texto.

In [None]:
frase="Isto é uma string."          ## Cria a variável e atribui um valor a ela
print(frase)                        ## Exibe o valor da variável
type(frase)                         ## Exibe o tipo de dado da variável

Podemos **reatribuir** o valor de uma variável a qualquer momento.

In [None]:
x=4
print(x)

Os **nomes das variáveis** devem conter apenas letras, números e underscores (`_`).

É importante dar nomes concisos mas significativos para variáveis.

## **Tipos de dados**

Todo os tipos de dados podem sofrer operações e, para isso, utilizamos os **métodos**.

De maneira simplificada, os métodos são **funções associadas** a determinado tipo de dado.

Em outras palavras, métodos são as **ações** que os objetos **realizam** ou **sofrem**.

*Agora vamos conhecer algums tipos de dados e seus métodos.*

### *Strings*

Strings são sequências de **caracteres**.

São sempre declaradas entre **aspas** simples ou duplas.

In [1079]:
dna_seq = "actggatctcgatgattgagtcattggata"

#### Operações básicas com strings

Converter entre maiúsculas e minúsculas usando os métodos `lower()` e `upper()`.

In [None]:
dna_seq=dna_seq.upper()
print(dna_seq)

**Concatenar** strings usando o operador `+`

In [None]:
codon1="TGA"
codon2="TTC"
codon3="GCT"
sequencia=codon1+codon2+codon3
print(sequencia)

**Calcular o tamanho** da string (número de caracteres) usando a função `len()`.

In [None]:
tam_seq=len(dna_seq)
print(tam_seq)

[Mais informações sobre strings na documentação oficial do Python.](https://docs.python.org/pt-br/3/tutorial/introduction.html#strings)

### Números

Existem dois tipos de **dados númericos**: os números inteiros (*int*) e os números de ponto flutuante (*float*).

#### Operações básicas com números

As operações em Python respeitam as **regras algébricas**.

In [None]:
# Adição
print(1+2)

In [None]:
# Subtração
print(6-2)

In [None]:
# Multiplicação
print(2*4)

In [None]:
# Divisão
print(9/2)

In [None]:
# Divisão inteira
print(9//2)

In [None]:
# Resto
print(9%2)

In [None]:
# Potência
print(7**2)

Também podemos realizar operações numéricas com **variáveis**.

Vamos calcular *quantos códons tem a nossa sequência de DNA*.

In [1090]:
# Retomando nossas variáveis
print(dna_seq)
print(tam_seq)

ACTGGATCTCGATGATTGAGTCATTGGATA
30


In [1091]:
# Definindo que um códon tem três caracteres
tam_codon=3

In [1092]:
# Calculando e exibindo o número de códons
num_codons=tam_seq/tam_codon
print(num_codons)

10.0


[Mais informações sobre dados númericos na documentação oficial do Python.](https://docs.python.org/pt-br/3/tutorial/introduction.html#numbers)

## **Listas**

Listas são **coleções ordenadas** de itens que permitem o armazenamento de várias informações em uma única variável.

No Python, indicamos que um objeto é uma lista usando `[]` (colchetes).

Os valores presentes em uma lista podem ser números, strings, outras listas etc.

In [None]:
nucleotideo_subunis=["pentose", "grupo fosfato"]
print(nucleotideo_subunis)

Podemos **adicionar um novo valor** a uma lista existente usando o método `append()`

In [None]:
nucleotideo_subunis.append("base nitrogenada")
print(nucleotideo_subunis)

Como listas são ordenadas, podemos **acessar seus elementos** informando o *índice* (posição) deles.

*O primeiro item tem índice zero*.

O valor do índice é escrito dentro de `[]` (colchetes), que funcionam como um *operador de indexação*.

In [None]:
## ALTERE O VALOR DENTRO DOS COLCHETES
print(nucleotideo_subunis[0])

Podemos **utilizar os itens de uma lista** assim como seria com qualquer outra variável.

In [None]:
print("O nucleotídeo é formado por um açúcar de cinco carbonos chamado "+nucleotideo_subunis[0]+
      ". Esse açúcar é ligado a um "+nucleotideo_subunis[1]+" no carbono 5 e a uma "+
      nucleotideo_subunis[2]+" no carbono 1.")

Podemos **acessar partes de uma lista** aplicando um slicing (fatiamento).

Para isso usamos um modelo `start:stop` e o operador de indexação `[]`.

Em Python, os **intervalos** são fechados no começo (incluso) e abertos no final (não incluso).

In [1097]:
aminoacidos=["alanina","leucina","glicina","aspartato","lisina","glutamato","fenilalanina","histidina"]

In [None]:
print(aminoacidos[0:4])

In [None]:
print(aminoacidos[3:5])

O método `join()` **une todos os itens de uma lista** e os transforma em uma string única.

In [None]:
aminoacidos_concat=", ".join(aminoacidos)
print("Aminoácidos: "+aminoacidos_concat+".")

## Dentro das aspas adicionamos o separador que queremos que separe os itens da nossa nova string

A função `range()` retorna uma série numérica de acordo com os argumentos declarados na função.

Os argumentos seguem a estrutura `start,stop,step`.

Usamos a função `list()` para criar uma lista a partir do resultado da função `range()`.

In [None]:
## ALTERE OS VALORES DOS NÚMEROS DENTRO DOS PARÊNTESES
numeros=list(range(0,10,3))
print(numeros)

Vamos criar uma lista com as **nucleotídeos** que existem no DNA.

In [1102]:
## ESCREVA AQUI
## Chame a lista de `nucleotideos`

[Mais informações sobre listas na documentação oficial do Python.](https://docs.python.org/pt-br/3/tutorial/introduction.html#lists)

## **Dicionários**

Dicionários são **estruturas de dados** no formato *chave:valor*.

Criamos dicionários utilizando `{}` (chaves) como operador de atribuição.

Assim como as listas, os dicionários podem armazenar vários tipos de dados.

In [1103]:
sp1={"nome_cientifico":"Bombus terrestris",
    "filo":"Arthropoda",
    "classe":"Insecta",
    "ordem":"Hymenoptera",
    "familia":"Apidae",
    "genero":"Bombus",
    "nome_popular":"Mamangava"}

In [1104]:
sp2={"nome_cientifico":"Galeocerdo cuvier",
     "filo":"Chordata",
     "classe":"Chondrichthyes",
     "ordem":"Carcharhiniformes",
     "familia":"Carcharhinidae",
     "genero":"Galeocerdo"}

Podemos **obter o valor associado a uma chave** especificando o nome do dicionário e o nome da chave entre `[]` (colchetes).

In [None]:
print(sp1["ordem"])
print(sp2["ordem"])

Também podemos **adicionar novas duplas `chave:valor`** a um dicionário existente.

In [None]:
sp2["nome_popular"]="Tubarão-tigre"
print(sp2)

O valor de uma chave pode ser uma lista.

In [1107]:
aminoacidos_codons={
    "alanina":["GCU","GCC","GCA","GCG"],
    "leucina":["UUA","UUG", "CUU","CUC","CUA","CUG"],
    "glicina":["GGU","GGC","GGA","GGG"],
    "aspartato":["GAU","GAC"],
    "lisina":["AAA","AAG"],
    "glutamato":["GAA","GAG"],
    "fenilalanina":["UUU","UUC"],
    "histidina":["CAU","CAC"]
}

Vamos criar um dicionário com as **bases complementares do DNA**.

In [1108]:
## ESCREVA AQUI
## Chame o dicionário de `complementares`

[Mais informações sobre dicionários na documentação oficial do Python.](https://docs.python.org/pt-br/3/tutorial/datastructures.html#dictionaries)

## **Laços de repetição**

Ao escrever programas é comum que precisemos executar o mesmo comando várias vezes.

O que fazer? Escrever as mesmas linhas de código *repetidas vezes*?

In [None]:
nucleotideos=["A","C","T","G"]
print(nucleotideos[0])
print(nucleotideos[1])
print(nucleotideos[2])
print(nucleotideos[3])

Um método mais eficiente de resolver esse problema é utilizando um laço de repetição (*loop*).

O loop `for` permite percorrer uma coleção (lista ou dicionário, por exemplo) e **executar os mesmos comandos para cada um dos itens**.

A estrutura do `loop` for é a seguinte.

In [None]:
for n in nucleotideos:
  print(n)

 ## Atente para o uso dos dois pontos e da indentação.

In [None]:
for n in nucleotideos:
  frase=n+" é um nucleotídeo do DNA."
  print(frase)

  ## Neste exemplo, note que a cada loop a variável frase é salva com um valor diferente (cada valor da lista)

Vamos escrever um código que exiba todos os nucleotídeos, um por um, da nossa sequência de DNA.

In [None]:
print(dna_seq)

In [1113]:
## ESCREVA AQUI

## **Estruturas condicionais**

Programas precisam tomar decisões...

Utilizamos as estruturas condicionais para **analisar se determinadas condições são respeitadas** e, a partir dessa análise, **decidir que ações executar**.



### Comparações numéricas

Fazemos comparações numéricas usando os operadores `==`, `<=`, `>=`, `<`, `>`, `!=`.

In [None]:
3==3

In [None]:
3==4

In [None]:
3<4

In [None]:
5!=10

### Testes condicionais

A instrução `if` avalia uma condição em verdadeira (True) ou falsa (False).

Se a condição for **verdadeira**, o código após a instrução `if` será ***executado***.

Se a condição for **falsa**, o código será ***ignorado*** pelo interpretador.

In [None]:
print(sp1["filo"])
print(sp2["filo"])

In [1119]:
if sp1["filo"]=="Chordata":
  print("Esta espécie é cordada.")

In [None]:
if sp2["filo"]=="Chordata":
  print("Esta espécie é cordada.")

Podemos utilizar a estrutura `else` junto com a estrutura `if`.

In [None]:
if sp1["filo"]=="Chordata":
  print("Esta espécie é cordada.")
else:
  print("Esta espécie NÃO é cordada.")

## Atente para o uso dos dois pontos e da indentação

Utilizamos estruturas condicionais para **testar se determinados valores existem** em uma lista, por exemplo.

In [None]:
print(nucleotideos)

In [None]:
if "T" in nucleotideos:
  print("Esses são os nucleotídeos do DNA.")
if "U" in nucleotideos:
  print("Essas são os nucleotídeos do RNA.")

Vamos testar se a nossa sequência **termina com determinado códon**.

In [None]:
print(dna_seq)

In [None]:
codon_teste="TAC"
if dna_seq.endswith(codon_teste):
  print("Sim! A sequência termina com o códon "+codon_teste+".")
else:
  print("Não! A sequência não termina com o códon "+codon_teste+".")

Testando mais **condições numéricas**...

In [None]:
if len(dna_seq)>10:
  print("A sequência tem mais de 10 nucleotídeos.")
else:
  print("A sequência tem menos de 10 nucleotídeos.")

## **Funções**

Funções são sequências de instruções ou comandos **reutilizáveis**.

Elas podem ser **chamadas a qualquer momento** durante a execução do programa de maneira independente.



O Python tem funções nativas, como print() e type(), que já aprendemos aqui. Mas nós também podemos **criar nossas próprias funções**.

A **estrutura** básica da função é a seguinte:

```
def nome(argumentos):
  comandos
  return
```

In [1127]:
# Exemplo de função
def soma_um(x):
  x+=1
  return x

In [None]:
## ALTERE O VALOR DENTRO DOS PARÊNTESES
soma_um(19)

## **Projeto: Kit de ferramentas para manipular sequências de DNA**

Vamos montar um conjunto de ferramentas (funções) para realizar **operações básicas com sequências de DNA**.

O objetivo deste projeto é montar um **aparato básico de ferramentas** que possam ser a base para desenvolver algoritmos mais complexos posteriormente.

Perguntas...

***Quais processos que ocorrem nos organismos são relevantes no estudo da Genética Molecular?***

***Como podemos representar o DNA dentro do programa para estudar esses processos?***

***Que características são relevantes para o nosso propósito?***

### **A estrutura do DNA**

![Estrutura do DNA](https://s3-us-west-2.amazonaws.com/courses-images/wp-content/uploads/sites/1094/2016/11/03164502/OSC_Microbio_10_02_DoubHelix.jpg)

### **Etapas do projeto**

1. Definir uma estrutura básica
2. Gerar uma sequência
3. Validar a sequência
4. Contar os nucleotídeos
5. Calcular o conteúdo CG
6. Transcrever a sequência
7. Encontrar o reverso complementar
8. Traduzir a sequência

### **1. Definir a estrutura**

In [1129]:
nucleotideos = ["A","T","C","G"]

complementares = {"A":"T",
                  "T":"A",
                  "C":"G",
                  "G":"C"}

# Dicionário de códons e símbolos de três letras dos aminoácidos (código genético padrão)
codigo_genetico = {
    "GCU": "Ala", "GCC": "Ala", "GCA": "Ala", "GCG": "Ala",
    "UGU": "Cys", "UGC": "Cys",
    "GAU": "Asp", "GAC": "Asp",
    "GAA": "Glu", "GAG": "Glu",
    "UUU": "Phe", "UUC": "Phe",
    "GGU": "Gly", "GGC": "Gly", "GGA": "Gly", "GGG": "Gly",
    "CAU": "His", "CAC": "His",
    "AUA": "Ile", "AUU": "Ile", "AUC": "Ile",
    "AAA": "Lys", "AAG": "Lys",
    "UUA": "Leu", "UUG": "Leu", "CUU": "Leu", "CUC": "Leu", "CUA": "Leu", "CUG": "Leu",
    "AUG": "Met",
    "AAU": "Asn", "AAC": "Asn",
    "CCU": "Pro", "CCC": "Pro", "CCA": "Pro", "CCG": "Pro",
    "CAA": "Gln", "CAG": "Gln",
    "CGU": "Arg", "CGC": "Arg", "CGA": "Arg", "CGG": "Arg", "AGA": "Arg", "AGG": "Arg",
    "UCU": "Ser", "UCC": "Ser", "UCA": "Ser", "UCG": "Ser", "AGU": "Ser", "AGC": "Ser",
    "ACU": "Thr", "ACC": "Thr", "ACA": "Thr", "ACG": "Thr",
    "GUU": "Val", "GUC": "Val", "GUA": "Val", "GUG": "Val",
    "UGG": "Trp",
    "UAU": "Tyr", "UAC": "Tyr",
    "UAA": "_", "UAG": "_", "UGA": "_"}
# Stop codons são representados pelo símbolo `_`

### **2. Gerar sequência**

Vamos escrever um código que gere uma sequência de DNA aleatória a cada vez que for executado.



In [None]:
# Criando uma sequência de DNA aleatoriamente

from random import choice                           # Importa a biblioteca random

dna_seq_aleatoria=[]                                # Cria uma lista vazia chamada dna_seq_aleatoria

for i in range(0,30):                               # Cria um loop que será executado 30x
    nuc_aleatorio=choice(nucleotideos)              # Escolhe um nucleotídeo aleatoriamente na nossa lista de nucleotídeos
    dna_seq_aleatoria.append(nuc_aleatorio)         # Adiciona esse nucleotídeo à lista dna_seq_aleatoria

dna_seq_aleatoria="".join(dna_seq_aleatoria)        # Une todos os itens da lista transformando-os em uma string

print(dna_seq_aleatoria)                            # Exibe essa string na tela

### **3. Validar sequência**

In [1131]:
def validar_seq(sequencia):

  sequencia=sequencia.upper()                  # Converte todas as letras da sequência para maiúsculo
  for n in sequencia:                          # Repete o código abaixo para cada um dos itens da sequência
    if n not in nucleotideos:                  # Se a letra (nucleotídeo) não estiver na lista nucleotideos (definida anteriormente)
      return False                             # Retorna "falso"

  return sequencia                             # Se o programa não encontrar nenhum "falso", retorna a sequência


In [None]:
## CORRIJA A SEQUÊNCIA PARA A FUNÇÃO RETORNAR VERDADEIRO
seq_teste="GTCtCjCcgacTC"
validar_seq(seq_teste)

Agora vamos aplicar a função `validar_seq()` na nossa sequência aleatória.

In [None]:
validar_seq(dna_seq_aleatoria)

### **4. Contar nucleotídeos**

Vamos criar uma função que conte **quantas vezes cada nucleotídeo aparece** na nossa sequência de DNA.

In [1134]:
def contar_nuc(sequencia):

    nuc_freq={"A":0,                  # Cria um dicionário "contador" que inicia com o valor zero para todos os nucleotídeos
             "C":0,
             "T":0,
             "G":0}

    for n in sequencia:               # Repete o código abaixo para cada um dos itens da sequência
        nuc_freq[n] += 1              # Procura o nucleotídeo no dicionário `nuc_freq` e soma um ao seu valor

    return nuc_freq                   # Retorna o dicionário "contador"

**Aplicando na nossa sequência aleatória.**

In [None]:
dna_seq=validar_seq(dna_seq_aleatoria)      # 1º passo: validar a sequêcia
contar_nuc(dna_seq)

### **5. Cálculo do conteúdo CG**

In [1136]:
def conteudo_cg(sequencia):

    num_c = round(sequencia.count("C"))                   # Utiliza o método `count()` para contar quantas vezes a letra "C" aparece
    num_g = round(sequencia.count("G"))                   # Faz o mesmo para a letra "G"
    tamanho_seq = len(sequencia)                          # Calcula o tamanho da sequência
    freq_cg= round((num_c + num_g) / tamanho_seq * 100)   # Calcula a porcentagem de "C" e "G"

    return freq_cg

In [None]:
# Testando se funciona
conteudo_cg("ATCG")

**Aplicando na nossa sequência aleatória.**

In [None]:
conteudo_cg(dna_seq)

In [None]:
print(f"A nossa sequência tem {conteudo_cg(dna_seq)}% de CG.")

### **6. Transcrição**

![Transcrição](https://cdn.lecturio.com/assets/Transcription-process-and-synthesis-of-mRNA-1.png)

In [1140]:
def transcricao(sequencia):

  rna_seq = sequencia.replace("T","U")   # Substitui todos os "T" por "U" e gera uma nova variável chamada `rna_seq`

  return rna_seq


**Atenção!**


O resultado final dessa função é o RNAm *produto da transcrição*.

Mas, no nosso código, usamos a **fica codificadora** como referência, enquanto que na realidade o processo de *transcrição biológica* utiliza a **fita molde**.

Apesar de o passo a passo não corresponder ao que ocorre na transcrição biológica, o resultado final é o mesmo e nosso código é ***eficiente***.

Se o código fosse utilizado em contextos mais complexos e específicos de biologia molecular, poderia ser importante adotar a terminologia e a lógica biológica corretas para ***garantir a precisão das informações.***

In [None]:
# Testando a sequência da imagem
seq_img="AGCATCGTAT"
print(transcricao(seq_img))

**Aplicando na nossa sequência aleatória.**

In [None]:
print(dna_seq)
print(transcricao(dna_seq))

### **7. Reverso complementar**

In [None]:
print(complementares)

In [None]:
## ALTERE O VALOR DENTRO DOS PARÊNTESES
print(complementares["A"])

In [1145]:
def reverso_complementar(sequencia):

    dna_seq_complementar = ""                              # Cria uma string vazia que representa a sequência complementar

    for n in sequencia:                                    # Repete o código abaixo para cada nucleotídeo da sequência
        dna_seq_complementar += complementares[n]          # Busca o nucleotídeo nas chaves do dicionário `complementares`
                                                           # E adiciona o seu valor à sequência complementar (string)]

    dna_seq_complementar_rev = dna_seq_complementar[::-1]  # Reescreve a string de trás pra frente

    return dna_seq_complementar_rev                        # Retorna o reverso complementar da sequência

In [None]:
# Testando se funciona
print(reverso_complementar("CGAT"))

**Aplicando na nossa sequência aleatória.**

In [None]:
print(reverso_complementar(dna_seq))

In [None]:
print(f"5' {dna_seq} 3'[Sequência]")
print(" "*3+"|"*len(dna_seq))
print(f"3' {reverso_complementar(dna_seq)[::-1]} 5'[Complemento]\n")

print(f"5' {reverso_complementar(dna_seq)} 3'[Reverso complementar]")

### **8. Tradução**

In [None]:
print(codigo_genetico)

In [1150]:
def traducao(sequencia):

  rna_seq = sequencia.replace("T","U")               # Transcrição

  ptn_seq = ""                                       # Cria uma string vazia que será a sequência proteica

  for i in range(0, len(rna_seq)-2, 3):              # Loop para percorrer a sequência de RNA de três em três nucleotídeos
        codon = rna_seq[i:i+3]                       # O códon é composto por três nucleotídeos em sequência
        aminoacido = codigo_genetico.get(codon,"~")  # Busca o códon no `dicionário codigo_genetico` e guarda seu valor (aminoacido)
        ptn_seq += aminoacido                        # Adiciona o aminoácido na sequência proteica

  return ptn_seq                                     # Retorna a sequência proteica ao fim do loop

**Explicando melhor...**

In [None]:
letras=["A","B","C","D","E","F","G"]
tamanho_letras=len(letras)
print(tamanho_letras)

In [None]:
for i in range(0,tamanho_letras):
  trio=letras[i:i+3]
  print(trio)

**Atenção**: o código genético *não* funciona dessa maneira.

A sequência é lida de três em três, mas sempre *pulando* três. É como funciona o código genético.

Então adicionamos um terceiro argumento na função, o `step`=3.

In [None]:
for i in range(0,tamanho_letras,3):
  trio=letras[i:i+3]
  print(trio)

O `range` começa em 0 e vai até o valor de `tamanho_letras` (7 elementos na lista letras) com um passo de 3 .

Isso significa que `i` assume os valores 0, 3 e 6 (7 não incluso).

Mas ainda não está completamente correto pois ***apenas trios (códons) completos devem ser lidos***.

In [None]:
for i in range(0,tamanho_letras-2,3):
  trio=letras[i:i+3]
  print(trio)


Por isso, adicionamos um `-2` no segundo argumento da função.

Assim, o último item é ignorado pois está *sozinho*, não compõe um códon.

**Aplicando na nossa sequência aleatória.**

In [None]:
print(traducao(dna_seq))

### <font color = "red">**TESTE FINAL!!!**</font>
### **Kit de ferramentas para manipular sequências de DNA**

In [None]:
print(f"[Sequência aleatória]: {dna_seq}\n")
print(f"[Frequência dos nucleotídeos]: {contar_nuc(dna_seq)}\n")
print(f"[Transcrição DNA->RNA]: {transcricao(dna_seq)}\n")
print(f"[Reverso complementar]: {reverso_complementar(dna_seq)}\n")
print(f"[Conteúdo CG]: {conteudo_cg(dna_seq)}%\n")
print(f"[Sequência proteica]: {traducao(dna_seq)} ")

## **Links úteis**

[Biopython](https://biopython.org/)

[Rosalind](https://rosalind.info/problems/locations/)

## **Referências**

Downey, Allen B. **Think Python**. 2ed. O'Reilly Media, 2015.

Jones, Martin. **Python for Biologists**. 1ed. CreateSpace Independent Publishing Platform, 2013.

rebelScience. **Bioinformatics in Python**. Disponível em: www.youtube.com/playlist?list=PLpSOMAcxEB_jUKMvdl8rHqNiZXFIrtd5G.