## Identificação das sequências
- Identificar o tipo de sequência (DNA, RNA, Amino ácido)
- Validação de DNA, RNA, Amino ácido
- Get orfs
- Codons


#### 1. Identificar o tipo da sequência

In [32]:
## Identificação do tipo de sequência (DNA, RNA, Amino ácido)
def seq_type(sequencia):
    """
    Função que recebe uma string "sequencia" e vai verificar se se trata de uma sequência de DNA, RNA ou Amino ácido.

    Input:
    Variável do tipo string denominada "sequencia".

    Output: 
    Classificação da sequência.
    """
    sequencia = sequencia.upper().strip()

    # Verifica se a sequência está vazia
    if not sequencia:
        return None

    # Definição das condições para a identificação da sequência da variável fornecida:
    # Verifica se "sequencia" contém apenas caracteres válidos de DNA
    caracteres_dna = set("ACGT")
    if all(caracter in caracteres_dna for caracter in sequencia):
        return "DNA"

    # Verifica se "sequencia" contém apenas caracteres válidos de RNA
    caracteres_rna = set("ACGU")
    if all(caracter in caracteres_rna for caracter in sequencia):
        return "RNA"

    # Verifica se "sequencia" contém apenas caracteres válidos de amino ácido
    caracteres_aminoacido = set("ABCDEFGHIKLMNPQRSTVWYZ_")
    if all(caracter in caracteres_aminoacido for caracter in sequencia):
        return "Amino ácido"

    # Se a sequência fornecida falhar em todos os testes anteriores, retorna None
    return None

In [33]:
# Teste da função "seq_type()"
sequencia_exemplo = "ACGTCGACAGTTA"
seq_type_exemplo = seq_type(sequencia_exemplo)

if seq_type_exemplo is not None:
    print(f"A sequência fornecida é do tipo: {seq_type_exemplo}")
else:
    print("A sequência fornecida não é reconhecida como DNA, RNA ou amino ácido.")

A sequência fornecida é do tipo: DNA


#### 2. Validação da sequência

In [75]:
def valid_dna(cadeia):
    """
    Verifica cada um dos caracteres (bases) na variável 'cadeia' e tenta NÃO encontrar os caracteres "ACGT" (bases de uma sequência de DNA).

    Input:
    Variável string denominaada 'cadeia'.
    
    Output:
    Retorna True se for válida, ou seja se não encontrar os caracteres definidos, False caso encontre.
    """
    cadeia = cadeia.upper().strip()     # força a string 'cadeia' em maiúsculas e remove os whitespaces do seu início e fim.

    for base in cadeia:                 # identifica-se cada indíce em 'cadeia' como 'base'.
        if base not in "ACGT":          # programa tenta procurar se cada 'base' NÃO é uma das letras
            return False                # retorna 'False' se pelo menos 1 dos índices não for "A", "C", "G", "T".

    return True

def valid_rna(cadeia):
    """
    Verifica cada um dos caracteres (bases) na variável 'cadeia' e tenta NÃO encontrar os caracteres "ACGU" (bases de uma sequência de RNA).

    Input:
    Variável string denominada 'cadeia'.
    
    Output:
    Retorna True se for válida, ou seja se não encontrar os caracteres definidos, False caso encontre.
    """
    cadeia = cadeia.upper().strip()     # força a string 'cadeia' em maiúsculas e remove os whitespaces do seu início e fim.

    for base in cadeia:                 # identifica-se cada indíce em 'cadeia' como 'base'.
        if base not in "ACGU":          # programa tenta procurar se cada 'base' NÃO é uma das letras
            return False                # retorna 'False' se pelo menos 1 dos índices não for "A", "C", "G", "U".

    return True

def valid_aminoacidos(cadeia):
    """
    Verifica cada um dos caracteres (aminoácidos) na variável 'cadeia' e tenta NÃO encontrar os caracteres válidos para aminoácidos.

    Input:
    Variável string denominada 'cadeia'.
    
    Output:
    Retorna True se for válida, ou seja, se não encontrar os caracteres definidos, False caso encontre.
    """
    cadeia = cadeia.upper().strip()  # força a string 'cadeia' em maiúsculas e remove os whitespaces do seu início e fim.

    valid_chars = "ABCDEFGHIKLMNPQRSTVWYZ_"
    
    for amino_acid in cadeia:  # identifica-se cada índice em 'cadeia' como 'amino_acid'.
        if amino_acid not in valid_chars:  # programa tenta procurar se cada 'amino_acid' NÃO é um dos caracteres válidos.
            return False  # retorna 'False' se pelo menos 1 dos índices não for válido.

    return True


In [89]:
## Exemplos das funções valid_dna(), valid_rna() e valid_aminoacidos()
print("Exemplo TRUE para valid_dna():", valid_dna("  AAAGGCTGGACGTCAccaGGTC"))           # Deve retornar TRUE
print("Exemplo FALSE para valid_dna():", valid_dna("AGCU"), "\n")                        # Deve retornar FALSE

print("Exemplo TRUE para valid_rna():", valid_rna("GCUCAGCUAUCG"))                       # Deve retornar TRUE
print("Exemplo FALSE para valid_rna():", valid_rna("TGCA"), "\n")                        # Deve retornar FALSE

print("Exemplo TRUE para valid_aminoacidos():", valid_aminoacidos("ADGHKMZWY_"))         # Deve retornar TRUE
print("Exemplo FALSE para valid_aminoacidos():", valid_aminoacidos("UIKGYUGAUICZ"))      # Deve retornar FALSE

Exemplo TRUE para valid_dna(): True
Exemplo FALSE para valid_dna(): False 

Exemplo TRUE para valid_rna(): True
Exemplo FALSE para valid_rna(): False 

Exemplo TRUE para valid_aminoacidos(): True
Exemplo FALSE para valid_aminoacidos(): False


#### 3. Contagens e frequências de bases e nucleótidos

In [68]:
## Contagem das bases de uma cadeia de DNA
def contar_bases_dna(cadeia):
    """
    cadeia: variável fornecida
    
    Recebe a variável string 'cadeia' e faz a contagem de cada índice se e só se:
        - a variável ter devolvido 'True' na função 'valid_dna(cadeia)'
        - as letras dos índices forem "A", "C", "G", "T"
    """
    
    A, C, G, T = 0, 0, 0, 0
    if valid_dna(cadeia) == True:       # faz a contagem dos índices se valid_dna(cadeia) == True, mas só conta "A", "C", "G" e "T".
        A = cadeia.count("A")
        C = cadeia.count("C")
        G = cadeia.count("G")
        T = cadeia.count("T")

        return A, C, G, T               # fornece a contagem final de cada base.

    else:
        return "Contagem de bases interrompida! Variável 'cadeia' falhou a validação em valid_dna()"   # corre se a condição em if não acontece.
    
## Contagem de bases de uma cadeia de RNA
def contar_bases_rna(cadeia):
    """
    cadeia: variável fornecida
    
    Recebe a variável string 'cadeia' e faz a contagem de cada índice se e só se:
        - a variável ter devolvido 'True' na função 'valid_rna(cadeia)'
        - as letras dos índices forem "A", "C", "G", "U"
    """
    
    A, C, G, U = 0, 0, 0, 0
    if valid_rna(cadeia):  # faz a contagem dos índices se valid_rna(cadeia) == True, mas só conta "A", "C", "G" e "U".
        A = cadeia.count("A")
        C = cadeia.count("C")
        G = cadeia.count("G")
        U = cadeia.count("U")

        return A, C, G, U  # fornece a contagem final de cada base.

    else:
        return "Contagem de bases interrompida! Variável 'cadeia' falhou a validação em valid_rna()"  # corre se a condição em if não acontece.

In [57]:
from Bio.Seq import Seq

class MySeq:
    """ 
    Classe usada para manipular e transformar os diferentes tipos de sequências através de diferentes processos.
    """
    def __init__(self, seq):
        """
        Construtor da classe MySeq.

        Args:
        seq (str): Sequência biológica.
        """
        self.seq = str(seq.upper())

    def __len__(self): 
        """
        Função que permite implementar a função len().

        Returns:
        int: Tamanho da sequência.
        """   
        return len(self.seq)
    
    def __str__(self):
        """
        Função que permite representar a sequência como uma string.

        Returns:
        str: Representação da sequência.      
        """       
        return self.seq

    def __getitem__(self, n):
        """
        Função que permite aplicar a indexação na classe.

        Args:
        n (int): Index

        Returns:
        str: Base ou aminoácido correspondente ao index.
        """
        return self.seq[n]
    
    def __getslice__(self, i, j):
        """
        Função que permite aplicar a indexação na classe.

        Args:
        i (int): index start
        j (int): index final

        Returns:
        str: Sequência, base ou aminoácido correspondente ao index.
        """
        return self.seq[i:j]

    def get_type(self):
        """
        Função que a partir de uma sequência, classifica-a em DNA, RNA ou AMINO ACID SEQUENCE.

        Returns:
        str: Classificação da sequência.
        """
        if len([c for c in self.seq if c not in "ACGT"]) == 0:
            return "DNA"

        elif len([c for c in self.seq if c not in "ACGU"]) == 0:
            return "RNA"

        elif len([c for c in self.seq if c not in "ABCDEFGHIKLMNPQRSTVWYZ_"]) == 0:
            return "AMINO ACID SEQUENCE"
        
        else:
            return "Not valid"

    def count_nucleotides(self):
        """
        Função que a partir de uma sequência de DNA ou RNA e conta o número dos diferentes nucleótidos presentes.

        Output: 
        list: Lista com a contagem dos diferentes núcleotidos.           
        """
        if self.get_type() == "DNA":
            A = self.seq.count("A")
            C = self.seq.count("C")
            G = self.seq.count("G")
            T = self.seq.count("T") 
            return [A, C, G, T]
        
        elif self.get_type() == "RNA":                    
            A = self.seq.count("A")
            C = self.seq.count("C")
            G = self.seq.count("G")
            U = self.seq.count("U") 
            return [A, C, G, U] 
        else:
            return "Not DNA or RNA"

    def freq_nucleotides(self):
        """
        Função que a partir de uma sequência de DNA ou RNA, estima a frequência dos diferentes nucleótidos presentes.

        Output:
        list: Lista com a frequência dos diferentes nucleótidos. 
        """
        if self.get_type() == "DNA":
            A = self.seq.count("A") / len(self.seq)
            C = self.seq.count("C") / len(self.seq)
            G = self.seq.count("G") / len(self.seq)
            T = self.seq.count("T") / len(self.seq)
            return [round(A, 3), round(C, 3), round(G, 3), round(T, 3)]             
        
        elif self.get_type() == "RNA":
            A = self.seq.count("A") / len(self.seq)
            C = self.seq.count("C") / len(self.seq)
            G = self.seq.count("G") / len(self.seq)
            U = self.seq.count("U") / len(self.seq)
            return [round(A, 3), round(C, 3), round(G, 3), round(U, 3)]
        else:
            return "Not DNA or RNA"

In [66]:
## Teste de count_nucleotides() e freq_nucleotides()
sequencia = MySeq("AAaCGGTGGTTCCC")
print("Contagem de Nucleotídeos:", sequencia.count_nucleotides())
print("Frequência de Nucleotídeos:", sequencia.freq_nucleotides())

# Multiplicar os valores por 100
print("Percentagem de Nucleotídeos:", [value * 100 for value in sequencia.freq_nucleotides()])

# Soma dos valores da lista
soma_freq_nucleotides = sum(sequencia.freq_nucleotides())
print("Soma dos valores da Frequência de Nucleotídeos:", soma_freq_nucleotides)

Contagem de Nucleotídeos: [3, 4, 4, 3]
Frequência de Nucleotídeos: [0.214, 0.286, 0.286, 0.214]
Percentagem de Nucleotídeos: [21.4, 28.599999999999998, 28.599999999999998, 21.4]
Soma dos valores da Frequência de Nucleotídeos: 1.0


In [122]:
### Funções extra
## Verificar a percentagem das bases G e C 
def gc_percentage(seqDNA):
    count_G = seqDNA.count('G')
    count_C = seqDNA.count('C')
    total_bases = len(seqDNA)
    
    # Calcula a porcentagem de G e C na sequência
    percent_GC = ((count_G + count_C) / total_bases) * 100
    
    return round(percent_GC, 2)  # Arredonda para 2 casas decimais

### ------------------------------------------------------------------------------------------------------------- ###
## Alternativa da função freq_nucleotidos() definido como freqNucleotidos() onde o output é um dicionário
def freqNucleotides(seqDNA):
    # Inicializa um dicionário vazio para armazenar a contagem de nucleotídeos
    freq_dict = {'A': 0, 'C': 0, 'G': 0, 'T': 0}

    # Percorre a sequência de DNA e conta a frequência de cada nucleotídeo
    for nucleotide in seqDNA:
        if nucleotide in freq_dict:
            freq_dict[nucleotide] += 1

    return freq_dict

### ------------------------------------------------------------------------------------------------------------- ###
def commonChars(seqDNA1, seqDNA2):
    # Cria listas com os caracteres das sequências de DNA
    list_seqDNA1 = list(seqDNA1)
    list_seqDNA2 = list(seqDNA2)
    
    # Inicializa um contador para o número de caracteres em comum
    common_count = 0
    
    # Itera sobre os caracteres da primeira sequência
    for char in list_seqDNA1:
        # Verifica se o caractere está na segunda sequência
        if char in list_seqDNA2:
            # Se estiver, incrementa o contador e remove o caractere da segunda sequência
            common_count += 1
            list_seqDNA2.remove(char)
    
    # Retorna o número total de caracteres em comum
    return common_count

In [124]:
# Exemplo de gc_percentage():
print("Resultado do exemplo da função gc_percentage():", gc_percentage("ATGCTGAAGCTGA"), "%", "\n")

# Exemplo de freqNucleotides():
print("Resultado do exemplo da função freqNucleotides():", freqNucleotides("ATAGATGAGA"), "\n")

# Exemplo de commonChars():
print("Resultado do exemplo da função commonChars():", commonChars("ATAGATGAGA", "CTGAATAGACT"))

Resultado do exemplo da função gc_percentage(): 46.15 % 

Resultado do exemplo da função freqNucleotides(): {'A': 5, 'C': 0, 'G': 3, 'T': 2} 

Resultado do exemplo da função commonChars(): 8


#### 4. Complemento Inverso

In [125]:
## Função que elabora o complemento inverso
def comp_inv(dna):
    """
    Devolve o complemento inverso de uma cadeia de DNA que corresponde à string inversa substituindo
    A <-> T
    C <-> G
    """
    comp = ""                          # Define-se uma nova variável para o nosso complemento inverso
    for c in dna.upper():
        if c == "A":
            comp = "T" + comp
        elif c == "T":
            comp = "A" + comp
        elif c == "G":
            comp = "C" + comp
        elif c == "C":
            comp = "G" + comp

    return comp

In [126]:
## Alternativa da função comp_inv()
def comp_inv2(dna):
    subs = {
        "A" : "T",
        "T" : "A",
        "C" : "G",
        "G" : "C"
    }
    
    res = ""
    for b in dna.upper():
        res = subs[b] + res
    return res

In [127]:
## Teste das funções comp_inv() e comp_inv2()
print("Resultado de comp_inv():", comp_inv("accgtgAGGCTT"))
print("Resultado de comp_inv2():", comp_inv2("accgtgAGGCTT"))

Resultado de comp_inv(): AAGCCTCACGGT
Resultado de comp_inv2(): AAGCCTCACGGT


#### 5. Codons

In [135]:
## Definição da tabela de codões
codon_dict = {
        'ATA':'I', 'ATC':'I', 'ATT':'I', 'ATG':'M',
        'ACA':'T', 'ACC':'T', 'ACG':'T', 'ACT':'T',
        'AAC':'N', 'AAT':'N', 'AAA':'K', 'AAG':'K',
        'AGC':'S', 'AGT':'S', 'AGA':'R', 'AGG':'R',
        'CTA':'L', 'CTC':'L', 'CTG':'L', 'CTT':'L',
        'CCA':'P', 'CCC':'P', 'CCG':'P', 'CCT':'P',
        'CAC':'H', 'CAT':'H', 'CAA':'Q', 'CAG':'Q',
        'CGA':'R', 'CGC':'R', 'CGG':'R', 'CGT':'R',
        'GTA':'V', 'GTC':'V', 'GTG':'V', 'GTT':'V',
        'GCA':'A', 'GCC':'A', 'GCG':'A', 'GCT':'A',
        'GAC':'D', 'GAT':'D', 'GAA':'E', 'GAG':'E',
        'GGA':'G', 'GGC':'G', 'GGG':'G', 'GGT':'G',
        'TCA':'S', 'TCC':'S', 'TCG':'S', 'TCT':'S',
        'TTC':'F', 'TTT':'F', 'TTA':'L', 'TTG':'L',
        'TAC':'Y', 'TAT':'Y', 'TAA':'_', 'TAG':'_',
        'TGC':'C', 'TGT':'C', 'TGA':'_', 'TGG':'W',
    }

In [136]:
## Função para obter ORFs de proteínas
def get_orf_prot(amino: str) -> list[str]:
    """
    Recebe uma cadeia de aminoácidos e devolve uma lista de strings em que cada uma delas é uma das proteínas contidas nessa string.

    Parameters:
    amino (str): A cadeia de aminoácidos.

    Returns:
    list[str]: Lista de proteínas obtidas a partir da cadeia de aminoácidos.
    """
    in_prot = False
    curr_prot = ''
    prots = []

    for A in amino:
        if in_prot:
            curr_prot += A

            if A == '_':
                in_prot = False
                prots.append(curr_prot)
                curr_prot = ''
        else:
            if A == 'M':
                in_prot = True
                curr_prot = 'M'
    return prots


## Função para obter os codões a partir de uma sequência de DNA
def get_codons(dna: str, pos_inicial: int) -> str:
    """
    Recebe uma cadeia de DNA, o offset inicial (0, 1 ou 2) e devolve os codões.

    Parameters:
    dna (str): A cadeia de DNA.
    pos_inicial (int): O offset inicial (0, 1 ou 2).

    Returns:
    str: Lista de codões obtidos a partir da cadeia de DNA.
    """
    assert pos_inicial >= 0 and pos_inicial <= 2, "Offset inválido!"

    pos = pos_inicial
    codoes = []

    while pos < len(dna):
        codao = dna[pos: pos + 3]
        if len(codao) == 3:
            codoes.append(codao)
        pos += 3

    return codoes

## Função que converte uma lista de codões para uma sequência de aminoácidos em string
def codons_to_amino(codons: list[str]) -> str:
    """
    Recebe uma lista de codões e devolve a sequência de aminoácidos correspondente.

    Parameters:
    codons (list[str]): Lista de codões.
    Função recorre ao dicionário 'codon_dict' previamente definida!

    Returns:
    str: Sequência de aminoácidos correspondente à conversão codon -> sequência amino ácido.
    """
    amino = ''
    for C in codons:
        amino += codon_dict[C]
    return amino

## Função que devolve cadeias de aminoácidos a partir de uma cadeia de DNA
def get_orfs(dna: str) -> list[str]:
    """
    Recebe uma cadeia de DNA e devolve uma lista com as 6 ORFs em formato de string (cadeias de aminoácidos).

    Parameters:
    dna (str): A cadeia de DNA.

    Returns:
    list[str]: Lista de ORFs em formato de string (cadeias de aminoácidos).
    """
    inv = comp_inv(dna)
    return [codons_to_amino(get_codons(dna, pos)) for pos in range(3)] + \
           [codons_to_amino(get_codons(inv, pos)) for pos in range(3)]


## Função do completemento inverso
def comp_inv(dna):
    """ 
    Devolve o complemento inverso de uma cadeia de DNA que corresponde à string inversa substituindo as bases:
    A <-> T
    C <-> G

    Parameters:
    dna (str): A cadeia de DNA.

    Returns:
    str: Complemento inverso da cadeia de DNA.
    """
    subs = {
        'A': 'T',
        'T': 'A',
        'C': 'G',
        'G': 'C'
    }

    res = ''

    for b in dna:
        res = subs[b] + res
    return res

## Função que devolve as sequências de proteínas de uma sequência de DNA
def get_prots(dna):
    """
    Utiliza as funções get_orfs() e get_orf_prot() para obter proteínas a partir de uma sequência de DNA.

    Parameters:
    dna (str): A sequência de DNA.

    Returns:
    set: Conjunto de proteínas obtidas a partir da sequência de DNA.
    """
    orfs = get_orfs(dna)
    todas = set()

    for orf in orfs:
        for prot in get_orf_prot(orf):
            if prot not in todas:
                todas.add(prot)

    return todas

In [137]:
## Exemplo de get_orf_prot():
print("Exemplo da função get_orf_prot():", get_orf_prot("YMTYOP_NKMENDRWN_SKSSHQ_FJISMDAIFJSJNVVUIJEFAIO_JJMEM_"), "\n")
    # get_orf_prot() só vai registar os caracteres a partir do M até ao próximo underscore (ambos inclusive).

## Exemplo de get_codons():
print("Exemplo da função get_codons():", get_codons("ATATTATAGTGAGGATATGC", 2), "\n")

## Exemplo de codons_to_amino():
print("Exemplo da função codons_to_amino():", codons_to_amino(get_codons("ATAACT", 0)), "\n")

## Exemplo de get_orfs():
print("Exemplo da função get_orfs():", get_orfs("AGTTGAATTCGTC"), "\n")

## Exemplo de comp_inv():
print("Exemplo da função comp_inv():", comp_inv("AAAAGGGGTTTTTCCC"), "\n")

## Exemplo de get_prots():
print("Exemplo da função get_prots():", get_prots('TTATGGGTATGGCAACTTTCCATTAATGATATGTAACTAAGTGTACCACATATACCTAGCCAAAGGCTGTGTAGTGGAGCATCGTTATCCGAAGCTTGATCGTTGCATTGTGGTAAACCATGTAA'))

Exemplo da função get_orf_prot(): ['MTYOP_', 'MENDRWN_', 'MDAIFJSJNVVUIJEFAIO_', 'MEM_'] 

Exemplo da função get_codons(): ['ATT', 'ATA', 'GTG', 'AGG', 'ATA', 'TGC'] 

Exemplo da função codons_to_amino(): IT 

Exemplo da função get_orfs(): ['S_IR', 'VEFV', 'LNS', 'DEFN', 'TNST', 'RIQ'] 

Exemplo da função comp_inv(): GGGAAAAACCCCTTTT 

Exemplo da função get_prots(): {'MVYHNATIKLRITMLHYTAFG_', 'MICN_', 'MWYT_', 'MGMATFH_', 'M_', 'MQRSSFG_'}


In [143]:
## Função que separa bases de uma sequência de DNA de 3 em 3 (codões)
def DNA2codons(dna : str) -> list[str]:
    """
    Recebe uma string de DNA e devolve uma lista de codões (todos com 3 caracteres!).

    Parameters:
    dna (str): A cadeia de DNA.

    Returns:
    list[str]: Lista de codões obtidos a partir da cadeia de DNA.
    """
    res =  []
    for P in range(0, len(dna), 3):
        codon = dna[P : P + 3]
    if len(codon) == 3:
        res.append(codon)

    return res

## Função que separa bases de uma sequência de DNA de 3 em 3 (codões) e devolve a posição da primeira base de cada codão
def DNA2codons_pos(dna : str) -> list([str]):
    """
    Recebe uma string de DNA e devolve uma lista de codões (todos os 3 caracteres).

    Parameters:
    dna (str): A cadeia de DNA.

    Returns:
    list[int]: Posições da primeira base de cada codão.
    """
    res = []
    for P in range(0, len(dna), 3):
        res.append(P)
    return res

## Função que traduz uma sequência de DNA para aminoácido
def translation(dna : str) -> str:
    """
    Recebe uma string de DNA e devolve a string com aminoácidos correspondente.

    Parameters:
    dna (str): A cadeia de DNA.

    Returns:
    str: Sequência de aminoácidos correspondente à tradução da cadeia de DNA.
    """
    res = ""
    for codon in DNA2codons(dna):
        res += translateCodon(codon)
    return res

## Função que traduz um codão para aminoácido
def translateCodon(codon : str) -> str:
    """
    Recebe um codão que tem que ser uma string de tamanho 3 correspondendo a 3 bases de DNA e devolve o aminoácido correspondente.

    Parameters:
    codon (str): Codão de 3 bases de DNA.
    Função recorre ao dicionário 'codon_dict' previamente definida!

    Returns:
    str: Aminoácido correspondente ao codão.
    """
    assert len(codon) == 3, f"Codão {codon} inválido porque não tem tamanho 3!"
    assert codon in codons, f"Codão {codon} inválido!!!"

    return codon_dict[codon]

In [142]:
## Exemplo de DNA2codons():
print("Exemplo da função DNA2codons():", DNA2codons("ATCGGTTGAGTA"))

## Exemplo de DNA2codons_pos():
print("Exemplo da função DNA2codons_pos():", DNA2codons_pos("ATCGGTTGAGT"))   # Vai fazer print à posição do início de cada codão: A T C | G G T | T G A | G T
                                                                                                                      # índices:   0 1 2   3 4 5   6 7 8   9 10

## Exemplo de translation():
print("Exemplo da função translation():", translation("ATCGgTTGAGTA"))

Exemplo da função DNA2codons(): ['GTA']
Exemplo da função DNA2codons_pos(): [0, 3, 6, 9]
Exemplo da função translation(): V
