Em bioinformática, o Python é bastante utilizado para o processamento básico de sequências e a tradução de sequências de DNA em sequências de aminoácidos. Existem várias bibliotecas e algoritmos disponíveis que facilitam esse processo. 

Existem diversas formas de realizar este processamento, citando as mais usadas: 
            - Algoritmo de tradução com o Biopython.
            - Algoritmo de tradução personalizado mediante a finalidade, o tipo de ser vivo ou devido a outras caracteristicas especificas.

Adicionei um bloco try-except para capturar exceções e lidar com erros em ambos os casos.     

## Tradução -> Diogo

Em bioinformática, o Python é bastante utilizado para o processamento básico de sequências e a tradução de sequências de DNA em sequências de aminoácidos. Existem várias bibliotecas e algoritmos disponíveis que facilitam esse processo. 

Existem diversas formas de realizar este processamento, citando as mais usadas: 

            - Algoritmo de tradução com o Biopython;

            - Algoritmo de tradução personalizado mediante a finalidade, o tipo de ser vivo ou devido a outras caracteristicas especificas.
            

Adicionei um bloco try-except para capturar exceções e lidar com erros em ambos os casos.     

In [None]:
# Sequência de DNA exemplo
sequencia_DNA = "AGATGGTCTACGTCGCATCGTAGCTGAGCTAGCTAGCTAGCTAGCTAGCTAGCTAGCTAGCTAGCT"

Algoritmo de tradução com o Biopython: Uma biblioteca em python que fornece uma ampla gama de funcionalidades para o processamento de sequências biológicas, incluindo tradução. 

In [None]:
import re
from Bio.Seq import Seq

def traducao_dna_para_aminoacido(sequencia_DNA):
    # Verifica se a sequência de DNA é válida
    if not is_valid_dna(sequencia_DNA):
        raise ValueError("Sequência de DNA inválida.")

    # Transcrição do DNA para RNA
    sequencia_rna = Seq(sequencia_DNA).transcribe()

    # Verifica se a sequência de RNA é válida
    if not is_valid_rna(str(sequencia_rna)):
        raise ValueError("Sequência de RNA inválida.")

    # Tradução do RNA para uma sequência de aminoácidos usando Biopython
    sequencia_aminoacido = str(sequencia_rna.translate())

    return sequencia_aminoacido

try:
    sequencia_aminoacido = traducao_dna_para_aminoacido(sequencia_DNA)
    print("Sequência de aminoácidos:", sequencia_aminoacido)
except ValueError as e:
    print("Erro:", str(e))

Sequência de aminoácidos: RWSTSHRS*AS*LAS*LAS*LA


Algoritmo de tradução personalizado: Se tivermos requisitos específicos ou quisermos implementar o nosso próprio algoritmo de tradução, podemos criar um algoritmo personalizado para isso. 

In [None]:
def traducao_personalizada(sequencia_DNA):
    # Tabela de tradução de codões para aminoácidos
        tabela_traducao = {
            "TTT": "F", "TTC": "F", "TTA": "L", "TTG": "L",
            "CTT": "L", "CTC": "L", "CTA": "L", "CTG": "L",
            "ATT": "I", "ATC": "I", "ATA": "I", "ATG": "M",
            "GTT": "V", "GTC": "V", "GTA": "V", "GTG": "V",
            "TCT": "S", "TCC": "S", "TCA": "S", "TCG": "S",
            "CCT": "P", "CCC": "P", "CCA": "P", "CCG": "P",
            "ACT": "T", "ACC": "T", "ACA": "T", "ACG": "T",
            "GCT": "A", "GCC": "A", "GCA": "A", "GCG": "A",
            "TAT": "Y", "TAC": "Y", "TAA": "*", "TAG": "*",
            "CAT": "H", "CAC": "H", "CAA": "Q", "CAG": "Q",
            "AAT": "N", "AAC": "N", "AAA": "K", "AAG": "K",
            "GAT": "D", "GAC": "D", "GAA": "E", "GAG": "E",
            "TGT": "C", "TGC": "C", "TGA": "*", "TGG": "W",
            "CGT": "R", "CGC": "R", "CGA": "R", "CGG": "R",
            "AGT": "S", "AGC": "S", "AGA": "R", "AGG": "R",
            "GGT": "G", "GGC": "G", "GGA": "G", "GGG": "G"
            }

    # Verifica se a sequência de DNA tem um número de bases múltiplo de 3
        if len(sequencia_DNA) % 3 != 0:
            raise ValueError("Sequência de DNA inválida: número de bases não é múltiplo de 3.")

    # Tradução do DNA para uma sequência de aminoácidos
        sequencia_aminoacido = "".join([tabela_traducao[sequencia_DNA[i:i+3]] for i in range(0, len(sequencia_DNA), 3)])

        return sequencia_aminoacido

try:
    sequencia_aminoacido = traducao_personalizada(sequencia_DNA)
    print("Sequência de aminoácidos:", sequencia_aminoacido)
except ValueError as e:
    print("Erro:", str(e))

Sequência de aminoácidos: RWSTSHRS*AS*LAS*LAS*LA


Por fim, decidi incorporar os dois casos num (nao faço ideia se é util ou não).

Este código inclui as duas formas de tradução: uma com a biblioteca Biopython e outra usando uma abordagem manual. Cada bloco de código é independente e pode ser executado separadamente. 

Além disso, há um bloco separado com uma lista de verificações no final.

In [None]:
from Bio.Seq import Seq

def valida_dna(sequencia_DNA):
    valida_bases = set('ACGT')
    return all(base in valida_bases for base in sequencia_DNA)

def traducao_dna_aminoacido_biopython(sequencia_DNA):
    if not valida_dna(sequencia_DNA):
        raise ValueError("Sequência de DNA inválida.")

    sequencia_rna = Seq(sequencia_DNA).transcribe()
    sequencia_aminoacido = str(sequencia_rna.translate())

    return sequencia_aminoacido

def traducao_dna_aminoacido_personalizada(sequencia_DNA):
    if not valida_dna(sequencia_DNA):
        raise ValueError("Sequência de DNA inválida.")

    tabela_codoes = {
        'TTT': 'F', 'TTC': 'F', 'TTA': 'L', 'TTG': 'L',
        'CTT': 'L', 'CTC': 'L', 'CTA': 'L', 'CTG': 'L',
        'ATT': 'I', 'ATC': 'I', 'ATA': 'I', 'ATG': 'M',
        'GTT': 'V', 'GTC': 'V', 'GTA': 'V', 'GTG': 'V',
        'TCT': 'S', 'TCC': 'S', 'TCA': 'S', 'TCG': 'S',
        'CCT': 'P', 'CCC': 'P', 'CCA': 'P', 'CCG': 'P',
        'ACT': 'T', 'ACC': 'T', 'ACA': 'T', 'ACG': 'T',
        'GCT': 'A', 'GCC': 'A', 'GCA': 'A', 'GCG': 'A',
        'TAT': 'Y', 'TAC': 'Y', 'TAA': '*', 'TAG': '*',
        'CAT': 'H', 'CAC': 'H', 'CAA': 'Q', 'CAG': 'Q',
        'AAT': 'N', 'AAC': 'N', 'AAA': 'K', 'AAG': 'K',
        'GAT': 'D', 'GAC': 'D', 'GAA': 'E', 'GAG': 'E',
        'TGT': 'C', 'TGC': 'C', 'TGA': '*', 'TGG': 'W',
        'CGT': 'R', 'CGC': 'R', 'CGA': 'R', 'CGG': 'R',
        'AGT': 'S', 'AGC': 'S', 'AGA': 'R', 'AGG': 'R',
        'GGT': 'G', 'GGC': 'G', 'GGA': 'G', 'GGG': 'G'
    }

    codoes = [sequencia_DNA[i:i+3] for i in range(0, len(sequencia_DNA), 3)]
    sequencia_aminoacido = ''.join(tabela_codoes.get(codon, 'X') for codon in codoes)

    return sequencia_aminoacido

# Tradução usando Biopython
try:
    sequencia_aminoacido_biopython = traducao_dna_aminoacido_biopython(sequencia_DNA)
    print("Sequência de aminoácidos (Biopython):", sequencia_aminoacido_biopython)
except ValueError as e:
    print("Erro:", str(e))

# Tradução manual
try:
    sequencia_aminoacido_personalizada = traducao_dna_aminoacido_personalizada(sequencia_DNA)
    print("Sequência de aminoácidos (Manual):", sequencia_aminoacido_personalizada)
except ValueError as e:
    print("Erro:", str(e))


# Secção de testes de unidade

class TestComplementoInverso(unittest.TestCase):
    
    def test_sequencia_vazia(self):
        with self.assertRaises(ValueError):
            complemento_inverso('')
    
    def test_sequencia_invalida(self):
        with self.assertRaises(ValueError):
            complemento_inverso('ACGHJTGH')
    
    def test_sequencia_com_numeros(self):
        with self.assertRaises(ValueError):
            complemento_inverso('12ACTG0')
    
    def test_sequencia_com_espacos(self):
        self.assertTrue(complemento_inverso('  AC  CTG   '))
    
    def test_complemento_correto(self):
        self.assertEqual( complemento_inverso('AATTCCGG'), 'TTAAGGCC' )
    

suite = unittest.TestLoader().loadTestsFromTestCase(TestValidaData)
unittest.TextTestRunner( verbosity=3 ).run( suite )

print("\nVerificações:")
print("1. Verifique se a sequência de DNA está correta.")
print("2. Verifique se a sequência de DNA é válida, contendo apenas as bases A, C, G, T.")
print("3. Verifique se a sequência de aminoácidos foi corretamente traduzida.")
print("4. Verifique se o código está bem comentado e de fácil compreensão.")
print("5. Verifique se todas as dependências foram instaladas corretamente.")
print("6. Verifique se a função de tradução está sendo chamada corretamente.")
print("7. Verifique se as exceções são tratadas corretamente.")
print("8. Verifique se os resultados são exibidos de forma adequada.")

Erros e falhas identificados:
Corrigido o erro AttributeError: 'Seq' object has no attribute 'is_valid_dna'
Adicionada função is_valid_dna para verificar a validade da sequência de DNA
Atualizada a chamada para a função de validação no início do código

Otimizações a fazer:
Verificar se há maneiras de otimizar o código para melhorar a eficiência
Verificar se há possíveis otimizações na manipulação de strings e listas
Considerar a adição de mais verificações específicas, dependendo dos requisitos do projeto

In [9]:
# Sequência de DNA exemplo
sequencia_DNA = "AGATGGTCTACGTCGCATCGTAGCTGAGCTAGCTAGCTAGCTAGCTAGCTAGCTAGCTAGCTAGCT"

Algoritmo de tradução com o Biopython: Uma biblioteca em python que fornece uma ampla gama de funcionalidades para o processamento de sequências biológicas, incluindo tradução. 

In [5]:
from Bio.Seq import Seq

def traducao_dna_para_aminoacido(sequencia_DNA):
    # Verifica se a sequência de DNA é válida
    if not Seq(sequencia_DNA).is_valid_dna():
        raise ValueError("Sequência de DNA inválida.")

    # Transcrição do DNA para RNA
    sequencia_rna = Seq(sequencia_DNA).transcribe()

    # Verifica se a sequência de RNA é válida
    if not sequencia_rna.is_valid_rna():
        raise ValueError("Sequência de RNA inválida.")

    # Tradução do RNA para uma sequência de aminoácidos usando <link>Biopython</link>
    sequencia_aminoacido = str(sequencia_rna.translate())

    return sequencia_aminoacido

try:
    sequencia_aminoacido = traducao_dna_para_aminoacido(sequencia_DNA)
    print("Sequência de aminoácidos:", sequencia_aminoacido)
except ValueError as e:
    print("Erro:", str(e))

AttributeError: 'Seq' object has no attribute 'is_valid_dna'

Algoritmo de tradução personalizado: Se tivermos requisitos específicos ou quisermos implementar o nosso próprio algoritmo de tradução, podemos criar um algoritmo personalizado para isso. 

In [8]:
def traducao_personalizada(sequencia_DNA):
    # Tabela de tradução de codões para aminoácidos
        tabela_traducao = {
            "TTT": "F", "TTC": "F", "TTA": "L", "TTG": "L",
            "CTT": "L", "CTC": "L", "CTA": "L", "CTG": "L",
            "ATT": "I", "ATC": "I", "ATA": "I", "ATG": "M",
            "GTT": "V", "GTC": "V", "GTA": "V", "GTG": "V",
            "TCT": "S", "TCC": "S", "TCA": "S", "TCG": "S",
            "CCT": "P", "CCC": "P", "CCA": "P", "CCG": "P",
            "ACT": "T", "ACC": "T", "ACA": "T", "ACG": "T",
            "GCT": "A", "GCC": "A", "GCA": "A", "GCG": "A",
            "TAT": "Y", "TAC": "Y", "TAA": "*", "TAG": "*",
            "CAT": "H", "CAC": "H", "CAA": "Q", "CAG": "Q",
            "AAT": "N", "AAC": "N", "AAA": "K", "AAG": "K",
            "GAT": "D", "GAC": "D", "GAA": "E", "GAG": "E",
            "TGT": "C", "TGC": "C", "TGA": "*", "TGG": "W",
            "CGT": "R", "CGC": "R", "CGA": "R", "CGG": "R",
            "AGT": "S", "AGC": "S", "AGA": "R", "AGG": "R",
            "GGT": "G", "GGC": "G", "GGA": "G", "GGG": "G"
            }

    # Verifica se a sequência de DNA tem um número de bases múltiplo de 3
        if len(sequencia_DNA) % 3 != 0:
            raise ValueError("Sequência de DNA inválida: número de bases não é múltiplo de 3.")

    # Tradução do DNA para uma sequência de aminoácidos
        sequencia_aminoacido = "".join([tabela_traducao[sequencia_DNA[i:i+3]] for i in range(0, len(sequencia_DNA), 3)])

        return sequencia_aminoacido

try:
    sequencia_aminoacido = traducao_personalizada(sequencia_DNA)
    print("Sequência de aminoácidos:", sequencia_aminoacido)
except ValueError as e:
    print("Erro:", str(e))

Erro: Sequência de DNA inválida: número de bases não é múltiplo de 3.


Por fim, decidi incorporar os dois casos num (nao faço ideia se é util ou não).

Este código inclui as duas formas de tradução: uma com a biblioteca Biopython e outra usando uma abordagem manual. Cada bloco de código é independente e pode ser executado separadamente. 

Além disso, há um bloco separado com uma lista de verificações no final.

In [10]:
from Bio.Seq import Seq

def valida_dna(sequencia_DNA):
    valida_bases = set('ACGT')
    return all(base in valida_bases for base in sequencia_DNA)

def traducao_dna_aminoacido_biopython(sequencia_DNA):
    if not valida_dna(sequencia_DNA):
        raise ValueError("Sequência de DNA inválida.")

    sequencia_rna = Seq(sequencia_DNA).transcribe()
    sequencia_aminoacido = str(sequencia_rna.translate())

    return sequencia_aminoacido

def traducao_dna_aminoacido_personalizada(sequencia_DNA):
    if not valida_dna(sequencia_DNA):
        raise ValueError("Sequência de DNA inválida.")

    tabela_codoes = {
        'TTT': 'F', 'TTC': 'F', 'TTA': 'L', 'TTG': 'L',
        'CTT': 'L', 'CTC': 'L', 'CTA': 'L', 'CTG': 'L',
        'ATT': 'I', 'ATC': 'I', 'ATA': 'I', 'ATG': 'M',
        'GTT': 'V', 'GTC': 'V', 'GTA': 'V', 'GTG': 'V',
        'TCT': 'S', 'TCC': 'S', 'TCA': 'S', 'TCG': 'S',
        'CCT': 'P', 'CCC': 'P', 'CCA': 'P', 'CCG': 'P',
        'ACT': 'T', 'ACC': 'T', 'ACA': 'T', 'ACG': 'T',
        'GCT': 'A', 'GCC': 'A', 'GCA': 'A', 'GCG': 'A',
        'TAT': 'Y', 'TAC': 'Y', 'TAA': '*', 'TAG': '*',
        'CAT': 'H', 'CAC': 'H', 'CAA': 'Q', 'CAG': 'Q',
        'AAT': 'N', 'AAC': 'N', 'AAA': 'K', 'AAG': 'K',
        'GAT': 'D', 'GAC': 'D', 'GAA': 'E', 'GAG': 'E',
        'TGT': 'C', 'TGC': 'C', 'TGA': '*', 'TGG': 'W',
        'CGT': 'R', 'CGC': 'R', 'CGA': 'R', 'CGG': 'R',
        'AGT': 'S', 'AGC': 'S', 'AGA': 'R', 'AGG': 'R',
        'GGT': 'G', 'GGC': 'G', 'GGA': 'G', 'GGG': 'G'
    }

    codoes = [sequencia_DNA[i:i+3] for i in range(0, len(sequencia_DNA), 3)]
    sequencia_aminoacido = ''.join(tabela_codoes.get(codon, 'X') for codon in codoes)

    return sequencia_aminoacido

# Tradução usando Biopython
try:
    sequencia_aminoacido_biopython = traducao_dna_aminoacido_biopython(sequencia_DNA)
    print("Sequência de aminoácidos (Biopython):", sequencia_aminoacido_biopython)
except ValueError as e:
    print("Erro:", str(e))

# Tradução manual
try:
    sequencia_aminoacido_personalizada = traducao_dna_aminoacido_personalizada(sequencia_DNA)
    print("Sequência de aminoácidos (Manual):", sequencia_aminoacido_personalizada)
except ValueError as e:
    print("Erro:", str(e))

print("\nVerificações:")
print("1. Verifique se a sequência de DNA está correta.")
print("2. Verifique se a sequência de DNA é válida, contendo apenas as bases A, C, G, T.")
print("3. Verifique se a sequência de aminoácidos foi corretamente traduzida.")
print("4. Verifique se o código está bem comentado e de fácil compreensão.")
print("5. Verifique se todas as dependências foram instaladas corretamente.")
print("6. Verifique se a função de tradução está sendo chamada corretamente.")
print("7. Verifique se as exceções são tratadas corretamente.")
print("8. Verifique se os resultados são exibidos de forma adequada.")

Sequência de aminoácidos (Biopython): RWSTSHRS*AS*LAS*LAS*LA
Sequência de aminoácidos (Manual): RWSTSHRS*AS*LAS*LAS*LA

Verificações:
1. Verifique se a sequência de DNA está correta.
2. Verifique se a sequência de DNA é válida, contendo apenas as bases A, C, G, T.
3. Verifique se a sequência de aminoácidos foi corretamente traduzida.
4. Verifique se o código está bem comentado e de fácil compreensão.
5. Verifique se todas as dependências foram instaladas corretamente.
6. Verifique se a função de tradução está sendo chamada corretamente.
7. Verifique se as exceções são tratadas corretamente.
8. Verifique se os resultados são exibidos de forma adequada.


Erros e falhas identificados:
Corrigido o erro AttributeError: 'Seq' object has no attribute 'is_valid_dna'
Adicionada função is_valid_dna para verificar a validade da sequência de DNA
Atualizada a chamada para a função de validação no início do código

Otimizações a fazer:
Verificar se há maneiras de otimizar o código para melhorar a eficiência
Verificar se há possíveis otimizações na manipulação de strings e listas
Considerar a adição de mais verificações específicas, dependendo dos requisitos do projeto