Em bioinformática, o Python é bastante utilizado para o processamento básico de sequências e a tradução de sequências de DNA em sequências de aminoácidos. Existem várias bibliotecas e algoritmos disponíveis que facilitam esse processo. 

Exitem diversas formas de realizar este processamento:

Usando o Biopython: Biopython é uma biblioteca muito utilizada em bioinformática no Python. Ele fornece uma ampla gama de funcionalidades para o processamento de sequências biológicas, incluindo tradução. Podemos usar a função translate() para traduzir sequências de DNA em sequências de aminoácidos. Aqui está um exemplo:

In [1]:
""" Usando a biblioteca Biopython"""

from Bio.Seq import Seq

# Sequência de DNA
dna_sequence = "ATGGTCTACGTCGATCGTAGCTAGCTAGCTAGCTAGCTAGCTAGCTAGCTAGCTAGCTAGCT"

# Transcrição do DNA para RNA
rna_sequence = Seq(dna_sequence).transcribe()

# Tradução do RNA para uma sequência de aminoácidos
amino_acid_sequence = rna_sequence.translate()

print(amino_acid_sequence) 

MVYVDRS*LAS*LAS*LAS*




Algoritmo de tradução personalizado: Se tivermos requisitos específicos ou quisermos implementar o nosso próprio algoritmo de tradução, podemos criar uma função personalizada para isso. Aqui está um exemplo:


In [3]:
"""Usando uma tabela de tradução personalizada"""

# Sequência de DNA
dna_sequence = "ATGGTCTACGTCGATCGTAGCTAGCTAGCTAGCTAGCTAGCTAGCTAGCTAGCTAGCTAGCT"

# Tabela de tradução de codões para aminoácidos
translation_table = {
    "TTT": "F", "TTC": "F", "TTA": "L", "TTG": "L",
    "CTT": "L", "CTC": "L", "CTA": "L", "CTG": "L",
    "ATT": "I", "ATC": "I", "ATA": "I", "ATG": "M",
    "GTT": "V", "GTC": "V", "GTA": "V", "GTG": "V",
    "TCT": "S", "TCC": "S", "TCA": "S", "TCG": "S",
    "CCT": "P", "CCC": "P", "CCA": "P", "CCG": "P",
    "ACT": "T", "ACC": "T", "ACA": "T", "ACG": "T",
    "GCT": "A", "GCC": "A", "GCA": "A", "GCG": "A",
    "TAT": "Y", "TAC": "Y", "TAA": "*", "TAG": "*",
    "CAT": "H", "CAC": "H", "CAA": "Q", "CAG": "Q",
    "AAT": "N", "AAC": "N", "AAA": "K", "AAG": "K",
    "GAT": "D", "GAC": "D", "GAA": "E", "GAG": "E",
    "TGT": "C", "TGC": "C", "TGA": "*", "TGG": "W",
    "CGT": "R", "CGC": "R", "CGA": "R", "CGG": "R",
    "AGT": "S", "AGC": "S", "AGA": "R", "AGG": "R",
    "GGT": "G", "GGC": "G", "GGA": "G", "GGG": "G"
}

# Tradução do DNA para uma sequência de aminoácidos
amino_acid_sequence = "".join([translation_table[dna_sequence[i:i+3]] for i in range(0, len(dna_sequence), 3)])

print(amino_acid_sequence)

KeyError: 'CT'

In [2]:
# usando funções:

def translate_sequence(dna_seq):
    codon_table = {
    'TTT': 'F', 'TTC': 'F', 'TTA': 'L', 'TTG': 'L',
    'CTT': 'L', 'CTC': 'L', 'CTA': 'L', 'CTG': 'L',
    Resto dos codoes e seus correspondentes aminoácidos
    }

protein_seq = ""

for i in range(0, len(dna_seq), 3):
    codon = dna_seq[i:i+3]
    amino_acid = codon_table.get(codon, '*')
    protein_seq += amino_acid
return protein_seq

dna_seq = "ATGGTCTACGTCGATCGTAGCTAGCTAGCTAGCTAGCTAGCTAGCTAGCT"
protein_seq = translate_sequence(dna_seq)
print(protein_seq)


SyntaxError: ':' expected after dictionary key (2755271822.py, line 7)