## Übersetzen von RNA-Sequenzen in Proteine.

RNA kann in drei Nukleotidsequenzen, die Codons, zerlegt und dann wie folgt in ein Polypeptid übersetzt werden:
RNA: "AUGUUUUCU" => wird übersetzt in Codons: "AUG", "UUU", "UCU" => die zu einem Polypeptid mit der folgenden Sequenz werden => Protein: "Methionin", "Phenylalanin", "Serin".

Es gibt 64 Codons, die wiederum 20 Aminosäuren entsprechen; alle Codon-Sequenzen und die daraus resultierenden Aminosäuren sind jedoch für diese Übung nicht wichtig. Wenn es für ein Codon funktioniert, sollte das Programm auch für alle anderen Codons funktionieren. Es steht Ihnen jedoch frei, die Liste in der Testsuite zu erweitern, um alle Codons einzubeziehen.
Es gibt auch drei terminierende Codons (auch als "STOP"-Codons bekannt); wenn eines dieser Codons (vom Ribosom) angetroffen wird, endet die gesamte Übersetzung und das Protein wird abgebrochen. Alle nachfolgenden Codons werden ignoriert, etwa so:
RNA: "AUGUUUUCUUAAAUG" => Codons: "AUG", "UUU", "UCU", "UAA", "AUG" => Protein: "Methionin", "Phenylalanin", "Serin"
Beachten Sie, dass das STOP-Codon "UAA" die Übersetzung beendet und das letzte Methionin nicht in die Proteinsequenz übersetzt wird.

Nachstehend sind die Codons und die daraus resultierenden Aminosäuren aufgeführt, die für die Übung benötigt werden:
Codon               Protein
AUG                 Methionin
UUU, UUC            Phenylalanin
UUA, UUG            Leucin
UCU, UCC, UCA, UCG  Serin
UAU, UAC            Tyrosin
UGU, UGC            Cystein
UGG                 Tryptophan
UAA, UAG, UGA       STOP

In [None]:
# Codon-Tabelle für diese Übung
codon_protein = {
    "AUG": "Methionin",
    "UUU": "Phenylalanin",
    "UUC": "Phenylalanin",
    "UUA": "Leucin",
    "UUG": "Leucin",
    "UCU": "Serin",
    "UCC": "Serin",
    "UCA": "Serin",
    "UCG": "Serin",
    "UAU": "Tyrosin",
    "UAC": "Tyrosin",
    "UGU": "Cystein",
    "UGC": "Cystein",
    "UGG": "Tryptophan",
    "UAA": "STOP",
    "UAG": "STOP",
    "UGA": "STOP"
}


# Eingabe einer RNA-Sequenz
rna_sequenz = input("Gib eine RNA-Sequenz ein: ").strip().upper()


def rna_zu_protein(rna_sequenz: str):
    """Übersetzt eine RNA-Sequenz in ein Protein (Liste von Aminosäuren)."""
    protein = []
    # Zerlege in Codons (3 Basen pro Codon)
    codons = [rna_sequenz[i:i+3] for i in range(0, len(rna_sequenz), 3)]

    for codon in codons:
        amino_saeure = codon_protein.get(codon)
        if amino_saeure == "STOP":  # Abbruch bei STOP-Codon
            break
        elif amino_saeure in codon_protein.values():  # nur bekannte Codons übersetzen
            protein.append(amino_saeure)
    return protein

print(rna_zu_protein(rna_sequenz))

# --- Beispiele ---
# print(translate_rna_to_protein("AUGUUUUCU"))
# Erwartet: ['Methionin', 'Phenylalanin', 'Serin']

# print(translate_rna_to_protein("AUGUUUUCUUAAAUG"))
# Erwartet: ['Methionin', 'Phenylalanin', 'Serin']

['Methionin', 'Phenylalanin', 'Serin']
