Ce programme donne la transcription d'un brin d'ADN généré aléatoirement en ARNm, et donne la séquence peptidique issue de la traduction de cet ARNm.

In [None]:
%pylab --no-import-all inline

In [None]:
baseADN = ["A", "T", "G", "C"]
baseARN = ["A", "U", "G", "C"]
stop = ["TAA", "TAG", "TGA"]
stopARN = ["UAA", "UAG", "UGA"]

La fonction genBrins() génère un brin d'ADN d'une longueur donnée (par défaut 9 nucléotides).
Cette méthode peut également générer un brin d'ARNm.

In [None]:
def genBrins(nbases = 9, typ = "ADN"):
    if typ == "ADN":
        bases = baseADN
    elif typ == "ARN":
        bases = baseARN
    else:
        raise ValueError("typ doit être 'ARN' ou 'ADN', typ = %s" % typ)
    
    fragment = "".join([bases[np.random.randint(0, 4)] for i in range(nbases - nbases % 3)])
    
    if typ == "ADN":
        stopBase = stop
    elif typ == "ARN":
        stopBase = stopARN
    
    codonStop = stopBase[np.random.randint(0, 2)]
    
    fragment = fragment[:-3] + codonStop
    
    return fragment

Pour changer la longueur insérez un nombre (un multiple de 3), ce sera le nombre de nucléotides généré.

Pour générer un brin d'ARNm, insérez le nombre de nucléotides souhaité puis écrivez "ARN" comme montré ci-dessous.

In [None]:
brin = genBrins(12, "ARN")
print(brin)

La fonction transcription() transcrit un brin d'ADN en un brin d'ARNm.

In [None]:
def transcription(fragment):
    return fragment.replace("T", "U")

Si vous voulez transcrire votre morceau d'ADN en ARNm, remplacez 'transcription(adn)' par 'transcription("votre ADN")'.

P.S. mettez bien les guillemets dans les parenthèses.

In [None]:
adn = genBrins(21)
print(adn)
arn = transcription(adn)
print(arn)

In [None]:
codeGenetique = {"Leu": ["UUA", "UUG", "CUU", "CUC", "CUA", "CUG"], 
                "Phe": ["UUU", "UUC"], 
                "Ile": ["AUU", "AUC", "AUA"], 
                "Met": ["AUG"], 
                "Val": ["GUU", "GUC", "GUA", "GUG"], 
                "Ser": ["UCU", "UCC", "UCA", "UCG", "AGU", "AGC"], 
                "Pro": ["CCU", "CCC", "CCA", "CCG"], 
                "Thr": ["ACU", "ACC", "ACA", "ACG"], 
                "Ala": ["GCU", "GCC", "GCA", "GCG"], 
                "Tyr": ["UAU", "UAC"], 
                "STOP": ["UAA", "UAG", "UGA"], 
                "His": ["CAU", "CAC"], 
                "Gln": ["CAA", "CAG"], 
                "Asn": ["AAU", "AAC"], 
                "Lys": ["AAA", "AAG"], 
                "Asp": ["GAU", "GAC"], 
                "Glu": ["GAA", "GAG"], 
                "Cys": ["UGU", "UGC"], 
                "Trp": ["UGG"], 
                "Arg": ["CGU", "CGC", "CGA", "CGG", "AGA", "AGG"], 
                "Gly": ["GGU", "GGC", "GGA", "GGG"]}

La fonction codonToAA() traduit un codon en un acide aminé.

In [None]:
def codonToAA(codon):
    acideAmine = None
    identify = False
    for aa, codons in codeGenetique.items():
        if codon in codons:
            acideAmine = aa
            identify = True
            break
    if not identify:
        raise ValueError("ERREUR : codon '%s' non identifié" % codon)
        
    return acideAmine

In [None]:
print(codonToAA("GGG"))

La fonction traduction() traduit un brin d'ARNm en une ou plusieurs séquences peptidiques.

In [None]:
def find_nth(haystack, needle, n):
    start = haystack.find(needle)
    while start >= 0 and n > 1:
        start = haystack.find(needle, start+len(needle))
        n -= 1
    return start

def traduction(fragment): 
    i = 1
    sequence = ""
    n = 0
    codonStart = fragment[fragment.find("AUG")::]
    nbCodons = len(codonStart) // 3
    while n < nbCodons:
        codonStart = codonStart[codonStart.find("AUG")::]
        aa = codonToAA(codonStart[3*n: 3*n+3])
        if aa != "STOP":
            sequence += aa + "-"
            n += 1
        else: 
            sequence += aa
            sequence += "\n"
            n = 0
            i += 1
            codonStart = codonStart[find_nth(codonStart, "AUG", i)::]
            nbCodons = len(codonStart) // 3

    return sequence

Si vous voulez traduire votre morceau d'ARNm, remplacez 'traduction(arn)' par 'traduction("votre ARNm")'

P.S. mettez bien les guillemets dans les parenthèses.

In [None]:
arn = genBrins(204, "ARN")
print(arn)
sequence = traduction(arn)
print(sequence)