<div class="licence">
<span>Licence CC BY-NC-ND</span>
<span>François Rechenmann &amp; Thierry Parmentelat</span>
<span><img src="media/inria-25-alpha.png" /></span>
</div>

# Transcription d'ADN en ARN

Dans ce complément nous allons implémenter l'algorithme très simple qui consiste à traduire un brin d'ADN dans le brin d'ARN correspondant.

### L'algorithme

Ce traitement est évidemment très simple; une première version naïve consiste à créer une chaîne vide, et à la remplir au fur et à mesure. Pour faire cela nous allons utiliser l'opérateur `+` sur les chaînes, qui permet de créer une nouvelle chaîne comme on le voit ici&nbsp;:

In [None]:
# à partir de deux chaines
ch1 = "abc"
ch2 = "def"
# en faisant + on obtient la concaténation des deux chaines
concatenated = ch1 + ch2
print(concatenated)

In [None]:
# remarquez que les deux chaines de départ sont intactes
print("ch1:", ch1, "ch2:", ch2)

Notez également que Python propose un raccourci `+=` qui se comporte comme ceci&nbsp;:

In [None]:
# en partant d'une chaine
string = "ATGC"
# on peut facilement y ajouter à la fin
string += "CGAT"
# maintenant string contient les deux morceaux 
print(string)

Grâce à cette opération de concaténation sur les chaines on peut procéder simplement comme ceci&nbsp;:

In [None]:
def translate_dna_to_rna(dna):
    """"
    Traduit un brin d'ADN en ARN en remplaçant toutes
    les occurrences de T en U
    """
    rna = ""
    for nucleo in dna:
        # traduire une Thymine en Uracile
        if nucleo == 'T':
            rna += "U"
        else:
            rna += nucleo
    return rna

Ainsi par exemple&nbsp;:

In [None]:
dna = "ATTCGATCGGGTATTACG"
rna = translate_dna_to_rna(dna)
print(rna)

### Mesures de performance (avancé)

Cette section est optionnelle et s'adresse à ceux d'entre vous qui ont des notions de Python un peu plus développées que ce que nous avons pu couvrir jusqu'ici. 

J'attire votre attention sur le module `timeit` qui permet de mesurer les performances d'un fragment de code. Par exemple pour voir le temps que prend cette fonction de traduction nous pourrions écrire&nbsp;:

In [None]:
# importer le module timeit qui fait des mesures de performance
import timeit

# un échantillon un peu gros : 400 000 nucléotides
big_dna = 10**5 * 'ACGT' 

print(timeit.timeit('translate_dna_to_rna(big_dna)', 
                    "from __main__ import translate_dna_to_rna, big_dna",
                    number=10))


Ce qui dans mon environnement imprime de l'ordre de `0.5` (en secondes), qui nous dit que pour évaluer 10 fois (c'est le propos de `number=10`) l'appel à `translate_dna_to_rna(big_dna)`, l'interpréteur prend environ une demi-seconde.

Le deuxième argument à `timeit`, dans notre cas `from __main__ import translate_dna_to_rna, big_dna`, permet de rendre les deux identificateurs dont nous avons besoin (la fonction et l'échantillon) visibles à `timeit`. 