<div class="licence">
<span>Licence CC BY-NC-ND</span>
<span>François Rechenmann &amp; Thierry Parmentelat</span>
<span><img src="media/inria-25-alpha.png" /></span>
</div>

# Calcul de la séquence complémentaire inverse

### Le  `complement` d'un nucléotide

Pour calculer la séquence complémentaire inverse, nous commençons par nous définir un dictionnaire `complement` qui renvoie le nucléotide complémentaire&nbsp;:

In [None]:
# le nucléotide complémentaire
complement = {
    'A' : 'T',
    'C' : 'G',
    'G' : 'C',
    'T' : 'A',
}

Ainsi par exemple&nbsp;:

In [None]:
complement['A']

### La logique de notre calcul

On va maintenant pouvoir calculer la séquence complémentaire inverse. Pour cela on va

* calculer la **liste** des nucléotides complément, dans l'ordre initial, à l'aide d'une compréhension&nbsp;;
* retourner la liste en place grâce à la méthode python `reverse`&nbsp;;
* enfin traduire cette liste en chaine.

### Digression: traduire une liste en chaine

Pour cette dernière étape, nous allons utiliser une astuce très fréquente dans les programmes python. Il s'agit de la méthode `join` qui est disponible sur les chaines. Voyons quelques exemples&nbsp;:

In [None]:
# la méthode join sur une chaine
"+".join(["spam", "eggs", "bacon"])

Comme on le voit, la chaine sur laquelle on envoie la méthode `join` est utilisée pour lier (joindre) les différents morceaux, d'où le nom de cette méthode.

Aussi par extension, si on envoie `join` à une **chaine vide**, on réalise *de facto* une conversion de liste en chaine, comme ceci&nbsp;:

In [None]:
"".join(["s", "p", "a", "m"])

### Tout ensemble

Tous ces morceaux mis bout à bout nous donnent le code suivant pour calculer la chaine complémentaire inversée d'un brin d'ADN&nbsp;:

In [None]:
def reverse_complement(dna):
    """
    Calcule la séquence complémentaire (A->T, etc...) et
    inversée (les premiers sont les derniers)
    d'un brin d'ADN
    """
    # la liste des nucléotides complémentaires
    liste = [complement[nucleo] for nucleo in dna]
    # la même liste mais inversée
    liste.reverse()
    # il ne reste plus qu'à retransformer en chaine
    return "".join(liste)

### Exemples

En partant de l'exemple utilisé dans la vidéo et les transparents&nbsp;:

In [None]:
from samples import sample_week3_sequence4
print(sample_week3_sequence4)

In [None]:
# avec lequel on obtient alors le résultat attendu
reverse_complement(sample_week3_sequence4)

Ou encore sur un exemple un peu plus court&nbsp;:

In [None]:
reverse_complement("TAGCATCG")

Et maintenant sur un exemple franchement plus gros, pour se faire une idée de la performance&nbsp;:

In [None]:
from samples import subtilis
print("subtilis contient {} bases".format(len(subtilis)))

In [None]:
i_subtilis = reverse_complement(subtilis)
# on affiche le début (les 100 premiers)
print(i_subtilis[:100])

### Fontion involutive

On peut remarquer que la fonction `reverse_complement`, si on l'applique deux fois, doit nous redonner le résultat de départ (en langage savant cela s'appelle une fonction involutive). Je vous invite à titre d'exercice à essayer cela par vous-même&nbsp;:

In [None]:
# essayez ici d'appliquer reverse_complement deux fois
# pour vérifier qu'on obtient bien le résultat de départ
