<span style="float:left;">Licence CC BY-NC-ND</span><span style="float:right;">François Rechenmann &amp; Thierry Parmentelat&nbsp;<img src="media/inria-25.png" style="display:inline"></span><br/>

# Promenade revisitée

Dans ce complément, nous allons modifier légèrement l'algorithme `promenade` que nous avions vu lors d'une séquence précédente, pour lui permettre d'opérer la promenade "résumée" de la façon qui a été vue dans la vidéo.

Comme toujours, commençons par les formules magiques

In [None]:
# la formule magique pour utiliser print() en python2 et python3
from __future__ import print_function
# pour que la division se comporte en python2 comme en python3
from __future__ import division

### La fonction `enumerate`

Mais avant cela, nous allons avoir besoin de voir un nouvel outil qui fait partie de l'attirail que nous offre python, il s'agit de la fonction `enumerate`. 

Cette fonction est très utile pour parcourir une structure grâce à une boucle `for`, tout en ayant **accès à l'indice du parcours**. Voyons tout de suite ceci sur un exemple&nbsp;:

In [None]:
# Si on a une chaine 
chaine = "abc"

# et qu'on la parcourt avec un for
for c in chaine:
    # ici on ne sait pas à quel indice
    # on se trouve dans le parcours
    print(c)    

Une première solution naïve consisterait à calculer la taille de la chaine, puis à faire une boucle sur tous les entiers plus petits que cette taille. Ce qui donnerait ceci&nbsp;:

In [None]:
# la fonction len est fournie par python
taille = len(chaine)

# la fonction range aussi est une fonction de python
for indice in range(taille):
    print("a l'indice", indice, "se trouve l'objet", chaine[indice])

Vous remarquerez d'ailleurs en passant ici que **les indices en python commencent à `0`** et non pas à 1, comme on en a fait l'hypothèse dans la vidéo.

Cette solution pour accéder à l'indice de la boucle fonctionne, mais **n'est pas recommandée**. On lui préfèrera l'utilisation de la fonction `enumerate`, qui permet d'obtenir un code à la fois **plus lisible** et **plus rapide**&nbsp;:

In [None]:
# on peut obtenir le même résultat avec un code
# plus lisible et plus efficace en faisant appel
# a la fonction enumerate qui est conçue exactement
# pour ce genre de cas
for indice, caractere in enumerate(chaine):
    print("a l'indice", indice, "se trouve l'objet", caractere)

### `chemin_x_y` revisité

Nous allons à présent récrire une nouvelle version de la fonction qui s'appelait `chemin_x_y`, et qui, souvenez-vous, renvoie deux listes pour les abscisses et les ordonnées du chemin à afficher.

Nous voulons résumer le chemin à dessiner, en ne conservant qu'un point de temps en temps.
Le premier changement à faire, c'est donc que l'on va passer à cette fonction, en plus de la séquence d'ADN, un entier qui sera le `pas` en question.

Le second changement consiste ensuite à ne retenir, comme point à tracer, que ceux qui correspondent à un `indice` qui est un multiple de `pas`.

En python on va utiliser l'opérateur '%' qui nous donne le reste de la division euclidienne&nbsp;:

In [None]:
# 20 est un multiple de 5, et donc son reste est nul
20 % 5

In [None]:
# par contre ce n'est pas un multiple de 6, car le reste vaut 2
20 % 6

On peut maintenant écrire le code suivant, qui ne crée un point dans la promenade que pour les indices qui sont un multiple du nombre `pas` qui doit être passé en argument à la fonction&nbsp;:

In [None]:
deplacements = {
    'C' : [1, 0],
    'A' : [0, 1],
    'G' : [-1, 0],
    'T' : [0, -1],
    }

# un algorithme qui calcule les deux chemins en x et y
# en se deplaçant le long de la chaine, et en ne retenant 
# que les points qui correspondent à un indice multiple de 'pas'
def chemin_x_y_resume(adn, pas):
    # initialise les résultats
    chemin_x, chemin_y = [], []
    # on commence au centre
    x, y = 0, 0
    # le point de départ fait partie du chemin
    chemin_x.append(x)
    chemin_y.append(y)

    # pour tout l'ADN
    for indice, nucleotide in enumerate(adn):
        # quel deplacement faut-il faire
        delta_x, delta_y = deplacements[nucleotide]
        # on l'applique
        x += delta_x
        y += delta_y
        # on ne le range que si l'indice 
        # est un multiple de pas
        if indice % pas == 0:
            chemin_x.append(x)
            chemin_y.append(y)

    return chemin_x, chemin_y

### L'algorithme en action

Nous avons besoin de `matplotlib`

In [None]:
%matplotlib inline
import matplotlib.pyplot as pyplot

# la taille à utiliser pour les figures
import pylab
pylab.rcParams['figure.figsize'] = 8., 8.

Et pour plus de confort on se définit un raccourci pour faire tout le travail&nbsp;:

In [None]:
def promenade_resume(adn, pas):
    # on appelle cette fois le nouvel algorithme
    # et on n'oublie pas de lui passer le pas
    X, Y = chemin_x_y_resume(adn, pas)
    # on peut maintenant dessiner
    pyplot.plot(X, Y)
    pyplot.show()

On peut maintenant voir le résultat sur l'échantillon qui nous avait servi pour notre première version&nbsp;:

In [None]:
from samples import echantillon_semaine1_sequence7
promenade_resume(echantillon_semaine1_sequence7, 10)

Que vous pouvez comparer avec le résultat obtenu grâce à l'algorithme précédent, qui faisait la promenade de manière exhaustive, et avec lequel on avait trouvé ceci&nbsp;:

![](media/prom-slide-17.png)

### Un peu plus interactif

Comme on l'avait vu avec la première version de la promenade, on peut facilement ajouter des facilités de navigation dans le dessin avec la librairie `mpld3` comme ceci&nbsp;:

In [None]:
# la surcouche de matplotlib pour naviguer
import mpld3

def promenade_resume_navigation(adn, pas):
    # comme tout à l'heure mais en utilisant mpld3
    # pour pouvoir naviguer dans le résultat
    X, Y = chemin_x_y_resume(adn, pas)
    # on peut maintenant dessiner
    pyplot.plot(X, Y)
    return mpld3.display()    

In [None]:
promenade_resume_navigation(echantillon_semaine1_sequence7, 10)