# Promenade le long de l'ADN

## Implémentation en python

Nous allons dans ce complément voir une version exécutable de l'algorithme de la promenade le long de l'ADN.

que nous venons de voir dans l
On rappelle la co

Je suis parti de W1S7, il s'agit de dessiner une séquence d'ADN si chaque nucléotide `C`,  `A`, `G`, et `T` correspond à une direction comme dans le transparent

![Extrait du transparent](../media/directions.png)

In [None]:
deplacements = {
    'C' : (1, 0),
    'A' : (0, 1),
    'G' : (-1, 0),
    'T' : (0, -1),
    }

De sorte que par exemple

In [None]:
deplacements['C']

##### L'algo à proprement parler

On choisit de retourner deux listes, correspondant aux X et aux Y respectivement. Il se trouve que le plotter s'attend à ce genre de données; on pourrait très facilement faire un autre choix, je fais au plus rapide.

In [None]:
# un algorithme qui calcule les deux chemins en x et y
# en partant et en se deplaçant le long de la chaine
def chemins_x_y(adn):
    # on commence au centre
    x = 0
    y = 0
    # on range le point
    chemin_x = [x]
    chemin_y = [y]

    # pour tout l'ADN
    for nucleotide in adn:
        # quel deplacement faut-il faire
        dep_x, dep_y = deplacements[nucleotide]
        # on l'applique
        x += dep_x
        y += dep_y
        # on le range
        chemin_x.append(x)
        chemin_y.append(y)

    return chemin_x, chemin_y

Avec un petit exemple que je copie du transparent

In [None]:
adn = "CAGACCACTCAGACCTCAAGGACCCAGAAGTGAACACC"

X, Y = chemins_x_y(adn)

Pour donner une idée de ce que ça donne

In [None]:
for nucleotide, x, y in zip(adn, X[1:], Y[1:]): 
    print("{} ->({},{})".format(nucleotide, x, y), end="")

In [None]:
%matplotlib inline

import matplotlib.pyplot as plt

plt.plot(X, Y)
plt.show()

### Des entrées + grosses (1)

Je peux fournir des données en python ou en json ou en ce qu'on veut en fait.

Par exemple ceci est pris du même transparent

In [None]:
# au départ je voulais en mettre plusieurs dans ce module
from samples import slides
adn1 = slides['1.7']
print(adn1)

### Des entrées plus grosses (2)

On peut même les générer en python, évidemment

In [None]:
import random
valids = ['C', 'A', 'G', 'T']

In [None]:
longueur = 10**6
gros_adn = [ random.choice(valids) for i in range(longueur) ]

In [None]:
# mais en fait il n'y en a qu'un
print("en entrée, {} nucleotides".format(len(gros_adn)))
gros_X, gros_Y = chemins_x_y(gros_adn)
plt.plot(gros_X, gros_Y)
plt.show()

******

# lightning

In [None]:
from lightning import Lightning
lgn = Lightning(ipython=True, host='http://public.lightning-viz.org')

In [None]:
lgn.scatter(X, Y)

*****

In [None]:
def my_graph (X, Y, *args, **kwds):
    n = len(X)
    connectivity = [(i,i+1) for i in range(n-1)]
    colors = [ (256*i/n,256*i/n,256*i/n) for i in range(n)]
    return lgn.graph(X, Y, connectivity, color=colors, *args, **kwds)

In [None]:
my_graph(X, Y)

***


# bokeh

In [None]:
from bokeh.io import output_notebook, show
from bokeh.plotting import figure as bokeh
output_notebook()

In [None]:
p = bokeh(plot_width=400, plot_height=400, title="Promenade")
p.line(X, Y)
show(p)

***

# En 3D - matplotlib

La même chose en 3D (ça scale sûrement un peu moins)

In [None]:
from mpl_toolkits.mplot3d import Axes3D
fig = plt.figure()
ax = fig.add_subplot(111, projection='3d')

ax.plot(X, Y)

### Including `lines3d_demo.py` as-is

In [None]:
import matplotlib as mpl
from mpl_toolkits.mplot3d import Axes3D
import numpy as np
import matplotlib.pyplot as plt

mpl.rcParams['legend.fontsize'] = 10

fig = plt.figure()
ax = fig.gca(projection='3d')
theta = np.linspace(-4 * np.pi, 4 * np.pi, 100)
z = np.linspace(-2, 2, 100)
r = z**2 + 1
x = r * np.sin(theta)
y = r * np.cos(theta)
ax.plot(x, y, z, label='parametric curve')
ax.legend()

plt.show()