<span style="float:left;">Licence CC BY-NC-ND</span><span style="float:right;">François Rechenmann &amp; Thierry Parmentelat&nbsp;<img src="media/inria-25.png" style="display:inline"></span><br/>

# Calcul de la distance de Hamming

In [None]:
# la formule magique pour utiliser print() en python2 et python3
from __future__ import print_function
# pour que la division se comporte en python2 comme en python3
from __future__ import division

Nous allons voir comment calculer la distance de Hamming, qui est bien entendu un algorithem très simple. La seule subtilité va consister ici à accepter un argument **optionnel** `longueur`. Si cet argument est fourni par l'appelant, on calcule la distance de Hamming sur un tronçon de cette taille. Sinon, on prend par convention la plus petite des deux longueurs.

In [None]:
# Calcul de la distance de Hamming
def distance_hamming(adn1, adn2, longueur=None):
    if longueur is None:
        longueur = min(len(adn1), len(adn2))
    distance = 0
    for i in range(longueur):
        if adn1[i] != adn2[i]:
            distance +=1 
    return distance

Ce qui nous donne, avec les exemples de la vidéo, d'abord&nbsp;:

In [None]:
a1 = "ACCTCTGTATCTATTCGGCATCATCAT"
a2 = "ACCTCTGAATCTATTCGGGATCATCAT"
#            ^          ^

distance_hamming(a1, a2)

Et avec le deuxième exemple&nbsp;:

In [None]:
b1 = "ACCTCTGTATCTATTCGGGATCATCAT"
b2 = "ACCTCTGAATCTATCCGGGATCATGAT"
#            ^      ^         ^

distance_hamming(b1, b2)

### Remarque (optionnel)

Pour les étudiants plus familiers avec python, je signale qu'on écrirait sans doute plutôt le code comme ceci&nbsp;:

In [None]:
def distance_hamming_2(adn1, adn2, longueur = None):
    if longueur is None:
        longueur = min(len(adn1), len(adn2))
    return sum( n1!=n2 for n1, n2 in zip(adn1[:longueur], adn2[:longueur]))

Cette façon d'écrire plus *pythonique* utilise les traits suivants&nbsp;:
 * la fonction `zip` permet de parcourir deux listes en parallèle, voir [la documentation python en ligne](https://docs.python.org/2/library/functions.html#zip),
 * le fait que les booléens `True` et `False` sont implémentés comme les entiers `1` et `0`, respectivement, 
 * et enfin `sum` qui permet de calcule la somme de tout un tableau, [comme expliqué ici](https://docs.python.org/2/library/functions.html#sum)