<div class="licence">
<span>Licence CC BY-NC-ND</span>
<span>François Rechenmann &amp; Thierry Parmentelat</span>
<span><img src="media/inria-25-alpha.png" /></span>
</div>

# Calcul de la distance de Hamming

Nous allons voir comment calculer la distance de Hamming, qui est bien entendu un algorithme très simple. La seule subtilité va consister ici à accepter un argument **optionnel** `length`. Si cet argument est fourni par l'appelant, on calcule la distance de Hamming sur un tronçon de cette taille. Sinon, on prend par convention la plus petite des deux longueurs.

In [None]:
# Calcul de la distance de Hamming
def hamming_distance(dna1, dna2, length=None):
    if length is None:
        length = min(len(dna1), len(dna2))
    distance = 0
    for i in range(length):
        if dna1[i] != dna2[i]:
            distance += 1 
    return distance

Ce qui nous donne, avec les exemples de la vidéo, d'abord&nbsp;:

In [None]:
a1 = "ACCTCTGTATCTATTCGGCATCATCAT"
a2 = "ACCTCTGAATCTATTCGGGATCATCAT"
#            ^          ^

hamming_distance(a1, a2)

Et avec le deuxième exemple&nbsp;:

In [None]:
b1 = "ACCTCTGTATCTATTCGGGATCATCAT"
b2 = "ACCTCTGAATCTATCCGGGATCATGAT"
#            ^      ^         ^

hamming_distance(b1, b2)

### Remarque (optionnel)

Pour les étudiants plus familiers avec python, je signale qu'on écrirait sans doute plutôt le code comme ceci&nbsp;:

In [None]:
def hamming_distance_2(dna1, dna2, length = None):
    if length is None:
        length = min(len(dna1), len(dna2))
    return sum( n1 != n2 for n1, n2 in zip(dna1[:length], dna2[:length]))

Cette façon d'écrire plus *pythonique* utilise les traits suivants&nbsp;:

 * la fonction `zip` permet de parcourir deux listes en parallèle, voir [la documentation python en ligne](https://docs.python.org/2/library/functions.html#zip),
 * le fait que les booléens `True` et `False` sont implémentés comme les entiers `1` et `0`, respectivement, 
 * et enfin `sum` qui permet de calcule la somme de tout un tableau, [comme expliqué ici](https://docs.python.org/2/library/functions.html#sum)

In [None]:
# pour vérifier
hamming_distance_2(a1, a2)

In [None]:
hamming_distance_2(b1, b2)