Codes correcteurs
=================

Réouvrir la page principale
---------------------------

[Cliquer ici](../main.ipynb)


Contexte d'utilisation
----------------------

Dans la vraie vie numérique, les données transitent via des câbles ou à l'intérieur d'ondes. Ceci s'accompagne d'erreurs de transmission. Pour repérer ces artefacts, on peut utiliser des codes correcteurs qui sont des codes permettant de repérer un certain nombre d'erreurs de transmission. Nous allons en voir un exemple très simplifié ici.


Présentation d'un code de type Hamming
--------------------------------------

**Nous nommerons** code à la Hamming (8,4) le code obtenu en suivant les indications données ci-dessous *(voir à la fin la section "Compléments : les vrais codes de Hamming" pour une définiton rigoureuse des codes de Hamming)*.


1. Nous partons d'un nombre binaire à quatre chiffres exactement *(contenant éventuellement des zéros superflus à gauche)*.

1. On lit le nombre en repportant ses chiffres de gauche à droite, et de bas en haut, sur deux lignes et deux colonnes.

1. Pour chacune des deux lignes, on calcule la somme modulo 2 des deux chiffres de la ligne. Les deux bits "somme" ainsi obtenus sont ajoutés dans une nouvelle troisième colonne. Voici la table d'addition modulo 2 *(notez qu'elle est est similaire à la table de vérité du `OU EXCLUSIF`)*.
<table style="font-weight:bold;">
  <tr style="background-color: lightgrey;">
    <td>+</td> <td>1</td> <td>0</td>
  </tr>
  <tr>
    <td style="background-color: lightgrey;">1</td> <td>0</td> <td>1</td>
  </tr>
  <tr>
    <td style="background-color: lightgrey;">0</td> <td>1</td> <td>0</td>
  </tr>
</table>        
1. On fait de même pour les colonnes. Les deux bits "somme" ainsi obtenus sont ajoutés dans une nouvelle troisième ligne.

1. Le code à la Hamming (8,4) s'obtient en lisant les chiffres ligne par ligne. On obtient ainsi un code constitué de $3+3+2=8$ chiffres binaires. Dans (8,4), le 8 fait donc référence au nombre de bits du code, tandis que le 4 correspond au nombre initial de bits.


**Un exemple :** considérons le nombre binaire `1110`. La méthode peut se résumer facilement via le tableau suivant que nous nommerons tableau à la Hamming.

<table style="font-weight:bold">
  <tr>
    <td></td> <td>Somme<br/>verticale</td> <td>Somme<br/>verticale</td> <td style="background-color:lightgrey">Nouveaux<br/>bits</td>
  </tr>
  <tr>
    <td>Somme<br/>horizontale</td> <td>1</td> <td>1</td> <td style="background-color:lightgrey">[0]</td>
  </tr>
  <tr>
    <td>Somme<br/>horizontale</td> <td>1</td> <td>0</td> <td style="background-color:lightgrey">[1]</td>
  </tr>
  <tr>
    <td style="background-color:lightgrey">Nouveaux<br/>bits</td> <td style="background-color:lightgrey">[0]</td> <td style="background-color:lightgrey">[1]</td> <td></td>
  </tr>
</table>
    
Le code est alors `11`**`[0]`**`10`**`[101]`** où les crochets sont juste là pour visualiser les bits "somme". Le code à la Hamming (8,4) du nombre binaire `1110` est donc `11010101`.


À vous de jouer : fabriquer un code à la Hamming (8,4) 
------------------------------------------------------

Compléter le code Python ci-après pour qu'il fabrique puis imprime la liste des naturels du code à la Hamming (8,4) d'un nombre binaire initalement donné, ce nombre initial étant donné sous forme de chaîne de caractères via la variable `nb_binaire`.


**Remarque :** dans le code à compléter, la transformation de la chaîne de caractères en une liste de naturels se fait via `[char for char in nb_binaire]`. Ceci n'est qu'un raccourci très pratique des trois lignes suivantes.

---------------------------
```
nb_binaire = []
for char in nb_binaire:
    nb_binaire.append(char)
```
---------------------------

Bien entendu, on aurait pu écrire directement le nombre binaire sous la forme d'une liste comme `["1", "1", "1", "0"]` mais nous faisons le choix d'utiliser d'abord une chaîne de caractères pour les raisons suivantes.

1. Dans un vrai programme, on peut demander le nombre à l'utilisateur via `nb_binaire = input("Quel est votre nombre binaire ? ")`. Dans ce cas, `nb_binaire` est une chaîne de caractères.

1. Dans notre cas, il est plus simple de modifier `"1110"` dans le code que de modifier `["1", "1", "1", "0"]`.

1. Enfin, notre choix nous donne l'occasion de parler de la notation raccourcie `[char for char in nb_binaire]`. 

In [None]:
# ----------------------- #
# -- À VOUS DE JOUER ! -- #
# ----------------------- #

# Compléter les points de suspension.


# ----------------------- #
# -- UN NOMBRE BINAIRE -- #
# ----------------------- #

nb_binaire = "1110" # Voir l'exemple d'introduction.

# Transformation de la chaîne de caractères en une liste de caractères.
nb_binaire = [char for char in nb_binaire]

# Si `nb_binaire = "1110"` alors `nb_binaire = ["1", "1", "1", "0"]` ici.


# --------------------- #
# -- CODE DE HAMMING -- #
# --------------------- #

...

Pour les plus rapides : repérer un code à la Hamming (8,4) mal transmis
-----------------------------------------------------------------------

Les deux cas suivants permettent de comprendre pourquoi le code à la Hamming (8,4) repère et corrige une unique erreur de transmission. Nous reprenons l'exemple du nombre binaire `1110` de code à la Hamming `11[0]10[101]` où **les crochets sont juste là pour nous aider à raisonner**.

1. Supposons que la transmission du code à la Hamming soit `11[0]11*[101]`, l'erreur se trouvant juste avant le second crochet _(voir la valeur étoilée)_. Le tableau à la Hamming est donc le suivant où la valeur erronée est sur fond orange.
<table style="font-weight:bold">
  <tr>
    <td></td> <td>Somme<br/>verticale</td> <td>Somme<br/>verticale</td> <td style="background-color:lightgrey">Nouveaux<br/>bits</td>
  </tr>
  <tr>
    <td>Somme<br/>horizontale</td> <td>1</td> <td>1</td> <td style="background-color:lightgrey">[0]</td>
  </tr>
  <tr>
    <td>Somme<br/>horizontale</td> <td>1</td> <td style="background-color: orange;">1</td> <td style="background-color:lightgrey">[1]</td>
  </tr>
  <tr>
    <td style="background-color:lightgrey">Nouveaux<br/>bits</td> <td style="background-color:lightgrey">[0]</td> <td style="background-color:lightgrey">[1]</td> <td></td>
  </tr>
</table>        
Les bits "somme" nous donnent une erreur dans la deuxième ligne et une autre dans la deuxième colonne. L'unique erreur est bien repérée. 
Le message initiale n'était pas `1111` mais `1110`.

1. Supposons que la transmission du code à la Hamming soit `11[1*]10[101]`, l'erreur concernant le premier bit "somme" _(voir la valeur étoilée)_. Le tableau à la Hamming est donc le suivant.
<table style="font-weight:bold">
  <tr>
    <td></td> <td>Somme<br/>verticale</td> <td>Somme<br/>verticale</td> <td style="background-color:lightgrey">Nouveaux<br/>bits</td>
  </tr>
  <tr>
    <td>Somme<br/>horizontale</td> <td>1</td> <td>1</td> <td style="background-color: orange;">[1]</td>
  </tr>
  <tr>
    <td>Somme<br/>horizontale</td> <td>1</td> <td>0</td> <td style="background-color:lightgrey">[1]</td>
  </tr>
  <tr>
    <td style="background-color:lightgrey">Nouveaux<br/>bits</td> <td style="background-color:lightgrey">[0]</td> <td style="background-color:lightgrey">[1]</td> <td></td>
  </tr>
</table>
Toutes les sommes sont justes sauf une, c'est donc elle l'unique erreur commise.
Le message initiale est bien `1110`.


Le début du code suivant simule une unique erreur au hasard dans `11010101` le code à la Hamming du nombre binaire `1110`. Faire un programme qui repère et corrige cette erreur.

In [None]:
# ----------------------- #
# -- À VOUS DE JOUER ! -- #
# ----------------------- #

# Compléter les points de suspension.


# -------------------------------- #
# -- FABRICATION DU CODE ERRONÉ -- #
# -------------------------------- #

# Importation d'un module pour copier une liste
from copy import deepcopy

# Importation d'un module hasardeux pour nous aider
import random

# Notre code à la Hamming pour tester
code = [char for char in "11010101"]

# ATTENTION ! Un point très technique : nous utilisons ici une astuce
# pour copier la liste et non sa référence.
code_errone = deepcopy(code)

# Simulation d'une erreur : nous utilisons la fonction `randint` 
# du module `random`. 
pos = random.randint(0, 7)

if code_errone[pos] == "1":
    code_errone[pos] = "0"
else:
    code_errone[pos] = "1"


# ------------------------------- #
# -- CORRECTION DU CODE ERRONÉ -- #
# ------------------------------- #

code_corrige = []

...


# ------------------- #
# -- VÉRIFICATIONS -- #
# ------------------- #

print("Code erroné  :", code_errone)
print("Code corrigé :", code_corrige)
print("Code initial :", code)

Compléments : les vrais codes de Hamming
----------------------------------------

**Définition 1 :** un code (n, k) est un code utilisant n bits de codage pour coder k bits source.

**Définition 2 :** on appelle code 1-correcteur tout code permettant de repérer et corriger une erreur.

**Définition 3 : nous appellerons** code 2-linéaire tout code dont les bits de codage s'expriment comme somme modulo 2 des bits source à coder.

**Définition 4 :** un code de Hamming est un code (n,k) à la fois 2-linéaire et 1-correcteur tel que n soit le plus petit possible.

**Propriété :** pour k=4, le code de Hamming est le code (7, 4) qui au nombre binaire source $[s_1 , s_2 , s_3 , s_4]$ , noté sous forme de liste de bits, associe le code $[s_1+s_2+s_4 , s_1+s_3+s_4 , s_1 , s_2+s_3+s_4 , s_2 , s_3 , s_4]$ .


**Une explication accessible :** [la page Wikpiédia](http://fr.wikipedia.org/wiki/Code_de_Hamming_%287,4%29#Approche_intuitive) est assez bien faite sur ce sujet. On y comprend notamment le choix de l'ordre a priori étrange du code de Hamming (7, 4). Par contre, l'auteur de cet article emploie le terme de code de Hamming (8, 4), un terme que ne l'on retrouve pas dans tous les livres *(nous avons repris cette dénomination dans ce document)*.