## Introduction



La sécurité des communications est un élément clé du fonctionnement d'internet. On va s'intéresser aux différentes manières de chiffrer un message. Deux grandes familles de chiffrement peuvent être distinguées, les chiffrements symétriques et les chiffrements asymétriques. Dans cette première partie, nous allons découvrir le principe des chiffrements symétriques, ainsi que quelques exemples.



### Coder, décoder.



**Rappels :** **Coder** une information veut dire que l'on va représenter l'information d'une autre manière, d'après une méthode pré-établie connue de tout le monde. À l'issue de ce procédé, on fourni un **code** (un objet différent plus ou moins clair). **Décoder** une information consiste à retransformer un code  en l'information initiale.

**Exercice** Le codage binaire d'un nombre est une manière de représenter les nombres. La fonction suivante donne la décomposition en base 2 du nombre `n`. 



In [1]:
def dix2deux(n):
    '''
    n : entier positif
    renvoit la décomposition [a_0, a_1, ... a_m] de n en base 2
    '''
    if n <= 1:
        return [n]
    else:
        div = n%2
        return [div] + dix2deux(n//2)

-   Modifier le code de la cellule pour faire afficher la décomposition en binaire des nombres 123, 1024, et 1993. Pour exécuter une cellule, vous pouvez cliquer sur le bouton `>| Exécuter` dans la barre d'outil ou utiliser le raccourci clavier `Control + Entrée`.
-   Écrire une fonction python `deux2dix` qui étant donné une liste de chiffres
    compris entre 0 et 1 renvoit le nombre en base 10 correspondant.



In [1]:
def deux2dix(l):
    '''
    l : décomposition en base 2 de la forme [a_0, a_1, ... a_m] 
    du nombre n
    renvoit le nombre n (base 10)
    '''

    pass

# Tests
for l in [[1, 0, 1], [1, 0, 0, 1], [0, 0, 0, 0, 1], [0, 1, 0, 0, 1, 1]]:
    print("Le nombre écrit {} en base 2 est {}".format(l, deux2dix(l)))

**Retour attendu :**
> Le nombre [1, 0, 1] écrit en base 2 est 5  
> Le nombre [1, 0, 0, 1] écrit en base 2 est 9  
> Le nombre [0, 0, 0, 0, 1] écrit en base 2 est 16  
> Le nombre [0, 1, 0, 0, 1, 1] écrit en base 2 est 50  

**Exercice.** On rappelle que tous les caractères sont associés à un code
[ASCII](https://www.ascii-code.com/). En python, il s'agit des fonctions `chr` et `ord` permettent de passer
d'un caractère à son code ASCII et réciproquement. 

-   Exécuter le code suivant. Quel est le code ASCII du caractère 'f' ? À quel caracètre correspond le code ASCII 64 ?



In [1]:
print(ord('a'))
print(chr(101))

-   Écrire une fonction  `tonumber` qui étant donné une lettre de l'alphabet en minuscule lui associe un nombre entre 0 ('a') et 25 ('z').



In [1]:
def tonumber(caractere):
    '''
    caractere appartient à 'a', 'b', ... 'z'
    renvoit 0 pour 'a', ... '25' pour 'z'
    '''
    pass

# Test
for c in ['a', 'b', 'c', 'x', 'y', 'z']:
    print("Code associé à {} est {}".format(c, tonumber(c)))

**Retour attendu.**
> Code associé à a est 0  
> Code associé à b est 1  
> Code associé à c est 2  
> Code associé à x est 23  
> Code associé à y est 24  
> Code associé à z est 25  

-   Écrire une fonction `toletter` qui étant donné un nombre entre 0 et 25 lui associe le caractère correspondant.



In [1]:
def toletter(nombre):
    '''
    nombre appartient à 0 ... 25
    renvoit le caractère alphabétique correspondant
    '''
    pass
for nombre in range(26):
    print("Caractère associé à {} est {}".format(nombre, toletter(nombre)))

**Retour attendu.**
> Caractère associé à 0 est a  
> Caractère associé à 1 est b  
> &#x2026;  
> Caractère associé à 24 est y  
> Caractère associé à 25 est z



#### À retenir.



Coder une information veut dire la représenter d'une autre manière, sous la forme d'une information encodée. Décoder une information consiste à reconstruire l'information originelle d'après l'information encodée. Tout le monde connait la façon de passer d'une information à son code et vice-versa.



### Chiffrer, déchiffrer



**Définition.** On appelle **méthode de chiffrement symétrique** du message `m` avec la clé `k` la donnée de deux fonctions : 

-   une fonction de chiffrement `c(m, k)`
-   une fonction de déchiffrement `d(m, k)`

De plus ces deux fonctions doivent vérifier `d(c(m,k), k) = m`

**Remarque.** L'égalité `d(c(m,k), k) = m` veut dire que lorsque l'on déchiffre à l'aide de la clé `k` un message qui lui-même a été chiffré avec la clé `k` on retombe sur le message originel.



## Le chiffre de César



### Chiffrement



Le chiffrement le plus simple est le chiffrement dit de César. Dans ce chiffrement, la clé est un nombre compris entre 1 et 25. Pour chiffrer un message, on remplace chacunes des lettres du messages par la `k` ième lettre suivante dans l'alphabet. 

Autrement dit, si par exemple la clé `k = 4`, la lettre `'a'` d'un message en clair sera chiffrée par la lettre `'e'`. La lettre `'b'` sera chiffrée par la lettre `'f'` , etc. La lettre `'z'` sera elle chiffrée par la lettre `'d'`.

À l'aide des fonctions `toletter` et `tonumber` définies précédemment, implémenter la fonction `remplace(c, k)` qui renvoit le `k` ième caractère suivant `c`. Si `k` est négatif, la fonction doit renvoyer le `k` ième caractère précédent `c`.

**Remarque.** Vous pouvez faire directement appel dans votre code aux fonctions `toletter` et `tonumber` sans avoir besoin de les redéfinir. On pensera à utiliser la fonction `%` pour réaliser le décalage.



In [1]:
def remplace(c, k):
    '''
    c est un caractère 'a', 'b', ... ou 'z'
    k est un nombre entier
    renvoit c décalé de k positions 
    '''
    pass
print("Exemple de remplacement :\n\
a -> {}, b -> {}, c -> {}, ... z -> {}\n".format(remplace('a', 4), remplace('b', 4), remplace('c', 4), remplace('z', 4)))

**Retour attendu :**
> Exemple de remplacement :  
> a -> e, b -> f, c -> g, &#x2026; z -> d  

On peut maintenant coder la fonction `chiffrement_cesar(m, k)` : celle-ci décalle toutes les lettres du message de `k` positions vers la droite si `k` est positif, de `-k` positions vers la gauche si `k` est négatif.



In [1]:
def chiffrement_cesar(m, k):
    '''
    m est une chaîne de caractères de taille > 1
    k est un nombre entier
    renvoit m chiffré avec le chiffrement de César et la clé k
    '''
    pass
m = "lansicestdelafolie"
k = 4
mchiffre = chiffrement_cesar(m, k)
print("Chiffre de César.\n\
Message           : {}\n\
Clé               : {} \n\
Message chiffré   : {}\n\
".format(m, k, mchiffre))

**Retour attendu.**
> Chiffre de César.  
> Message           : lansicestdelafolie  
> Clé               : 4  
> Message chiffré   : perwmgiwxhipejspmi



### Déchiffrement



Pour déchiffrer un message chiffré à l'aide du chiffrement de César et la clé `k` on réalise un décalage des lettres qui le composent dans l'autre sens : si `k` est positif, on décale toutes les lettres de `k` crans vers la la gauche, sinon on décale toutes les lettres de `-k` crans vers la droite. 

Implémenter une fonction `dechiffre_cesar` qui étant donné un message `m` que l'on sait chiffré à l'aide de la clé `k` renvoit le message originel.



In [1]:
def dechiffrement_cesar(m, k):
    '''
    m est une chaîne de caractères de taille > 1
    k est un nombre entier
    renvoit m dechiffré avec le chiffrement de César et la clé k
    '''
    pass
m = "lansicestdelafolie"
k = 4
mchiffre = chiffrement_cesar(m, k)
mdechiffre = dechiffrement_cesar(mchiffre, k)
print("Chiffre de César.\n\
Message           : {}\n\
Clé               : {} \n\
Message chiffré   : {}\n\
Message dechiffré   : {}\n\
".format(m, k, mchiffre, mdechiffre))

**Retour attendu.**
> Chiffre de César.  
> Message           : lansicestdelafolie  
> Clé               : 4   
> Message chiffré   : perwmgiwxhipejspmi  
> Message dechiffré : lansicestdelafolie



### Attaque



Une **attaque** d'un message chiffré est la tentative de retrouver le message originel sans disposer de l'information concernant la clé. Autrement dit, on ne dispose que du message chiffré, et on tente de retrouver le message originel.



#### Attaque par force brute



Dans le cas du chiffrement de César, expliquer pourquoi la méthde qui consiste à tester toutes les valeurs des clés est réaliste. On appelle ce genre de méthode une **attaque par force brute**. Déchiffrer le message chiffré suivant à l'aide d'une attaque par force brute et donner la clé utilisée pour le chiffrement. On pourra faire appel à la fonction `dechiffrement_cesar`.



In [1]:
mchiffre = 'mhvxlvfdfkh'

#### Attaque par analyse des fréquences.



Bien que l'attaque par force brute soit très efficace dans le cas du chiffre de César, on peut penser à d'autres types d'attaque. Par exemple, on sait que la lettre la plus utilisée en français est la letter `'e'` . Or, dans le chiffre de César, chaque lettre ne peut être codée que par une unique autre lettre. Ainsi, si le texte est assez long, il suffit de repérer quelle lettre se répète le plus, et "en théorie" celle-ci correspond à la lettre `'e'` dans le message originel. On en déduit de cette façon la valeur de la clé en étudiant le décalage entre cette lettre et la lettre `'e'`.

Implémenter une fonction `tableau_frequences(m)` qui étant donné un message `m` renvoit le tableau à 26 éléments dont l'élément d'indice `i` compte le nombre d'occurences de la lettre de position `i` dans le message `m`.



In [1]:
def tableau_frequences(m):
    '''
    m est une chaine de caractères de longueur >= 1 
    renvoit le nombre d'occurences de chaque caractère dans le message.
    '''
    pass

**Retour attendu**.
> [34, 10, 0, 4, 1, 4, 18, 2, 20, 21, 87, 5, 17, 6, 41, 4, 0, 37, 14, 45, 33, 10, 5, 33, 54, 41]

À l'aide de la fonction `maximum` dont on donne le code ci-dessous, implémenter une fonction `attaque_cesar` qui étant donné un message `m` renvoit le mesage originel et la clé `k` utilisée pour le chiffrer. Afficher le message ainsi que la clé utilisée pour le chiffrement du message précédent.



In [1]:
def maximum(l):
    '''
    l est un tableau de taille quelconque
    si l est vide, le maximum de l n'est pas défini
    si l est non vide, renvoit l'indice du plus grand élément du tableau
    ainsi que la valeur du plus grand élément du tableau
    '''
    if l == []:
        return 'NaN'
    else:
        plusgrand = l[0]
        indiceplusgrand = 0
        for k in range(len(l)):
            if l[k] > plusgrand:
                plusgrand = l[k]
                indiceplusgrand = k
        return indiceplusgrand, plusgrand

def attaque_cesar(m):
    '''
    m est un message chiffré à l'aide du chiffre de césar.
    renvoit le message originel et la clé utilisée pour le chiffrement.
    '''
    pass

## Le chiffrement XOR



### Chiffrement



La méthode de chiffrement XOR repose sur le principe du "ou exclusif". Si `b1` et `b2` sont deux bits (deux nombres compris entre 0 et 1), la fonction `xor(b1, b2)` renvoit 1 si `b1` ou `b2` valent 1 (mais pas s'ils valent 1 tous les deux!). Elle renvoit 0 sinon. Implémenter ci-dessous la fonction `xor` :



In [1]:
def xor(b1, b2):
    '''
    b1 et b2 sont deux bits
    renvoit 1 si b1 ou b2 vaut 1 (mais pas en même temps) et 0 sinon.
    '''
    pass

Si `m = 0` et `k = 1`, que vaut `m' = xor(m, k)` ? Que vaut `xor(m', k)` ?

À l'aide de cette fonction, il est possible de chiffrer et de déchiffrer des messages. La fonction `remplace_xor(c, k)` prend en entrée un caractère et une clé. La clé dans ce cas est un caractère. On remplace les deux caractères par leurs codes binaires correspondants à leur position dans l'alphabet et on effectue l'opération `xor` sur chacuns des bits. Puis, on renvoit le nombre associé. 

Par exemple : si `c = 't'` et `k = 'n'`, `c` a pour position 19 (partant de 0) et `k` a pour position 13 (partant de 0). 19 s'écrit `10011` en binaire, et 13 s'écrit `01101`. Puis on effectue une opération `xor` bit à bit :

| `c`|1|0|0|1|1|
|---|---|---|---|---|---|
| `k`|0|1|1|0|1|
| `c' = xor(c, k)`|1|1|1|1|0|

Le `c` chiffré avec la clé `k` a donc pour code binaire `11110`, c'est le nombre `30`.  

Si l'on souhaite maintenant déchiffrer le nombre 30 avec la clé `k`, on effectue la même opération en remplaçant `c` par `c'`.

| `c'`|1|1|1|1|0|
| `k`|0|1|1|0|1|
| `c`|1|0|0|1|1|

Donc `c'` a bien été chiffré en un nombre dont le code binaire est `10011`, c'est le nombre 19 qui correspond à la lettre `t`. 

**Exercice** Écrire une fonction `remplace_xor` qui étant donné un caractère `c` et une clé `k` (un caractère), chiffre le caractère `c` par la clé `k` et la méthode `xor`. 

**Remarque.** Si `a` et `b` sont deux nombres écrits en base 10, `a^b` réalise l'opération `xor` bit à bit sur `a` et `b`. Tester les opérations 19<sup>13</sup>, et 30<sup>13</sup>.



In [1]:
def remplace_xor(c, k):
    '''
    c et k sont des caractères
    renvoit le nombre correspondant au xor bit à bit des nombres 
    correspondants à c et à k
    '''
    pass

Pour chiffrer un message `m` (par exemple `vivelinformatique`), on choisit une clé `k` (par exemple `turing`), et on va chiffrer chaque caractère du message à l'aide de la clé de la manière suivante :

| Message `m`|v|i|v|e|l|i|n|f|o|r|m|a|t|i|q|u|e|
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| Clé `k`|t|u|r|i|n|g|t|u|r|i|n|g|t|u|r|i|n|
| Message chiffré `m'`|6|28|4|12|6|14|30|17|31|25|1|6|0|28|1|28|9|

Puis on effectue le remplacement de chaque caractère à l'aide de la clé `k` correspondante. Par exemple, on commence par `remplacement_xor('v', 't')`, etc.

**Exercice** Implémenter une fonction `chiffrement_xor` qui étant donné un message `m` et une clé `k` renvoit le message chiffré correspondant (un tableau de nombres). Vous pourrez utiliser la fonction `remplace_xor` définie précédemment, ainsi que la fonction `repete_cle` dont on donne le code et la spécification ci-dessous.

Ne pas oublier de tester votre fonction.



In [1]:
def repete_cle(k, indice):
    '''
    k est une chaine de caractère ou un tableau
    indice est un entier quelconque.
    renvoit k[indice] sans erreur d'indice possible : si on dépasse
    la taille du tableau on recommence à compter à partir de 0.
    '''
    return k[indice%len(k)]

def chiffrement_xor(m, k):
    '''
    m  et k sont des chaînes de caractères
    renvoit le tableau de nombres correspondant au chiffrement de m par k
    '''
    pass

### Déchiffrement



On remarque que si `a` et `b` sont deux nombres, et que `c = a^b`, alors `c^b = a`. Ainsi, pour déchiffrer un message `m'` à l'aide de la clé `k`, on va simplement transformer `k` en un tableau de nombres, puis appliquer un `xor` caractère par caractère. Enfin, on renvoit le caractère correspondant pour chaque élément du tableau de nombres ainsi construit.

| Message chiffré `m'`|6|28|4|12|6|14|30|17|31|25|1|6|0|28|1|28|9|
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| Clé `k`|t|u|r|i|n|g|t|u|r|i|n|g|t|u|r|i|n|
| Clé `k`  (codes)|19|20|17|8|13|6|19|20|17|8|13|6|19|20|17|8|13|
| Message (codes)|21|8|21|4|11|8|13|5|14|17|12|0|19|8|16|20|4|
| Message|v|i|v|e|l|i|n|f|o|r|m|a|t|i|q|u|e|

**Exercice** Implémenter une fonction `dechiffrement_xor` qui étant donné un message chiffré `m` à l'aide de la clé `k` renvoit le message dechiffré correspondant. 

Ne pas oublier de tester votre fonction.



In [1]:
def dechiffrement_xor(m, k):
    '''
    m est un tableau de nombres, obtenu par chiffrement xor à l'aide de la clé k
    k sont des chaînes de caractères
    renvoit le message originel
    '''
    pass