# ASR4 - Sécurisation des communications

# TP - Cryptographie 

La cryptographie est la science portant sur le **chiffrement** et le **déchiffrement** de données, c'est à dire de la transformation de celles-ci dans le but de les rendre incompréhensibles à quiconque ne dispose pas de la bonne **clé**. 

Nous allons à travers ce TP, en découvrir plusieurs méthodes.


## 1 - Préparation

### 1.1 - Échange de fichiers textes sur canal public

Ce TP a pour objectif de vous faire échanger des messages les uns avec les autres de manière sécurisée par de biais d'un cannal de discussion public. Nous allons pour cela utiliser un thread discord : 

> Q1 - Connectez-vous au serveur discord et rejoignez le thread CRYPTO (j'espère que ça va marcher avec les raspberry)

Sur ce thread, vous allez vous échanger des messages sous la forme de fichiers textes. Les consignes suivantes sont à respecter :

- Un fichier a un **destinataire** spécifié dans le nom du fichier : `toto.txt` est destiné à Toto. 
- Un fichier peut être **clair** ou **chiffré**, le nom d'un fichier chiffré est préfixé selon son protocole de chiffrement :

| Protocole de chiffrement | Préfixe          | Exemple        |
| ------------------------ | ---------------- | -------------- |
| Aucun                    |                  | `toto.txt`     |
| César                    | `ces`            | `ces_toto.txt` |
| XOR                      | `xor`            | `xor_toto.txt` |
| Merkle                   | `mer`            | `mer_toto.txt` |
| Diffie-Hellman           | `dhm`            | `dhm_toto.txt` |
| RSA                      | `rsa`            | `rsa_toto.txt` |

- Excepté pour les méthodes de Merkle et Diffie-Hellman, un fichier commence par la ligne `Aujourd'hui il fait beau, Toto va à la plage.`.

> Q2 - Regroupez-vous par binomes puis échangez vous sur le thread un message clair en respectant les consignes.

### 1.2 - Type bytes en Python, encodage 

Le type Python `bytes` correspond à une **chaîne non-mutable et non-modifiable d'octets**, il d'agît d'un type de donné très proche des données brutes manipulées dans une machine ou échangées sur un réseau. Travailler avec de tels objets, plutôt que par exemple avec des chaînes de caractère permet donc de mieux rentrer dans les détails des chiffrements que nous allons voir mais aussi de manipuler des fichiers n'étant pas forcément des textes. 

On peut construire des objets de ce type de plusieurs manières :


In [14]:
# À partir de tableaux d'entiers entre 0 et 255

t = [65,123,235,55]
b = bytes(t)
t = list(b)

print(b)
print(len(b), b[0], b[1])
print()


# En encodant une chaîne de caractère en utf-8

s = "élève"
b = s.encode() 
s = b.decode()   # les méthodes encodes et décode peuvent prendre en argument le format d'encodage, par défaut, il s'agît de l'utf-8

print(b)
print(len(b), b[0], b[1])
print()

# À partir d'un entier qu'on écrit en base 256

n = 1025
b = int.to_bytes(n,2,'big')   # l'argument 2 sert à préciser le nombre d'octets à utiliser pour encoder l'entier 
n = int.from_bytes(b, 'big')  # dans les deux cas, l'argument 'big' sert à préciser qu'on lit le binaire de gauche à droite

print(b)
print(len(b), b[0], b[1])
print()

b'A{\xeb7'
4 65 123

b'\xc3\xa9l\xc3\xa8ve'
7 195 169

b'\x04\x01'
2 4 1



> 3. Convertir le tableau `[65,66,67]` en bytes et afficher le résultat, comment l'expliquer ?
> 4. Convertir le texte `"école"` en bytes et en afficher la taille. Pourquoi n'obtient-on pas 5 ? 
> 5. Convertir l'entier `2000` en un bytes `b` (2 octets) et afficher les valeurs de `b[1]` et `b[0]`. Retrouver ces valeurs par le calcul.

Afin de lire et écrire dans nos fichiers textes en Pyhton, nous utiliserons le script suivant : 

In [22]:
### Chargement des octets composants le fichier "toto.txt" dans un bytes b

f = open("toto.txt", 'rb')  # ouvre un flux de données binaires en lecture provenant de "toto.txt" 
b = f.read()                # stocke le contenu du fichier dans un bytes b 
f.close()                   # coupe le flux


### Sauvegarde des octets du bytes b dans le fichier "toto.txt"

f = open("toto.txt", 'wb')  # ouvre un flux de données binaires en lecture provenant de "toto.txt" 
f.write(b)                  # stocke le contenu du fichier dans un bytes b 
f.close()                   # coupe le flux

> Q6 - Écrire un script Python comptant le nombre de lettres `'a'` dans un fichier texte.
> Q7 - Écrire un script Python générant un fichier texte `"hello.txt"` contenant le texte `"hello world!"`.



### 1.3 - Données interprétées, données encodées, données chiffrées

Il est important avant de passer à la suite de bien distinguer les différentes formes sous lesquelles des données peuvent être manipulées. Pour cela, prenons l'exemple d'un lecteur de musique. 

- données interprétée : pour notre logiciel, un fichier son est une suite de fréquences à transmette à un système son à intervalle de temps régulié. En Python, on pourrait imaginer garder en mémoire:
 - le nombre `N` (`int`) de sons joués par seconde ;
 - un tableau `t` dont les valeurs sont de type `float`, la liste de toutes les fréquences à jouer.
 
 
 
- données encodées : pour garder en mémoire un fichier son sur un ordinateur, celui-ci doit être mis sous la forme d'une suite de bits 0/1 ou encore d'une suites d'octets, on parle alors de fichier **encodé**. La méthode permettant de passer de données interprétées à des données encodées est appelé le **format d'encodage**, il donne généralement son extention au fichier.
 - dans notre exemple, on peut encoder notre fichier au format mp3, wav, wma, midi, etc. ;
 - pour encoder des nombre relatif, on peut utiliser le complément à deux sur un certain nombre de bits (ce n'est pas ce que fait Python) ;
 - pour encoder des flottants, on utilise le format IEEE754 simple ou double ;
 - pour encoder un texte, on peut utiliser selon le texte les formats ASCII, latin-$n$, UTF-8, UTF-16, UTF-32, etc.
 
 
 
 
- données chiffrées : si on veut envoyer par mail un fichier sensible `"top_secret.mp3"`, on a tout intérêt à le modifier de sorte qu'une personne malveillance qui intercepterait le mail ne puisse pas le lire sans en avoir l'autorisation. On va donc générer un nouveau fichier `"top_secret_crypte"` (l'extention n'a pas d'importance) à partir des octets de `"top_secret.mp3"` à l'aide d'un **algorithme de chiffrement**, et c'est ce fichier que l'on va envoyer. Le destinataire, avec qui on se sera miis d'accord au préalable, devra alors déchiffrer le fichier avant de le lancer avec son propre lecteur.





## 2 - Chiffrements symétriques

Un **algorithme de chiffrement symétrique** est une méthode permettant de chiffrer des données à l'aide d'une certaine **clée**, cette **même clée** étant nécessaire pour déchiffrer les données.

### 2.1 - Chiffrement de César

### Principe

Le chiffrement de César consiste, dans sa version historique, à effectuer un décalage d'un certin nombre des 26 lettres de l'alphabet dans le but de chiffrer un texte, chaque lettre étant remplacée par une autre. **La valeur du décalage constitue la clé du chiffrement**. 

Par exemple, avec un décalage de k=3 on transforme les lettre d'un message de la façon suivante :

| a | b | c | d | e | f | g | h | i | j | k | l | m | n | o | p | q | r | s | t | u | v | w | x | y | z |
|-|-|-|-|-|-|-|-|-|-|-|-|-|-|-|-|-|-|-|-|-|-|-|-|-|-|
| d | e | f | g | h | i | j | k | l | m | n | o | p | q | r | s | t | u | v | w | x | y | z | a | b | c |

Le message `"coucou"` est chiffré en `"frxfrx"`.

À l'inverse, une personne voulant déchiffrer un message devra alors savoir que le texte original a subit un décalage de 3 pour pouvoir le déchiffrer à l'aide du tableau inverse : 

| a | b | c | d | e | f | g | h | i | j | k | l | m | n | o | p | q | r | s | t | u | v | w | x | y | z |
|-|-|-|-|-|-|-|-|-|-|-|-|-|-|-|-|-|-|-|-|-|-|-|-|-|-|
| x | y | z | a | b | c | d | e | f | g | h | i | j | k | l | m | n | o | p | q | r | s | t | u | v | w |

Le message chiffré `"khoor"` se déchiffre ainsi en `"hello"`.

> Q1 - chiffrer le message `"bonjour"` avec la clé `k = 16`. 

### Implémentation 

Informatiquement, il ne sert à rien de ne chiffrer que les lettres. Il est préférable de travailler sur les octets du fichier encodé.

> 2.a. écrire une fonction `cesar(b:bytes, k:int) -> bytes` prenant en argument une chaîne d'octets `b` et une clé entière `k` et renvoyant la chaîne d'octets obtenue en décalant les octets de `k` (après 255, on revient à 0). 



In [None]:
def cesar(b:bytes, k:int)->bytes:
    # à compléter 

> Q2.b - Ci-dessous se trouve un `bytes` chiffré à l'aide de cette fonction avec la clé `k = 149`. Avec quelle clé peut-on le déchiffrer ? 

In [11]:
b'\xd7\x08\xf6\x0c\x05\xc1\xb5\n\x0b\xb5\xf6\t\xb5\x08Y?\x0b\t\t\xfe\xb5Y6\xb5\xf9Y?\xf8\x05\xf9\xfa\x08\xb5\x02\xfa\xb5\x03\xfa\t\t\xf6\xfc\xfa\xb5\xb6\xb5\xdf\xbc\xfa\t\x06Y>\x08\xfa\xb5\x07\x0b\xfa\xb5\n\x0b\xb5\n\xbc\xf6\x03\x0b\t\xfa\t\xb5\xf7\xfe\xfa\x04\xb5\xfa\n\xb5\xf7\x05\x04\xb5\xf8\x05\x0b\x08\xf6\xfc\xfa\xb5\x06\x05\x0b\x08\xb5\x02\xf6\xb5\t\x0b\xfe\n\xfa\xb5\xb6'

b'\xd7\x08\xf6\x0c\x05\xc1\xb5\n\x0b\xb5\xf6\t\xb5\x08Y?\x0b\t\t\xfe\xb5Y6\xb5\xf9Y?\xf8\x05\xf9\xfa\x08\xb5\x02\xfa\xb5\x03\xfa\t\t\xf6\xfc\xfa\xb5\xb6\xb5\xdf\xbc\xfa\t\x06Y>\x08\xfa\xb5\x07\x0b\xfa\xb5\n\x0b\xb5\n\xbc\xf6\x03\x0b\t\xfa\t\xb5\xf7\xfe\xfa\x04\xb5\xfa\n\xb5\xf7\x05\x04\xb5\xf8\x05\x0b\x08\xf6\xfc\xfa\xb5\x06\x05\x0b\x08\xb5\x02\xf6\xb5\t\x0b\xfe\n\xfa\xb5\xb6'

> Q3.a - À l'aide d'un éditeur de texte, écrire un message secret à destination de votre binome.

> Q3.b - Mettez vous d'accord (de manière discrète !) sur une clé de chiffrement partargée.

> Q3.c - Écrivez programme Python permettant de chiffrer votre message avec la clé choisie.

> Q3.d - Transmettez ce message à votre binome en passant par le canal public. 

> Q3.e - Écrivez programme Python permettant de déchiffrer le message de votre binome.

### 2.2 - Chiffrement XOR

### Petit rappel de première : la fonction booléenne XOR 

On définit la fonction XOR (ou exclusif) par la table de vérité suivante : 

| x | y | x $\oplus$ y |
| - | - | - |
| 0 | 0 | 0 |
| 0 | 1 | 1 |
| 1 | 0 | 1 |
| 1 | 1 | 0 |

Cette fonction possède une propriété intéressante pour le chiffrement de données binaires : 

*Quelques soient $x$ et $y$ $\in\mathbb{B}$,*
$$
(x\oplus y)\oplus y = x
$$

On voit qu'un booléen $y$ peut donc servir de clé de chiffrement pour un autre booléen $x$. Dit comme cela ce n'est pas très intéressant, mais consirérons maintenant l'opération XOR sur un octet (8-bits). Étant donnés deux octets $X$ et $Y$, on obtient l'octet $X\oplus Y$ en effectuant l'opération XOR sur chacuns des 8 bits de $X$ et de $Y$.

Prenons un exemple : 


$$
\begin{array}{cc cccc cccc}
 &&1&1&1&0& &0&1&0&1\\
\oplus&&1&0&1&1& &0&0&0&1\\
\hline
=&&0&1&0&1& &0&1&0&0\\
\end{array}
$$

Biensur, la propriété valable pour les bits reste valable pour les octets, on a toujours *quelques soient les octets $X$ et $Y$,* 
$$
(X\oplus Y)\oplus Y = X
$$

Vérifions le sur notre exemple

$$
\begin{array}{cc cccc cccc}
 &&1&1&1&0& &0&1&0&1\\
\oplus&&1&0&1&1& &0&0&0&1\\
\hline
=&&0&1&0&1& &0&1&0&0\\
\oplus&&1&0&1&1& &0&0&0&1\\
\hline
=&&1&1&1&0& &0&1&0&1\\
\end{array}
$$

En Python, l'opérateur XOR a pour symbole `^` et peut être utilisé entre deux entiers, l'opération étant effectuée bit par bit de leur écriture binaire. 

In [9]:
X = 234
Y = 177
print(X^Y)

91


> Q4.a - Vérifier que ce calcul correspond à l'exemple donné plus haut en coalculant les écritures binaire de 234, 177 et 91. 

> Q4.b - Vérifier la propriété $(X\oplus K) \oplus K = X$ avec quelques exemples.

### Algorithme de chiffrement 

On se donne une clé `k` sous la forme d'une chaîne de caractère. Si on veut chiffrer une chaîne d'octets `b`, on procède comme suit : 

1. convertir `k` en chaîne d'octets ;
2. pour chaque octet de `b` :
 1. faire correspondre cet octet avec un octet de `k` (si `k` a trop peu d'octet, on repart au premier) ;
 2. appliquer l'opération XOR ;
3. renvoyer la chaîne d'octets ainsi construite.

> Q5.a - Écrire une fonction `xor(b:bytes, k;str) -> bytes` réalisant cet algorithme.
 

In [None]:
def xor(b:bytes, k;str) -> byte:
    pass # à compléter 

> Q5.b - Ci-dessous se trouve un `bytes` chiffré à l'aide de cette fonction avec la clé `k = "martingale"`. Avec quelle clé peut-on le déchiffrer ? 

In [12]:
b')\xa2\xdb\x17\x00\n\xa4\xc8\x01\x00\x03\x15R\x1b\x07N\t\x04L\x11J\x00\x00\x06\xaa\xc4\x13\x04L\x15\x0c\x12RUI,\x15\x00\x1a\nM@'

b')\xa2\xdb\x17\x00\n\xa4\xc8\x01\x00\x03\x15R\x1b\x07N\t\x04L\x11J\x00\x00\x06\xaa\xc4\x13\x04L\x15\x0c\x12RUI,\x15\x00\x1a\nM@'

> 6.a. À l'aide d'un éditeur de texte, écrire autre un message secret à destination de votre binome.

> 6.b. Mettez vous d'accord (de manière discrète !) sur une clé de chiffrement partargée.

> 6.c. Écrivez programme Python permettant de chiffrer votre message avec la clé choisie.

> 6.d. Transmettez ce message à votre binome en passant par le canal public. 

> 7.e. Écrivez programme Python permettant de déchiffrer le message de votre binome.

## 3 - Chiffrements asymétriques


Les chiffrements symétriques sont bien pratiques pour chiffrer des données, mais possèdent une faille majeure : pour s'échanger des messages à l'aide de tels algorithmes, la connaissance de la clé de chiffrement est nécessaire au destinataire afin de déchiffrer le message de l'émetteur. Pour les utiliser, on doit donc se mettre d'accord sur une clé commune. Or :

- pas question de se rencontrer physiquement ou d'utiliser un autre canal (cela déplace le problème) ;
- pas question de partager la clé de chiffrement en clair (sinon n'importe qui pourra déchiffrer le message).

Nous allons voir trois méthodes permettant à deux interlocteurs de se mettre d'accord sur une clé de chiffrement de manère sécurisée, c'est à dire sans qu'un intervenant extérieur ne puisse deviner celle-ci.

Pour plus de clareté dans la suite, et afin de décrire les protocoles d'échange de clés, nous désignerons les protagonistes de l'échange avec les noms suivants :

- Alice est l'emettrice ;
- Bob est le destinataire ; 
- Eve est une personne cherchant à espionner la conversation entre Alice et Bob.

Dans tous les cas, Alice et Bob doivent réussir à se mettre d'accord sur une clé de chiffrement commune en communiquant sur un canal public, sans qu'Eve (qui peut intercepter leurs messages) ne puisse la deviner. 

### 3.1 Méthode des puzzles de Merkle

Le principe des puzzle de Merkle est le suivant : 

1. Alice génère un grand nombre (par exemple `N = 10000`) de triplets aléatoires `(identifiant, grande_clé, petite_clé)`. Les chiffres du tableau se-dessous sont des valeurs à respecter pour le TP. 


 | chaîne        | utilité                                      | taille | code ASCII des caractères |
 | ------------- | -------------------------------------------- |------- | ------------------------- |
 | `identifiant` | sert à identifier les lignes de manière sûre | 12     | entre 33 et 126           |
 | `grande_cle`  | proposition de clé commune                   | 16     | entre 33 et 126           |
 | `petite_cle`  | clé servant à chiffrer la ligne              | 4      | entre 65 et 90            |
 
 
2. Alice génère N lignes de la forme `"identifiant : <identifiant>, cle <grande_cle>"`, les encode et les chiffre avec la `petite_cle` correspondante (ici avec un chiffrement XOR). Elle concatène ses lignes et les sauvegarde dans un fichier chiffré.


3. Alice envoie le fichier chiffré à Bob. 


4. Bob choisit une ligne au hasard et casse le chiffrement de cette ligne par force brute (c'est à dire qu'il essaie toutes les combinaisons possible de `petite_clé` dans le but d'obtenir un message commençant par `"identifiant : ..."`)


6. Bob envoie à Alice et en clair l'`identifiant` de la ligne.


7. Alice et Bob peuvent communiquer avec la `grande_clé` correspondante.


> Q1 - En imaginant que Bob mette environs 10 seconde à casser le chiffrement de la ligne qu'il a choisit, expliquer pourquoi Eve ne pourra pas facilement deviner la clé commune.

> Q2 - Écrire des fonctions Pythons permettant de réaliser les étapes 1, 2 et 4 de la méthode.



In [16]:
def generer(N:int)->list[tuple[str, str, str]]:
    """renvoie le tableau des id, K, k"""
    pass # à compléter

def chiffrer(t:list[tuple[str, str, str]])->bytes:
    """chiffre le tableau ligne par ligne avec les petites clés"""
    pass # à compléter

def choix(bytes)->tuple[str, str]:
    """choisit une ligne du tableau, casse le chiffrement et renvoie la clé et son identifiant"""
    pass # à compléter

> Q3 - En passant par le canal public, utilisez cette méthode pour vous mettre d'accord avec votre binôme sur une clé de chiffrement puis échangez-vous quelques message chiffrés à l'aide de cette clé.


### 3.2 La méthode Diffie-Hellman



### 3.3 Le chiffrement RSA