In [None]:
from outils import* # Lancer la cellule pour importer les outils nécessaires au notebook.

# <div style = "text-align : center;"><span style="border: 2px solid;padding:6px;color:dodgerblue;">CHIFFREMENT SYMETRIQUE ET ASYMETRIQUE</span></div> #

## <span style="text-decoration: underline;color:red;">I. Contexte:</span> ##
Dans les usages quotidiens d’internet (achats en ligne par exemple), les informations doivent être <strong>cryptéees</strong> afin d’éviter qu’une personne interceptant cette information ne soit capable d’en lire le contenu.<br>
![alt text](mes_images/hacker.png)<br>
Cependant, les techniques de cryptographie sont antérieures à internet... <br>
L’objectif de ce chapitre est de présenter certains procédés de <strong>cryptographie</strong>, indépendamment de la méthode de transmission<br>
<br>
Dans un deuxième notebook, nous étudierons un <strong>protocole d’échange de données sécurisées</strong> sur internet.
### <span style="text-decoration: underline;color:green;">1. Vocabulaire :</span> ###
Définitions liées à la représentation de l’information :
- <strong>Coder</strong> ou <strong>encoder</strong> une information : la représenter par un ensemble de signes prédéfinis ($0$ et $1$ en binaire par exemple).


- <strong>Décoder</strong> une information : interpréter l'ensemble de signes qui la codent pour l'extraire.


- <strong>Chiffrer</strong> : rendre <strong>incompréhensible</strong> une suite de symboles  au moyen d’une <strong>clé de chiffrement</strong>


- <strong>Déchiffrer</strong> : retrouver la suite de symboles originale à partir du message chiffré <strong>en utilisant une clé de déchiffrement</strong>


- <strong>Décrypter</strong> : retrouver la suite de symboles originale à partir du message chiffré <strong>sans posséder la clé de déchiffrement</strong>

## <span style="text-decoration: underline;color:red;">II. Chiffrement symétrique:</span> ##
<div class="alert alert-block alert-info"> Le chiffrement <strong>symétrique</strong> est basé sur le principe <strong>d'une même clé</strong> utilisée pour chiffrer et déchiffrer le message.</div><br>
Etudions deux exemples classiques.<br>

### <span style="text-decoration: underline;color:green;">1. Le chiffrement de César (-50 AV JC):</span> ###
![alt text](mes_images/cesar.jpg)
#### <span style="text-decoration: underline;color:blue;">a. Quelques rappels :</span> ####
● Avec le standard <strong>Unicode</strong>, <span style="font-weight: bold;">tout caractère</span> est <strong>identifié de façon unique par un entier</strong> qu'on obtient avec la fonction <span style="font-family:Courier New;font-size: 100%;">ord</span> Python :<br>


In [None]:
print("A est identifié par l'entier", ord("A"))
print("N est identifié par l'entier", ord("N"))
print("Z est identifié par l'entier", ord("Z"))

● On peut inversement obtenir le caractère en connaissant cet entier avec la fonction <span style="font-family:Courier New;font-size: 100%;">chr</span> :<br>


In [None]:
print("Le caractère d'identifiant", 65, "est", chr(65))
print("Le caractère d'identifiant", 78, "est", chr(78))
print("Le caractère d'identifiant", 90, "est", chr(90))

● Ainsi, les majuscules ont un unicode allant de 65(A) à 90(Z) et les minuscules de 97(a) à 122(z).
#### <span style="text-decoration: underline;color:blue;">b. Principe du chiffrement :</span> ####
● On applique un <strong>même décalage</strong> pour chaque lettre du message (en repartant au "A" après le "Z"). <br>
Il suffit donc d’appliquer ce décalage "dans l’autre sens" pour retrouver le message d’origine.<br>
<br>
● Ce principe est évidemment <strong>peu efficace</strong> car on peut décrypter n’importe quel message par <strong>"force brute"</strong> (ie en <strong>testant tous les décalages possibles</strong>).<br>
Complétez la fonction <span style="font-family:Courier New;font-size: 100%;">chiffrer&#95;cesar</span> :<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;→ qui prend en paramètre un message <span style="font-family:Courier New;font-size: 100%;">str&#95;message</span> ne contenant <strong>que des majuscules sans espaces</strong><br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;→ et qui renvoie la chaine obtenue après décalage de chaque lettre de l'entier <span style="font-family:Courier New;font-size: 100%;">int&#95;decalage</span><br>


In [None]:
def chiffrement_cesar(str_message, int_decalage):
    '''renvoie le message obtenu en appliquant à chaque lettre de str_message le int_decalage choisi'''
    pass

assert chiffrement_cesar("ABCD", 1) == "BCDE", "erreur"

In [None]:
solution.chiffrement_cesar()

### <span style="text-decoration: underline;color:green;">2. Le chiffrement <span style="font-family:Courier New;font-size: 100%;">XOR</span> :</span> ###
![alt text](mes_images/xor.png)<br>
Ce chiffrement est un peu moins naïf. Il est basé sur l’opérateur binaire <span style="font-family:Courier New;font-size: 100%;">XOR</span> (“ou exclusif") directement implémenté dans les unités arithmétiques et logiques (<i>UAL</i>) des processeurs. <br>
<span style="font-family:Courier New;font-size: 100%;">XOR</span> est un opérateur est noté ⊕ 
#### <span style="text-decoration: underline;color:blue;">a. <span style="font-family:Courier New;font-size: 100%;">XOR</span> :</span> ####


In [None]:
qcm.XOR()

In [None]:
qcm.deux_fois_XOR()

#### <span style="text-decoration: underline;color:blue;">b. Principe du chiffrement :</span> ####
● On dispose d’un texte <span style="font-family:Courier New;font-size: 100%;">message</span> à chiffrer:<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;→ par exemple <span style="font-family:Courier New;font-size: 100%;">message = "VIVE LA NSI"</span><br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;→ à l’aide d’une <span style="text-decoration: underline;"><span style="font-family:Courier New;font-size: 100%;">cle</span> de chiffrement</span> qui est aussi un texte (plus court), par exemple <span style="font-family:Courier New;font-size: 100%;">cle = "hmx"</span>.<br>
<br>
● On répète <strong>autant de fois que nécessaire</strong> les caractères de <span style="font-family:Courier New;font-size: 100%;">cle</span> afin d’obtenir une chaine de même longueur que <span style="font-family:Courier New;font-size: 100%;">message</span> :<br>
ici cela donnerait :<br>
![alt text](mes_images/exemple_xor.png)<br>
<br>
● On encode chaque caractère de <span style="font-family:Courier New;font-size: 100%;">message</span> et <span style="font-family:Courier New;font-size: 100%;">cle</span> en un entier (<strong>Unicode</strong>), qu'on convertit ensuite en <strong>binaire</strong>. Ici :<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;→ le <span style="font-family:Courier New;font-size: 100%;">V</span> de <span style="font-family:Courier New;font-size: 100%;">VIVE LA NSI</span> est codé par l'entier <span style="font-family:Courier New;font-size: 100%;">86</span> soit <span style="font-family:Courier New;font-size: 100%;">01010110</span> en binaire.<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;→ le <span style="font-family:Courier New;font-size: 100%;">h</span> de <span style="font-family:Courier New;font-size: 100%;">hmx</span> est codé par l'entier <span style="font-family:Courier New;font-size: 100%;">104</span> soit <span style="font-family:Courier New;font-size: 100%;">01101000</span> en binaire.<br>
<br>
La fonction <span style="font-family:Courier New;font-size: 100%;">binaire(str&#95;caractere)</span> permet d'obtenir <strong>directement l'écriture binaire</strong> de l'entier qui code <span style="font-family:Courier New;font-size: 100%;">str&#95;caractere</span> :<br>


In [None]:
def binaire(str_caractere):
    """renvoie, sous forme d'une chaine, le codage en binaire du caractere str_caractere"""
    r  = bin(ord(str_caractere))[2:]
    return (8-len(r))*"0" + r

binaire("A") # renvoie l'entier 65 codé en binaire sur un octet

● Il reste à faire un <span style="font-family:Courier New;font-size: 100%;">XOR</span> sur chacun des 8 bits entre les 2 valeurs obtenues :<br>
![alt text](mes_images/chiffrer_xor.png)<br>
<span style="font-weight: bold;color:red;"><span style="font-family:Courier New;font-size: 100%;">00111110</span></span> correspond à <span style="font-weight: bold;color:red;"><span style="font-family:Courier New;font-size: 100%;">62</span></span>, c'est à dire au caractère <span style="font-weight: bold;color:red;">></span>.<br>
La fonction <span style="font-family:Courier New;font-size: 100%;">caractere(str&#95;binaire)</span> permet d'obtenir directement le caractère dont l'écriture binaire est donné :<br>


In [None]:
def caractere(str_binaire):
    '''renvoie le caractère ayant pour code binaire str_binaire'''
    return chr(int(str_binaire, 2))

caractere("00111110") # 00111110 = 62 qui code '>'

● Le message est chiffré en <strong>répétant ce procédé</strong> sur chaque caractère du message.<br>
Le chiffrement est <strong>symétrique</strong>, car on déchiffre en appliquant l'opérateur ⊕ avec <strong>la même clé</strong> au message chiffré. <br>
<br>
<span style="text-decoration: underline;font-style: italic;">Remarque :</span><br>
En <i>Python</i>, l'opérateur <span style="font-family:Courier New;font-size: 100%;">XOR</span> s'obtient à l'aide du symbole <span style="font-family:Courier New;font-size: 100%;">^</span> <strong>entre deux entiers</strong>:<br>
<span style="font-family:Courier New;font-size: 100%;">1 ^ 0</span> renvoie <span style="font-family:Courier New;font-size: 100%;">1</span><br>
<br>
● Complétez la fonction <span style="font-family:Courier New;font-size: 100%;">chiffrement&#95;xor(str&#95;message, str&#95;cle)</span>:<br>


In [None]:
def chiffrement_xor(str_message, str_cle):
    """renvoie la chaine de caractère obtenue en appliquant le chiffrement XOR"""
    pass

assert chiffrement_xor("VIVE LA NSI", "hmx") == ">$.-M4)M6;$", "erreur codage VIVE LA NSI"
assert chiffrement_xor(">$.-M4)M6;$", "hmx") == "VIVE LA NSI", "deux xor consecutifs doivent redonner message depart"

In [None]:
solution.chiffrement_xor()

#### <span style="text-decoration: underline;color:blue;">c. Décrypter un message par force brute...</span> ####
Considérons les listes suivantes :<br>


In [None]:
majuscules = [chr(65 + k) for k in range(26)]
minuscules = [chr(97 + k) for k in range(26)]

Essayons de décrypter un message en <strong>imposant les limites suivantes</strong> : 
- le <span style="font-family:Courier New;font-size: 100%;">message</span> à <strong>décrypter</strong> ne contient <strong>que les lettres majuscules ou minuscules</strong>, eventuellement des <strong>espaces</strong> (dont l'unicode vaut <span style="font-family:Courier New;font-size: 100%;">32</span>)

- la clé ne contient <strong>que les lettres majuscules</strong>, au nombre maximum de 4!


Si on sait que la clé est composée  de $n$ caractères <strong>majuscules au maximum</strong>, combien de clés, en fonction de $n$ va-t-on tester?<br>
![al text](mes_images/crayon_papier.png)<br>


In [None]:
solution.nb_cles()

● On obtient ainsi $456~976$ clés de taille <strong>inférieure ou égale à 4</strong>!<br>
<br>
Construire la fonction <span style="font-family:Courier New;font-size: 100%;">cle&#95;taille(n)</span> qui renvoie la liste des clés possibles composées de <strong>exactement</strong> $n$ majuscules.<br>


In [None]:
def cle_taille(n):
    """renvoie la liste des clés possibles de taille n majuscules"""
    pass

assert len(cles_taille(1)) == 26, "erreur nombre de clés de taille 1"
assert len(cles_taille(2)) == 676 , "erreur nombre de clés de taille 2"
assert len(cles_taille(3)) == 17576 , "erreur nombre de clés de taille 3"
assert len(cles_taille(4)) == 456976  , "erreur nombre de clés de taille 4"

In [None]:
solution.cle_taille()

● Le message <span style="background-color:yellow;font-weight:bold;">\\$\%#?g&)s++!1#+l0&&/&+</span> a été chiffré avec une clé de taille <strong>inférieure ou égale à 4</strong>, ne contenant <strong>que des majucules</strong>.<br>
A vous de le <strong>décrypter</strong> <span style="text-decoration: underline;">en retrouvant la clé utilisée</span>...<br>
<br>
<span style="text-decoration: underline;font-style: italic;">Remarque :</span><br>
N'hésitez pas à utiliser le module <span style="font-family:Courier New;font-size: 100%;">tqdm</span> lorsque vous bouclez sur les <strong>tailles de clés possibles</strong>.<br>
Il permet de <strong>visualiser l'avancement d'une boucle</strong> :<br>


In [None]:
from tqdm import tqdm
for k in tqdm(range(10**6)):
    pass

In [None]:
message = '$%#?g&)s++!1#+l0&&/&+'

def decrypter(str_message, taille_max = 4):
    ''''renvoie une liste de possibilités et la clé associée pour décrypter str_message'''
    pass

In [None]:
solution.decrypter()

### <span style="text-decoration: underline;color:green;">3. Alternatives :</span> ###
● Il existe d’autres algorithmes de chiffrement symétrique :<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;→ comme <a href="https://fr.wikipedia.org/wiki/Advanced_Encryption_Standard">"AES" (Advanced Encryption Standard) </a><br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;→ et <a href="https://en.wikipedia.org/wiki/ChaCha20-Poly1305">"ChaCha20"</a>.<br>
<br>
● Ils sont plus complexes mais basés sur des chiffrements similaires au chiffrement <span style="font-family:Courier New;font-size: 100%;">XOR</span> :<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;→ une <span style="font-family:Courier New;font-size: 100%;">clé</span> initiale est étendue, mais moins naïvement qu’en la répétant.<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;→ la <span style="font-family:Courier New;font-size: 100%;">clé</span> et le <span style="font-family:Courier New;font-size: 100%;">message</span> sont mélangés, de façon <strong>réversible</strong>.<br>
<br>
● Ces algorithmes, en plus d’être sûrs (c’est-à-dire  difficilement décryptables) sont particulièrement efficaces grâce à l’usage des opérations directement implémentées dans les <i>UAL</i> des processeurs et permettent de chiffrer des longs messages en temps réel.<br>
<br>
<span style="text-decoration: underline;font-style: italic;">Rappel de l'architecture Von Neumann:</span><br>
![alt text](mes_images/architecture.png)<br>


## <span style="text-decoration: underline;color:red;">III. Inconvénients du chiffrement symétrique :</span> ##
<br>
<br><span style="border: 2px solid;padding:6px;">La principale <strong>vulnérabilité</strong> des chiffrements <strong>symétriques</strong> provient des <strong>problèmes de sécurité</strong> lors de la <strong>transmission</strong> de la clé de chiffrement.</span><br>
<br><br>
● En <span style="font-weight: bold;font-style: italic;">1974</span>, <i>Ralph Merkle</i> imagine une solution appelée  "puzzles de <i>Merkle</i>"<br>


![alt text](mes_images/puzzle.jpg)<br>
● L'idée est de mettre d’accord sur une clé secrète,  <strong>de manière sécurisée</strong> lors d’un échange de message entre une personne $A$ et une personne $B$. <br>
&nbsp;<br>
<span style="text-decoration: underline;font-weight: bold;font-style: italic;">Etape 1 :</span><br>
<br>
● La personne $A$ génère un très grand nombre  de messages (par exemple$ 100 000$) de la forme :<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;<span style="font-family:Courier New;font-size: 100%;">identifiant : i,  clé : k</span> avec <span style="font-family:Courier New;font-size: 100%;">i</span> et <span style="font-family:Courier New;font-size: 100%;">k</span> générés <strong>aléatoirement</strong>.<br>
<br>
● Elle a donc généré un fichier texte de $100 000$ lignes comme celles-ci :<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;...<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;<span style="font-family:Courier New;font-size: 100%;">identifiant : 3456245, clé :  aezrfa!tazc</span><br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;<span style="font-family:Courier New;font-size: 100%;">identifiant : 5672212, clé : tluié^@(§32</span><br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;<span style="font-family:Courier New;font-size: 100%;">identifiant : 4256134, clé : sbfoiyug@%t</span><br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;...<br>
&nbsp;<br>
<span style="text-decoration: underline;font-weight: bold;font-style: italic;">Etape 2 :</span><br>
<br>
● La personne $A$ :<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;→ chiffre <strong>chaque ligne</strong> avec un algorithme de chiffrement symétrique (comme le <span style="font-family:Courier New;font-size: 100%;">XOR</span>) <br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;→ et une clé de <strong>faible longueur</strong> mais <strong>différente pour chaque ligne</strong>.<br>
<br>
&nbsp;&nbsp;L’objectif étant que <strong>chaque ligne</strong> puisse être décryptée avec une attaque par <strong>force brute</strong> mais <strong>pas l’ensemble des 100 000 lignes</strong>... <br>
&nbsp;&nbsp;La personne $A$ envoie l’ensemble des lignes chiffrées (cet envoi peut donc être intercepté)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;<br>
<span style="text-decoration: underline;font-weight: bold;font-style: italic;">Etape 3 :</span><br>
<br>
● La personne $B$ reçoit le fichier,  choisit une ligne,  et la <strong>décrypte par force brute</strong>. Il obtient donc un message du style :<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;<span style="font-family:Courier New;font-size: 100%;">identifiant : 5672212, clé : tluié^@(§32</span><br>
<br>
● Il renvoie à la personne $A$ l’identifiant <span style="font-family:Courier New;font-size: 100%;">5672212</span> (envoi qui peut à nouveau être intercepté).<br>
&nbsp;<br>
● La personne $A$ regarde dans son fichier la clé correspondante et  les deux personnes se sont ainsi mises d’accord de façon sécurisée sur la clé :<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;<span style="font-family:Courier New;font-size: 100%;">tluié^@(§32</span>.<br>
&nbsp;&nbsp;&nbsp;L’astuce réside ici sur le fait que décrypter <strong>une ligne est faisable</strong> pour la personne $B$,  mais qu’il n’est <strong>pas possible de décrypter l’ensemble</strong>. <br>
&nbsp;&nbsp;&nbsp;Même en interceptant l’identifiant choisi par la personne $B$,  il n'a pas accès à la clé associé sans décrypter tout le fichier.<br>
<br>
● Cette technique, efficace lorsqu’elle a été proposée, ne l’est plus de nos jours étant donnée la puissance de calcul disponible. <br>
&nbsp;&nbsp;&nbsp;Cependant elle a permis d’inspirer une autre méthode : <br>
&nbsp;&nbsp;&nbsp;le protocole d’échange de clés de <i>Diffie-Hellman</i>, basé sur un échange avec un chiffrement <strong>asymétrique</strong> que nous étudierons dans le notebook qui suit.<br>
&nbsp;&nbsp;&nbsp;&nbsp;<br>
