# Chiffrement par substitution

Le texte à chiffrer ou déchiffrer est de la même nature que pour le chiffre de César.

La clé est différente ; ce que l'on donne à la fonction est une permutation de l'alphabet utilisé.

L'alphabet est abcdefghijklmnopqrstuvwxyz. Une permutation est par exemple ABCKUDEFGHILJONMQPTSRZWXYV


Les 5 fonctions que l'on va utiliser dans ce carnet sont : 
+ chiffre() : chiffrer un message par le code de César
+ dechiffre() : déchiffrer un message par le code de César
+ generer_cle() : générer une clé de chiffrement (i.e. une permutation de l'alphabet)
+ demonstration() : chiffrer et déchiffre un message avec une clé
+ print() : afficher un contenu

In [None]:
import random

def generer_cle():
    """générer une clé"""
    chars ='abcdefghijklmnopqrstuvwxyz'
    alphabet_melange = sorted(chars.upper(), key=lambda k: random.random())
    #pour garder les espaces et les retours à la ligne dans le texte
    chars=chars+" \n"
    alphabet_melange.append(" ")
    alphabet_melange.append("\n")
    return dict(zip(chars, alphabet_melange))

def chiffre(cle, message_en_clair):
   """chiffre le message et retourne le message chiffrée"""
   return ''.join(cle[l] for l in message_en_clair)

def dechiffre(cle, message_chiffre):
   """dechiffre le message et retourne le message en clair"""
   flipped = {v: k for k, v in cle.items()}
   return ''.join(flipped[l] for l in message_chiffre)

def demonstration(texte):
    """démonstration d'un chiffrement par substitution"""
    ma_cle = generer_cle()
    message_01 = chiffre(ma_cle, texte)
    message_02 = dechiffre(ma_cle, message_01)
    print ('Cle: %s' % ma_cle)
    print('Texte en clair: %s' % texte)
    print ('Texte chiffré: %s' % message_01)
    print ('Texte déchiffré: %s' % message_02)

demonstration('ceci est un message')

## Exercice 1
Générer une clé et chiffrer le message suivant "dans un wagon bleu tout en mangeant cinq kiwis frais vous jouez du xylophone".
Afficher la clé utilisé pour chiffrer le message.

Entrer les commandes pour résoudre l'exercice dans la cellule ci-dessous.

## Exercice 2
Dans cet exercice, la clé est fourni dans la cellule ci-dessous. Il est possible de la modifier à la main. Il faut toutefois prendre garde à ce que pour chaque lettre minuscule corresponde une lettre majuscule. Tous les caractères doivent être représentés, sinon il y aura des erreurs.
Compléter message_en_clair avec une phrase, puis chiffrer et déchiffrer pour vérifier la clé.

In [None]:
cle_chiffrement= {'a': 'D', 'b': 'V', 'c': 'Y', 'd': 'P', 'e': 'C', 'f': 'B', 'g': 'N', 'h': 'R', 'i': 'L', 'j': 'J', 'k': 'X', 'l': 'K', 'm': 'F', 'n': 'H', 'o': 'M', 'p': 'U', 'q': 'Z', 'r': 'G', 's': 'S', 't': 'W', 'u': 'Q', 'v': 'O', 'w': 'E', 'x': 'I', 'y': 'A', 'z': 'T', ' ': ' ', '\n': '\n'}
message_en_clair=""


## Exercice 3 
Casser le chiffrement par subsitution du texte suivant à l'aide de l'analyse fréquentielle.

In [None]:
#importations des packages pour l'analyse fréquentiel
import pandas as pd
import numpy as np
import re
from collections import Counter
import matplotlib.pyplot as plt

text_file = open("page02_chiffree.txt")
file_content = text_file.read()
text_file.close()
#file_content="GOMMTLIL OC QIOEGCL MZ REISOTMTL NOT GHHG SZ HG HGBZ SO JHGQIC G QZHHZ SO LODZ ZL QZM SZOA HGBZM GKGCL ZLZ EZHTZZM RGE OC JTH BZLGHHTNOZ HG HGBZ SO LODZ SZYTCL HZ RIHZ RIMTLTJ ZL QZHHZ SO JHGQIC HZ RIHZ CZVGLTJ SZ H GRRGEZTH"

# convertir la chaine de caractère en liste avec chaque élément un caractère
lettres_liste = list(file_content)

# fréquence de chaque lettre
lettres_freq = Counter(lettres_liste)


# convertir lettres_freq dans un df pandas 
df = pd.DataFrame.from_dict(lettres_freq, orient='index').reset_index()
df = df.rename(columns={'index':'lettres', 0:'frequences'})

# garder les 26 lettres
df = df.loc[df['lettres'].isin(['A','B','C','D','E','F','G','H','I','J','K','L','M','N','O','P','Q','R','S','T','U','V','W','X','Y','Z'])]

df['frequences_relatives']=df['frequences']/df['frequences'].sum()
df = df.sort_values('frequences_relatives')

#fréquence des bigrammes
bigrammes_freq = Counter(map(''.join, zip(lettres_liste, lettres_liste[1:])))
# convertir lettres_freq dans un df pandas 
df2 = pd.DataFrame.from_dict(bigrammes_freq, orient='index').reset_index()
df2 = df2.rename(columns={'index':'bigrammes', 0:'frequences'})

# charger la fréquence des lettres dans une langue dans un csv
#fr_freq = pd.read_csv("frequences.csv")
#df = pd.merge(df,fr_freq, on="lettres")
# frequence attendue
#df['freq_attendue'] = np.round(df['frequences_relatives']*df['frequences'].sum(),0)

#figure de la fréquence des lettres du texte
df.plot(x="lettres", y="frequences_relatives",title="Fréquences relatives des lettres du texte chiffré", kind="barh", figsize=(12,8))

#df2.plot(x="bigrammes", y="frequences_relatives",title="Fréquences relatives des bigrammes du texte chiffré", kind="barh", figsize=(12,8))

print(file_content)


In [None]:
#première étape : générer une clé aléatoire 
#on veut partir de qqch, même si c'est mauvais
new_cle={'a': 'M', 'b': 'V', 'c': 'G', 'd': 'C', 'e': 'J', 'f': 'Q', 'g': 'I', 'h': 'P', 'i': 'A', 'j': 'S', 'k': 'H', 'l': 'B', 'm': 'O', 'n': 'Z', 'o': 'F', 'p': 'U', 'q': 'R', 'r': 'T', 's': 'W', 't': 'D', 'u': 'E', 'v': 'N', 'w': 'K', 'x': 'Y', 'y': 'X', 'z': 'L', ' ': ' ', '\n': '\n'}
print(new_cle)
#et charger le texte chiffré dans une variable:
text_file = open("page02_chiffree.txt")
texte_chiffre_subsitution = text_file.read()
text_file.close()
#texte_chiffre_subsitution="GOMMTLIL OC QIOEGCL MZ REISOTMTL NOT GHHG SZ HG HGBZ SO JHGQIC G QZHHZ SO LODZ ZL QZM SZOA HGBZM GKGCL ZLZ EZHTZZM RGE OC JTH BZLGHHTNOZ HG HGBZ SO LODZ SZYTCL HZ RIHZ RIMTLTJ ZL QZHHZ SO JHGQIC HZ RIHZ CZVGLTJ SZ H GRRGEZTH"
#fct pour avoir la key depuis la value
def get_key(val,mydict):
    for key, value in mydict.items():
         if val == value:
             return key
    return "key doesn't exist"
while True:
    minuscule = input("Donner l'élément de la clé en clair (minuscule),XXX pour quitter : ")
    if minuscule =="XXX":
        break
    majuscule = input("Donner l'élément de la clé chiffré (MAJUSCULE),XXX pour quitter : ")
    if majuscule=="XXX":
        break
    key =  get_key(majuscule,new_cle)
    new_cle[minuscule], new_cle[key] = new_cle[key], new_cle[minuscule]
    print("Voici la clé mise à jour : ")
    print(new_cle)
    texte_clair=dechiffre(new_cle, texte_chiffre_subsitution)
    print(texte_clair)
#maintenant on dechiffre le texte avec la clé
texte_clair=dechiffre(new_cle, texte_chiffre_subsitution)
print(texte_clair)
        