<img src="Images/Logo.png" alt="Logo NSI" style="float:right">

<h1 style="text-align:center">TP : Chiffrement</h1>

Le **chiffrement** est une opération qui consiste à transformer un message à transmettre, dit *message clair*, en un autre message, inintelligible pour un tiers, dit *message chiffré*, en vue d'assurer le secret de sa transmission.

Pendant des siècles, différentes techniques ont été mises au point pour chiffrer des messages. L'avénement de l'ordinateur et d'internet ont révolutionné cette discipline. De nos jours, le chiffrement est omni-présent : achat en ligne, connexion à un site, à un ordinateur partagé,...  
Le chiffrement vous permet de partager des informations avec d'autres personnes, sans craindre que cette information soit intercepté.

Il existe donc des algorithmes qui permettent le chiffrement (et le déchiffrement. Le message origina est appelé *message clair*. Après chiffrement, il devient *message chiffré*.  
Le *message chiffré* contient contient les mêmes informatons que le *message clair*, mais il est dans un format qui n'est pas compréhensible pour un humain (ou un ordinateur) si celui-ci ne connaît pas le mécanisme pour le déchiffrer.

Un algorithme de chiffrement (que nous désignerons par **chiffre**) dépend généralement d'une information supplémentaire appelé la **clé**. La *clé* fait partie du procédé de chiffrement. Le même *message clair* transformé avec deux clé différentes conduit à deux *messages chiffrés* différents. Sans la clé, il est difficie de déchiffrer le *message chiffré* pour le rendre compréhensible.

Ce projet va traiter d'une méthode de chiffrement connue appelé **chiffre de César**.

## Notes
Le projet se limitera à des mots en **anglais**, en minuscule.  
Cela permet d'éviter les problèmes d'accents.

## Chiffre de César
L'idée du chiffre est de choisir un entier et décaler chaque lettre du message par cet entier.  
En d'autres mots, supposons que le décalage soit $k$. Alors, toutes les occurrences de la $i-ème$ lettre de l'alphabet qui apparaît dans le message clair sera remplacé par la $(i+k)-ème$ lettre de l'alphabet dans le message chiffré.  
Il faut être attentif aux cas ou $i+k>26$ (l'alphabet contient 26 lettres).

Voici un exemple de décalage de lettre pour $k=3$.

| lettre originale | a | b | c | d | e | f | g | h | i | j | k | l | m | n | o | p | q | r | s | t | u | v | w | x | y | z |
|------------------|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| lettre décaléet  | d | e | f | g | h | i | j | k | l | m | n | o | p | q | r | s | t | u | v | w | x | y | z | a | b | c | 

En utilisant la clé, nous pouvons rapidement transformé le message `'happy'` en `'kdssb'`.

Nous utilisons les lettre de l'alphabet français pour ce projet, les lettres sont dans cet ordre :

In [None]:
import string
print(string.ascii_lowercase)

Nous traiterons les lettres en majuscules et minuscules indépendamment : les lettres en majuscule seront toujours associées à des lettres en majuscules et les lettres en minuscules associées à des minuscules.  
Les ponctuations et les espaces ne seront pas transformés. Par exemple, si un message clair possède une virgule, le message chiffré correspondant aura une virgule à la même position

| message clair     | décalage                | message chiffré   |
|-------------------|-------------------------|-------------------|
| `'abcdef'`        | 2                       | `'cdefgh'`        |
| `'Hello, World!'` | 5                       | `'Mjqqt, Btwqi!'` |
| `''`              | n'importe quelle valeur | `''`              |

## Récupérer les mots valides
Pour commencer, voici donc un script qui nous permet de récupérer une liste de mots depuis le fichier [`words.txt`](Fichiers/words.txt).

Ce fichier contient une liste de mots anglais, en minuscules.

In [None]:
def charge_mots(nom_fichier):
    """
    Renvoie une liste de mots valides. 
    Les mots sont des chaînes de caractères en minuscules.
    """
    with open(nom_fichier, 'r') as fichier:
        mots = fichier.read().splitlines()
    print("Il y a", len(mots), "mots disponibles.")
    return mots

Et voici une fonction qui détermine si une chaîne de caractère est un mot valide (qui fait partie de la liste de mots)

In [None]:
def est_mot(liste_mots, mot):
    """
    Détermine si un mot est valide,
     on ignore la casse est la ponctuation

    liste_mots (list): liste des mots dans le dictionnaire.
    mot (string): un mot possible.
    
    Returns: True si le mot est dans liste_mots, False sinon
    """
    mot = mot.lower()
    mot = mot.strip(" !@#$%^&*()-_+={}[]|\:;'<>?,./\"")
    return mot in liste_mots

liste = charge_mots("Fichiers/words.txt")
assert est_mot(liste, 'bat') == True
assert est_mot(liste, 'asdf') == False

## Construire le dictionnaire de décalage et appliquer le décalage
La classe `Message` contient des méthodes qui peuvent être utiliser pour chiffrer (ou déchiffrer) une chaîne de caractères.

Vous devez donc implémenter les méthodes de `Message` en accord avec les spécifications des docstrings.

Les méthodes déjà implémenter sont :
* `__init__(self, texte)`
* La methode `get_message_texte(self)`
* La méthode `get_mot_valide(self)`. Cette méthode renvoie une copie de `self.mots_valides` pour éviter que la liste originale soit modifiée.

Vous devez implémenter les deux méthodes :
* La méthode `construit_dico_decalage(self, decalage)` Assurer vous que le dictionnaire contienne les lettres en minuscule et en majuscule et que le caractère décalé conserve la casse du caractère original. Si la lettre originale est `a` et la valeur décalée est `c`, la lettre `A` sera décalée en la lettre `C`.  
On rappelle que les caractères de ponctuation, les espaces (`' '`) et les caractères numériques ne seront pas chiffrés.

In [None]:
import string
print(string.punctuation)
print(string.digits)

* La méthode `applique_decalage(self, decalage)`

In [None]:
FICHIER_SOURCE = "Fichiers/words.txt" # Le fichier words.txt est dans le dossier Fichiers

class Message(object):
    ### NE PAS MODIFIER CETTE METHODE ###
    def __init__(self, texte):
        """
        Créé un objet Message
                
        texte (string): le texte du message

        un objet Message possède deux attributs:
            self.message_texte (string, défini par l'argument texte)
            self.mots_valides (list, défini grâce à la fonction charge_mots)
        """
        self.message_texte = texte
        self.mots_valides = charge_mots(FICHIER_SOURCE)

    ### NE PAS MODIFIER CETTE METHODE ###
    def get_message_texte(self):
        """
        Utilisé pour accéder à self.message_texte en dehors de la classe
        
        Returns: self.message_texte
        """
        return self.message_texte

    ### DO NOT MODIFY THIS METHOD ###
    def get_mot_valide(self):
        """
        Utilisé pour accéder à une copie de self.mots_valides en dehors de la classe
        
        Returns: une COPIE de self.mots_valides
        """
        return self.mots_valides[:]
        
    def construit_dico_decalage(self, decalage):
        """
        Créé un dictionnaire qui peut être utilisé pour chiffré une lettre.
        Ce dictionnaire associe à chaque lettre en minuscule et en majuscule,
         un caractère décalé en fonction de l'argument decalage.
        Le dictionnaire doit avoir 52 clés pour toutes les caractères concernés
         (les lettres de l'alphabet et majuscule et en minuscule) 
        
        decalage (integer): la quantité définissant le décalage de chaque lettre
         de l'alphabet. 0 <=decalage <= 26

        Returns: un dictionnaire associant une lettre (string) à 
            une autre lettre (string). 
        """
        pass # efface cette ligne et remplace là par ton code

    def applique_decalage(self, decalage):
        """
        Applique le chiffre de César à self.message_texte avec le décalage en entrée.
        Créé une nouvelle chaîne de caractères correspondant à self.message_texte
         décalé en fonction du paramètre decalage       
        
        decalage (integer): le décalage qui permet le chiffrement du message.
         0 <=decalage <= 26

        Returns: le message (string) dans lequel chaque caractère est décalé 
            en fonction de decalage
        """
        pass # efface cette ligne et remplace là par ton code


## MessageEnClair
Nous allons utiliser l'implémentation de la classe `Message`.

`MessageEnClair` est une sous-classe de `Message` et possède des méthodes pour chiffrer une chaîne de caractères en utilisant une valeur de décalage.  
La classe va toujours créer une version chiffrée du message et possède des méthodes pour changer le chiffrement.

Vous devez implémenter les méthodes :
* `__init__(self, texte, decalage)` : utiliser le constructeur de la classe parent pour avoir un code plus concis.
* La méthode `get_decalage(self)`
* La méthode `get_chiffrement_dico(self)` : doit renvoyer une **copie** de `self.chiffrement_dico` pour éviter que le dictionnaire original soit modifier.
* La méthode `get_message_texte_chiffre(self)`.
* La méthode `change_decalage(self, decalage)`.

In [None]:
class MessageEnClair(Message):
    def __init__(self, texte, decalage):
        """
        Créé un objet MessageEnClair        
        
        texte (string): Le texte du message
        decalage (integer): le décalage associé au message

        Un objet MessageEnClair hérite de la classe Message et possède cinq attributs:
            self.message_texte (string, défini par l'argument texte)
            self.mots_valides (list, défini grâce à la fonction charge_mots)
            self.decalage (integer, défini par l'argument decalage)
            self.chiffrement_dico (dictionary, construit à partir de decalage)
            self.message_texte_chiffre (string, construit à partir de decalage)

        Conseil: essayer d'utiliser la classe parent pour éviter 
         de répéter du code
        """
        pass # efface cette ligne et remplace là par ton code

    def get_decalage(self):
        """
        Utilisé pour accéder à self.decalage en dehors de la classe
        
        Returns: self.decalage
        """
        pass # efface cette ligne et remplace là par ton code

    def get_chiffrement_dico(self):
        """
        Utilisé pour accéder à une copie de self.chiffrement_dico en dehors de la classe
        
        Returns: une COPIE de self.chiffrement_dico
        """
        pass # efface cette ligne et remplace là par ton code

    def get_message_texte_chiffre(self):
        """
        Utilisé pour accéder à self.get_message_texte_chiffre en dehors de la classe
        
        Returns: self.message_texte_chiffre
        """
        pass # efface cette ligne et remplace là par ton code

    def change_decalage(self, decalage):
        """
        Mofifie l'attribut self.decalage de MessageEnClair et mise à jour
         des autres attributs défini par le décalage (ie. self.chiffrement_dico et 
        message_texte_chiffre).
        
        decalage (integer): le nouveau decalage qui doit être associé au message.
        0 <= decalage < 26

        Returns: None
        """
        pass # efface cette ligne et remplace là par ton code

    
assert MessageEnClair('hello', 2).get_message_texte_chiffre() == 'jgnnp'

## MessageChiffre
A partir d'un message chiffré, si vous connaissez le décalage utilisé pour encoder le message, le déchiffrement est trivial.  
Si `message` est le message chiffré, et `d` est le décalage utilisé pour chiffrer le message, alors `applique_decalage(self, 26 - d)` renvoie le message original en clair.

Le problème, évidemment, se pose si vous ne connaissez pas le décalage. Mais cette méthode de chiffrement ne possède que 26 valeurs possibles.

L'idée sera donc d'écrire un programme qui teste chacun des décalages possibles et qui contiendra le plus de mots valides en anglais pour pouvoir déchiffrer un message chiffrée.  
Nous arriverons à déterminer si le décalage testé est le bon si la plupart des mots obtenus après décalage sont valides.

Vous devez donc implémenter les méthodes de la classe `MessageChiffre` en accord avec les spécifications des docstrings.

Les méthodes à implémenter sont :
* `__init__(self, texte)` : utiliser le constructeur de la classe parent pour obtenir un code plus concis.
* `dechiffre_message(self)` : vous pouvez profiter de la fonction `est_mot(liste_mots, mot)` et la méthode `split()`. On rappelle que `est_mot` ignore la ponctuation et les autres caractères spéciaux pour tester si un mot est valide

In [None]:
 class MessageChiffre(Message):
    def __init__(self, texte):
        """
        Créé un objet MessageChiffre
                
        texte (string): le texte du message

        un objet MessageChiffre possède deux attributs:
            self.message_texte (string, défini par l'argument texte)
            self.mots_valides (list, défini grâce à la fonction charge_mots)
        """
        pass #delete this line and replace with your code here

    def dechiffre_message(self):
        """
        Déchiffre self.message_texte en tentant toutes les possibilités 
         pour le décalage et trouve le meilleur. 
        Le meilleur décalage est le décalage qui permet d'obtenir le 
         maximum de mots valides quand on utilise applique_decalage(decalage)
         sur le texte chiffré.
        Si d est le décalage utilisé pour chiffrer le message, alors 
         le meilleur décalage attendu est 26 - d.

        Note: si plusieurs décalages sont également efficaces 
         vous pouvez choisir de renvoyer n'importe quel décalage 
         (et le message déchiffré correspondant)

        Returns: un tuple contenant le meilleur décalage utilisé pour déchiffrer le message 
         et le texte message déchiffré à partir du décalage
        """
        pass
    
assert MessageChiffre('jgnnq').dechiffre_message() == (24, 'hello')

## Dechiffrer un texte
Nous allons maintenant pouvoir utiliser notre programme pour déchiffrer le fichier [speech.txt](Fichiers/speech.txt).

Voici une fonction qui renvoie le contenu du fichier [speech.txt](Fichiers/speech.txt) comme une chaîne de caractère.

In [None]:
def get_story_string():
    """
    Returns: un texte chiffré.
    """
    with open("Fichiers/speech.txt", "r") as f:
        story = str(f.read())
    return story

histoire_chiffree = get_story_string()
print(histoire_chiffree)

Vous devez donc créer un objet `MessageChiffre` à partir de l'histoire à déchiffrer, puis utiliser la méthode `dechiffre_message` pour renvoyer la valeur du décalage ainsi que la chaîne de caractère représentant l'histoire en clair.

In [None]:
def dechiffre_texte():
    pass