# Projet - Message cachés
Le but de ce projet est de transmettre un message chiffré et caché dans une image toute banale.

## Partie A : Cryptographie
Le message que nous allons tenter de dissimuler est le premier chapitre du livre *Les misérables* de Victor Hugo.

### Première étape :
Lire un fichier texte, supprimer tous les espaces, les sauts de ligne, les points, les virgules.<br />
Remplacer les majuscules par des minuscules.<br />
Remplacer tous les caractères accentuées par les caractères correspondant de l'alphabet.<br />
Par exemple les 'é', 'è' et 'ê' sont remplacés par un 'e'. Le 'ç' est remplacé par un 'c'.....

In [None]:
# pour lire en UTF8, n'est pas toujours nécessaire
import codecs

def pre_traitement(texte):
    # on charge le document texte
    fichier = codecs.open(texte, 'r', 'utf-8')
    # on lit le fichier
    lecture = fichier.read()
     # on ferme le fichier
    fichier.close()
    
    # tout en minuscule
    lecture = lecture.lower()
    
    # suppression des retour à la ligne
    lecture = lecture.replace('\r','')
    lecture = lecture.replace('\n','')
    
    #suppression des signes de ponctuation
    signes = [',','?',';','.',':','/','!','(',')', "'", ' ', '-', '_', '"', '«', '»', '%']
    for signe in signes :
        lecture = lecture.replace(signe,'')
    
    #modification des caractères accentués
    aaa = ['à', 'â', 'ä']
    for lettre in aaa :
        lecture = lecture.replace(lettre,'a')
    heu = ['é', 'è', 'ê', 'ë']
    for lettre in heu :
        lecture = lecture.replace(lettre,'e')
    iii = ['î','ï']
    for lettre in iii:
        lecture = lecture.replace(lettre,'i')
    hoo = ['ô','ö']
    for lettre in hoo:
        lecture = lecture.replace(lettre,'o')
    huu = ['û','ü', 'ù']
    for lettre in huu:
        lecture = lecture.replace(lettre,'u')
    lecture = lecture.replace('ç','c')
             
    return lecture

In [None]:
message = pre_traitement("les misérables chapitre 1.txt")

In [None]:
# pour voir le résultat
message

Il reste à vérifier que dans le fichier message il n'existe plus de caractères non désirés.

In [None]:
def verification(message):
    '''
    vérifie qu'il ne reste que les caractères de 'a' à 'z' et les chiffres de '0' à '9' dans le message.
    '''
    # on donne la listes de bons caractères
    bons_caracteres = 'abcdefghijklmnopqrstuvwxyz0123456789'
    
    # on démarre la vérification
    tout_va_bien = True
    i = 0
    while tout_va_bien and i<len(message):
        if not (message[i] in bons_caracteres) :
            tout_va_bien = False
        i = i + 1
    
    return tout_va_bien

In [None]:
verification(message)

### Deuxième étape :
Effectuer le chiffre de César <br />
https://fr.wikipedia.org/wiki/Chiffrement_par_d%C3%A9calage

In [None]:
def coder_cesar(chaine, clef):
    crypt = ''
    for car in chaine :
        if car not in '0123456789' :
            # car n'est donc un chiffre
            nouveau = ord(car)+clef
            # la lettre 'z' a pour code ASCII 122
            # pour gérer les dépassements, on décale de 26 autant que nécessaire
            while nouveau > 122 :
                nouveau = nouveau - 26
            crypt = crypt + chr(nouveau)
        else :
            # pas de modification
            crypt = crypt + car
    return crypt

In [None]:
message_code = coder_cesar(message,15)

In [None]:
# pour voir le résultat
message_code

In [None]:
def decoder_cesar(chaine, clef):
    '''
    c'est le même principe que pour coder
    mais on va dans l'autre sens, donc au lieu de rajouter on soustrait
    et donc on tourne dans l'autre sens
    '''
    clair = ''
    for car in chaine :
        if car not in '0123456789' :
            # car n'est donc un chiffre
            nouveau = ord(car)-clef
            # la lettre 'a' a pour code ASCII 97
            # pour gérer les dépassements, on décale de 26 autant que nécessaire
            while nouveau < 97 :
                nouveau = nouveau + 26
            clair = clair + chr(nouveau)
        else :
            # pas de modification
            clair = clair + car
    return clair

In [None]:
message_clair = decoder_cesar(message_code, 15)

In [None]:
# pour voir le résultat
message_clair

In [None]:
# pour vraiment être certain
message == message_clair

### Deuxième étape (bis):
Effectuer le chiffre de Vigenère <br />
https://fr.wikipedia.org/wiki/Chiffre_de_Vigen%C3%A8re

In [None]:
def coder_vigenere(chaine, clef):
    '''
    clef est une chaîne de caractères ne contenant pas d'espace, pas de majuscule et pas de caractère accentué
    '''
    crypt = ''
    # l'index sur la chaîne de caractères clef
    i = 0
    
    for car in chaine :
        if car not in '0123456789' :
            # ord donne le code ASCII et attention le 'a' a pour code 97
            decalage = ord(clef[i]) - 97
            # on passe au caractère suivant dans la clef
            i = i + 1
            # on évite de sortir de la chaîne de caractères clef
            if i == len(clef):
                i = 0
            
            # car n'est donc un chiffre
            nouveau = ord(car) + decalage
            # la lettre 'z' a pour code ASCII 122
            # pour gérer les dépassements, on décale de 26 autant que nécessaire
            while nouveau > 122 :
                nouveau = nouveau - 26
            crypt = crypt + chr(nouveau)
                   
        else :
            # pas de modification
            crypt = crypt + car
    return crypt

In [None]:
message_code = coder_vigenere(message,'informatique')

In [None]:
# pour voir le résultat
message_code

In [None]:
def decoder_vigenere(chaine, clef):
    '''
    clef est une chaîne de caractères ne contenant pas d'espace, pas de majuscule et pas de caractère accentué
    Pour décoder, il suffit de faire le décalage dans l'autre sens.
    '''
    crypt = ''
    # l'index sur la chaîne de caractères clef
    i = 0
    
    for car in chaine :
        if car not in '0123456789' :
            # ord donne le code ASCII et attention le 'a' a pour code 97
            decalage = ord(clef[i]) - 97
            # on passe au caractère suivant dans la clef
            i = i + 1
            # on évite de sortir de la chaîne de caractères clef
            if i == len(clef):
                i = 0
            
            # car n'est donc un chiffre
            nouveau = ord(car) - decalage
            # la lettre 'z' a pour code ASCII 122
            # pour gérer les dépassements, on décale de 26 autant que nécessaire
            while nouveau < 97 :
                nouveau = nouveau + 26
            crypt = crypt + chr(nouveau)
                   
        else :
            # pas de modification
            crypt = crypt + car
    return crypt

In [None]:
message_clair = decoder_vigenere(message_code,'informatique')

In [None]:
# pour voir le résultat
message_clair

In [None]:
# pour vraiment être certain
message == message_clair

### Troisième étape :
Convertir chaque caractère en un nombre binaire.

Cette partie semble assez simple :
* on prend chaque caractère l'un après l'autre;
* on les convertit en binaire;
* on concatène les codes binaires de chaque caractère dans une variable de type string. <br />

***Première proposition de conversion en binaire*** <br />
On *pourrait* simplement utiliser la fonction `ord()` qui associe à chaque caractère son code ASCII étendue, un nombre entre 0 et 255. On utilise ensuite la fonction `bin()` qui convertit en binaire. <br />
Effectuons quelques essais pour comprendre le problème.

In [None]:
bin(ord('5'))

In [None]:
bin(ord('z'))

On constate que l'affichage commence par un `'0b'` qu'il faudrait supprimer à chaque conversion. <br />
Autre souci, la taille n'est pas la même. Pour le `'5'`, 110101 contient 6 bits et pour le `'z'`, 1111010 en contient 7. <br />
Cela pose un réel souci car pour réécrire le texte avec des carcatères, on doit savoir ou couper dans la série de 0 et de 1. Donc l'idéal serait que chaque caractère soit convertit en un même nombre de bits. On doit alors rajouter un certain nombre de bits nul à gauche.

***Deuxième proposition de conversion en binaire*** <br />
On constate aussi que finalement, nous n'avons que 26 caractères de `'a'` à `'z'` puis 10 chiffres de `'0'` à `'9'`. Soit un total de 36 symboles à utiliser. <br />
C'est bien dommage d'utiliser un octect complet (256 possibilitès). On pourrait économiser de la place dans notre image en utilisant moins de 8 bits par symbole. <br />
Après reflexion, nous n'avons besoin seulement que de 6 bits. <br />
En effet avec 5 bits, on a $2^5 = 32$ possibilités. Ce n'est pas suffisant. <br />
Avec 6 bits, on a $2^6 = 64$ possibilités. C'est très largement suffisant.

Pour effectuer cette conversion, nous pouvons par exemple, et assez simplement utiliser un dictionnaire qui nous permettra d'associer à chacun des 36 symboles un codage binaire unique.

In [None]:
code_dico = {
    'a':'000000', 
    'b':'000001',
    'c':'000010',
    'd':'000011',
    'e':'000100',
    'f':'000101',
    'g':'000110',
    'h':'000111',
    'i':'001000',
    'j':'001001',
    'k':'001010',
    'l':'001011',
    'm':'001100',
    'n':'001101',
    'o':'001110',
    'p':'001111',
    'q':'010000',
    'r':'010001',
    's':'010010',
    't':'010011',
    'u':'010100',
    'v':'010101',
    'w':'010110',
    'x':'010111',
    'y':'011000',
    'z':'011001',
    '0':'011010',
    '1':'011011',
    '2':'011100',
    '3':'011101',
    '4':'011110',
    '5':'011111',
    '6':'100000',
    '7':'100001',
    '8':'100010',
    '9':'100011'
}

Nous pouvons maintenant effectuer notre conversion du texte en binaire.

In [None]:
def conversion_binaire(texte, code_dico):
    message = ''
    for caractere in texte :
        message = message + code_dico[caractere]
    return message

Nous pouvons tester le resultat.

In [None]:
message_binaire = conversion_binaire('bonjour', code_dico)

In [None]:
# pour voir le résultat
message_binaire

Pour convertir le message binaire en caractères, il *suffit* de lire les 0 et les 1 et de les ranger par paquets de 6. Ensuite pour chaque paquet de 6, c'est une valeur du dictionnaire `code_dico`. Il suffit alors de retrouver sa clef.

In [None]:
def conversion_chaine(texte_binaire, code_dico):
    message =''
    paquet ='' 
    for bit in texte_binaire :
        # faire un paquet de 6
        paquet = paquet + bit
        if len(paquet) == 6:
            # si c'est un paquet de 6 retrouver la clef dans le dictionnaire code_dico
            for clef, valeur in code_dico.items():
                if valeur == paquet:
                    message = message + clef
            paquet=''
    return message

In [None]:
message_chaine = conversion_chaine(message_binaire, code_dico)

In [None]:
# pour voir le résultat
message_chaine

yupi !!!!