# Serious cryptography/cryptohraphie theorie et pratique , implémentation complète

cette implémentation a pour but de m'entrainer et réviser la cryptographie en implémentant en suivant les guidelines de "serious cryptography a practical guide to encryption".

## $1$ Petite introduction cryptographique

Le but principal de la cryptographie est de permettre à deux interlocuteurs que l'on nommera Alice et Bob de communiquer au travers d'un _canal mal sécurisé_ de manière secrète.L'idée est que si une troisièmme entité oscar peut intercepter le signal ou la communication à travers le canal non sécurisé il ne puisse pas lire le méssage.On veut ici garentir 3 choses:

+ <span style="color: red;"> **_Confidentialité_** </span>  : On veut garentir que si oscar s'empare de la   transmission il ne puisse pas le déchiffrer , on veut par la garentir la confidentialité du méssage.

+ <span style="color: red;"> **_Authenticité_** </span> : on veut garentir l'identité de la personne qui envoie le message et être bien sur qu'il s'agisse là d'alice et non d'oscar.

+ <span style="color: red;"> **_Intégrité_** </span>  : c'est à dire garentir Que le message n'a pas été modifié et qu'il arrive chez bob exactement comme Alice a souhaité qu'il arrive (ici le message fait reference au chiffré qui transite par le canal)

## $1.1$ Cryptosysthèmes

Un cryptosysthème est un quintuplet ( $P$ , $C$ , $K$ , $E$ , $D$ ) où :
+ $P$ est un ensemble **_fini_** de blocs de **textes clairs** possibles
+ $C$ est un ensemble _fini_ de textes chiffrés possible 
+ $K$ est l'ensemble de clés possible 
+ Pour tout k ∈ $K$ il existe une **_une règle de chiffremment_** correspondante e<sub>k</sub> ∈ $E$ et une **_regle de déchiffrement_** d<sub>k</sub> ∈ $D$ telles que e<sub>k</sub> : $P$ ⟶ $C$ et d<sub>k</sub> : $C$ ⟶ $P$   avec  d<sub>k</sub>(e<sub>k</sub>)(x)=x .

On s'accorde sur l'idée que Alice et Bob se sont mis d'accord par canal sécurisé pour partager la clé.

![codes en bloc ](codeenbloc.png)


On remarque plusieurs choses :
+ Le chiffrement se fait sous forme de blocs clairs/chiffrés
+ la fonction de chiffrement doit être injective sinon il est impossible de déchiffrer
+ si les $P$ (les clais) = $C$ (chiffrés) alors le cryptosystème n'est qu'une permutation de ces ensembles

## $1.1.1$ cryptosystèmes anciens


### $1.1.1.1$ Cryptosystème de par décalage

#### Chiffrement

Le principe du cryptosysthème de césar est assez simple on définis un dictionnaire contenant par exemple toutes les lettres de l'alphabet en minuscule et en majuscule , on associe chaque caractère à un numéro , ce dictionnaire contient 55 caractères :

In [92]:
alphabet = {
    1: 'a', 2: 'b', 3: 'c', 4: 'd', 5: 'e', 6: 'f', 7: 'g', 8: 'h', 9: 'i',
    10: 'j', 11: 'k', 12: 'l', 13: 'm', 14: 'n', 15: 'o', 16: 'p', 17: 'q',
    18: 'r', 19: 's', 20: 't', 21: 'u', 22: 'v', 23: 'w', 24: 'x', 25: 'y',
    26: 'z', 27: ',', 28: ' ', 29: '.',
    30: 'A', 31: 'B', 32: 'C', 33: 'D', 34: 'E', 35: 'F', 36: 'G', 37: 'H',
    38: 'I', 39: 'J', 40: 'K', 41: 'L', 42: 'M', 43: 'N', 44: 'O', 45: 'P',
    46: 'Q', 47: 'R', 48: 'S', 49: 'T', 50: 'U', 51: 'V', 52: 'W', 53: 'X',
    54: 'Y', 55: 'Z'
}


In [101]:
def transformationalphabet (chaine): ##L'idée de cette fonction est d'extraire le numéro de chaque élement de la chaine de caractère 
    tab=[] #on initialise le tableau résultat
    for char in chaine: #on parcours la chaine de caractère
        if char in alphabet.values(): #on vérifie le présence de chaque élément de la chaine de caractère dans l'alphabet
            for (num,lettre) in alphabet.items(): #on parcours les couples clé/valeur du dictionnaire
                if (char==lettre):#on verifier les corespondances caractère lettre et on rajoute le numéro au tableau
                    tab.append(num)
    return tab



In [259]:
testcesar=transformationalphabet('je taime tellement je narrive pas a me passer de toi mon amour')
testcesar

[10,
 5,
 28,
 20,
 1,
 9,
 13,
 5,
 28,
 20,
 5,
 12,
 12,
 5,
 13,
 5,
 14,
 20,
 28,
 10,
 5,
 28,
 14,
 1,
 18,
 18,
 9,
 22,
 5,
 28,
 16,
 1,
 19,
 28,
 1,
 28,
 13,
 5,
 28,
 16,
 1,
 19,
 19,
 5,
 18,
 28,
 4,
 5,
 28,
 20,
 15,
 9,
 28,
 13,
 15,
 14,
 28,
 1,
 13,
 15,
 21,
 18]

In [268]:
def cesar1(tab,n,alph): ##tab est la chaine de numéros ,n est le décalage , alph est l'alphabet #décalage
    res=[]
    k=len(alph)#on calcule la taille de l'alphabet
    for i in range(len(tab)):#on parcours la chaine de caractère
        res.append((tab[i]+n)%k) #on calcule lopération modulaire du chiffrement 
    return res#on retourne un tableau de numero chiffré
        



In [283]:
testcesar1=cesar1(testcesar,48,alphabet)
testcesar1

[3,
 53,
 21,
 13,
 49,
 2,
 6,
 53,
 21,
 13,
 53,
 5,
 5,
 53,
 6,
 53,
 7,
 13,
 21,
 3,
 53,
 21,
 7,
 49,
 11,
 11,
 2,
 15,
 53,
 21,
 9,
 49,
 12,
 21,
 49,
 21,
 6,
 53,
 21,
 9,
 49,
 12,
 12,
 53,
 11,
 21,
 52,
 53,
 21,
 13,
 8,
 2,
 21,
 6,
 8,
 7,
 21,
 49,
 6,
 8,
 14,
 11]

In [290]:
def cesar2(tab,alph):#nos parametres sont le tableau de nombres chiffrés par décalage , l'alphabet#passer des numéros aux chaines de caracteres
    res=[]
    for char in tab:#on carcours les éléments du tablea
        if char in alph.keys():#si l'élément est dans l'alphabet 
            for (num,lettre) in alph.items():##on recherche le couple numéro lettre
                if (char==num):
                    res.append(lettre)#on rajoute la lèttre au résultat
    return res
            

In [296]:
testcesar2=cesar2(testcesar1,alphabet)
testcesar2

['c',
 'X',
 'u',
 'm',
 'T',
 'b',
 'f',
 'X',
 'u',
 'm',
 'X',
 'e',
 'e',
 'X',
 'f',
 'X',
 'g',
 'm',
 'u',
 'c',
 'X',
 'u',
 'g',
 'T',
 'k',
 'k',
 'b',
 'o',
 'X',
 'u',
 'i',
 'T',
 'l',
 'u',
 'T',
 'u',
 'f',
 'X',
 'u',
 'i',
 'T',
 'l',
 'l',
 'X',
 'k',
 'u',
 'W',
 'X',
 'u',
 'm',
 'h',
 'b',
 'u',
 'f',
 'h',
 'g',
 'u',
 'T',
 'f',
 'h',
 'n',
 'k']

In [301]:
def cesar3(chaine,alph,n):#Le chiffrement unifié
    res=transformationalphabet(chaine)
    res=cesar1(res,n,alph)
    res=cesar2(res,alph)
    return res
    

In [305]:
cesar3('je taime',alphabet,48)

['c', 'X', 'u', 'm', 'T', 'b', 'f', 'X']

### Déchiffrement :

On supposera ici que Alice et Bob connaissent au préalable le décalage c'est la clé secrète ici

In [308]:
def dechcés(tab,alphabet,n):#Déchiffrement unifié
    res=[]#resultat
    k=len(alphabet)
    tab1=transformationalphabet(tab)#transformation en chiffre
    print(tab1)
    tab1=cesar1(tab1,-n,alphabet)#inversion de l'addition modulaire
    print(tab1)
    tab1=cesar2(tab1,alphabet)#inversion en lettre
    return tab1

        

In [310]:
dechcés(testcesar2,alphabet,48)

[3, 53, 21, 13, 49, 2, 6, 53, 21, 13, 53, 5, 5, 53, 6, 53, 7, 13, 21, 3, 53, 21, 7, 49, 11, 11, 2, 15, 53, 21, 9, 49, 12, 21, 49, 21, 6, 53, 21, 9, 49, 12, 12, 53, 11, 21, 52, 53, 21, 13, 8, 2, 21, 6, 8, 7, 21, 49, 6, 8, 14, 11]
[10, 5, 28, 20, 1, 9, 13, 5, 28, 20, 5, 12, 12, 5, 13, 5, 14, 20, 28, 10, 5, 28, 14, 1, 18, 18, 9, 22, 5, 28, 16, 1, 19, 28, 1, 28, 13, 5, 28, 16, 1, 19, 19, 5, 18, 28, 4, 5, 28, 20, 15, 9, 28, 13, 15, 14, 28, 1, 13, 15, 21, 18]


['j',
 'e',
 ' ',
 't',
 'a',
 'i',
 'm',
 'e',
 ' ',
 't',
 'e',
 'l',
 'l',
 'e',
 'm',
 'e',
 'n',
 't',
 ' ',
 'j',
 'e',
 ' ',
 'n',
 'a',
 'r',
 'r',
 'i',
 'v',
 'e',
 ' ',
 'p',
 'a',
 's',
 ' ',
 'a',
 ' ',
 'm',
 'e',
 ' ',
 'p',
 'a',
 's',
 's',
 'e',
 'r',
 ' ',
 'd',
 'e',
 ' ',
 't',
 'o',
 'i',
 ' ',
 'm',
 'o',
 'n',
 ' ',
 'a',
 'm',
 'o',
 'u',
 'r']

### Cryptanalyse du chiffrement de césar/par décalage/vigenère

Le chiffrement de César est l'un des plus anciens et des plus simples systèmes de chiffrement par substitution. Il consiste à décaler chaque lettre d'un certain nombre de positions dans l'alphabet. Par exemple, avec un décalage de 3, 'A' serait remplacé par 'D', 'B' par 'E', et ainsi de suite. Voici quelques techniques de cryptanalyse souvent utilisées pour attaquer le chiffrement de César :

1. Analyse de la fréquence des lettres :
L'analyse de la fréquence des lettres dans le texte chiffré peut être efficace, surtout si le message chiffré est assez long. Dans de nombreuses langues, certaines lettres sont plus fréquentes que d'autres (par exemple, 'e' en anglais). En comptant les occurrences de chaque lettre dans le texte chiffré, on peut estimer le décalage utilisé. Par exemple, si 'x' est la lettre la plus fréquente dans le texte chiffré, il pourrait correspondre à 'e' décalé de 3 positions ('x' - 3 = 'e' dans l'alphabet).

2. Essai des décalages possibles :
Étant donné que le chiffrement de César utilise un décalage fixe, il est possible d'essayer chaque décalage possible (généralement 26 décalages, car il y a 26 lettres dans l'alphabet) pour décoder le message. Cela peut être fait manuellement ou automatiquement à l'aide d'un script. En testant chaque décalage et en examinant le résultat, il devient évident quand le message déchiffré est lisible.

3. Analyse de la fréquence des paires de lettres :
En plus de l'analyse de la fréquence des lettres individuelles, l'analyse des fréquences des paires de lettres peut également être utile. Par exemple, en anglais, certaines paires de lettres comme 'th', 'he', 'in', etc., sont très courantes. En analysant les paires de lettres dans le texte chiffré, il est possible de deviner le décalage utilisé.

4. Utilisation de l'indice de coïncidence :
L'indice de coïncidence est une mesure statistique qui peut indiquer à quel point un texte est proche de la distribution attendue des fréquences de lettres dans une langue donnée. En comparant l'indice de coïncidence du texte chiffré avec celui d'une langue connue (comme l'anglais pour un message en anglais), il est possible de deviner le décalage ou de confirmer une hypothèse sur le décalage utilisé.

5. Attaques par force brute et par dictionnaire :
Enfin, des méthodes plus brutes comme l'attaque par force brute (tester tous les décalages possibles) ou par dictionnaire (tester tous les mots connus dans une langue donnée pour voir s'ils déchiffrent correctement le texte) peuvent également être utilisées, en particulier si le décalage est inconnu.

Limitations :
Le chiffrement de César est vulnérable aux attaques par force brute et par analyse fréquentielle car il est basé sur un décalage fixe et ne change pas la structure des mots.
Le chiffrement de César est facilement cassé si le texte chiffré est suffisamment long pour permettre une analyse statistique significative des fréquences.
En résumé, bien que le chiffrement de César soit simple et intuitif, il est également facile à casser avec des techniques relativement simples si les conditions sont favorables (comme un texte chiffré suffisamment long et une langue connue pour l'analyse).

### $1.1.1.2$ Outils
A ce stade nous allons introduire certains outils comme le dictionnaire ASCII et la capacité à nous servir de grand textes en français pour dégéger une distribution de probabilité basique sur la langue française :


In [1]:

ascii_dict = {}

# Remplissage du dictionnaire avec les caractères ASCII et leurs indices
for i in range(128):  # Il y a 128 caractères ASCII (0 à 127)
    ascii_dict[chr(i)] = i

# Affichage du dictionnaire
print(ascii_dict)


{'\x00': 0, '\x01': 1, '\x02': 2, '\x03': 3, '\x04': 4, '\x05': 5, '\x06': 6, '\x07': 7, '\x08': 8, '\t': 9, '\n': 10, '\x0b': 11, '\x0c': 12, '\r': 13, '\x0e': 14, '\x0f': 15, '\x10': 16, '\x11': 17, '\x12': 18, '\x13': 19, '\x14': 20, '\x15': 21, '\x16': 22, '\x17': 23, '\x18': 24, '\x19': 25, '\x1a': 26, '\x1b': 27, '\x1c': 28, '\x1d': 29, '\x1e': 30, '\x1f': 31, ' ': 32, '!': 33, '"': 34, '#': 35, '$': 36, '%': 37, '&': 38, "'": 39, '(': 40, ')': 41, '*': 42, '+': 43, ',': 44, '-': 45, '.': 46, '/': 47, '0': 48, '1': 49, '2': 50, '3': 51, '4': 52, '5': 53, '6': 54, '7': 55, '8': 56, '9': 57, ':': 58, ';': 59, '<': 60, '=': 61, '>': 62, '?': 63, '@': 64, 'A': 65, 'B': 66, 'C': 67, 'D': 68, 'E': 69, 'F': 70, 'G': 71, 'H': 72, 'I': 73, 'J': 74, 'K': 75, 'L': 76, 'M': 77, 'N': 78, 'O': 79, 'P': 80, 'Q': 81, 'R': 82, 'S': 83, 'T': 84, 'U': 85, 'V': 86, 'W': 87, 'X': 88, 'Y': 89, 'Z': 90, '[': 91, '\\': 92, ']': 93, '^': 94, '_': 95, '`': 96, 'a': 97, 'b': 98, 'c': 99, 'd': 100, 'e': 101

In [7]:
pip install tabulate

Note: you may need to restart the kernel to use updated packages.


In [14]:
from collections import Counter
from tabulate import tabulate
import unicodedata

def create_ascii_dict():
    ascii_dict = {}
    for i in range(128):
        ascii_dict[chr(i)] = i
    return ascii_dict

def strip_accents(text):
    return ''.join(c for c in unicodedata.normalize('NFD', text) if unicodedata.category(c) != 'Mn')

def distribution_probabilite_ascii(texte, ascii_dict):
    # Calcul des fréquences de chaque caractère
    frequence_caracteres = Counter(texte)
    
    # Nombre total de caractères dans le texte
    total_caracteres = sum(frequence_caracteres.values())
    
    # Création de la distribution de probabilité
    distribution_probabilite = {}
    for caractere in ascii_dict.keys():
        if caractere in frequence_caracteres:
            probabilite = frequence_caracteres[caractere] / total_caracteres
            distribution_probabilite[caractere] = probabilite
        else:
            distribution_probabilite[caractere] = 0.0
    
    return distribution_probabilite

# Création du dictionnaire ASCII
ascii_dict = create_ascii_dict()

# Lecture du fichier texte 'cyranno.txt'
with open('cyrano.txt', 'r', encoding='utf-8') as file:
    texte_francais = file.read()

# Convertir le texte en minuscules et retirer les accents
texte_francais = strip_accents(texte_francais).lower()

# Filtrer le texte pour ne garder que les caractères ASCII
texte_francais = ''.join(char for char in texte_francais if char in ascii_dict)

# Calcul de la distribution de probabilité
distribution = distribution_probabilite_ascii(texte_francais, ascii_dict)

# Trier la distribution par ordre décroissant des indices ASCII
sorted_distribution = dict(sorted(distribution.items(), key=lambda item: ascii_dict[item[0]], reverse=True))

# Préparation des données pour affichage sous forme de tableau
table = [(caractere, f"{probabilite:.4f}") for caractere, probabilite in sorted_distribution.items()]

# Affichage du tableau
print(tabulate(table, headers=["Caractère", "Probabilité"], tablefmt="grid"))



+-------------+---------------+
| Caractère   |   Probabilité |
|              |        0      |
+-------------+---------------+
| ~           |        0      |
+-------------+---------------+
| }           |        0      |
+-------------+---------------+
| |           |        0      |
+-------------+---------------+
| {           |        0      |
+-------------+---------------+
| z           |        0.0027 |
+-------------+---------------+
| y           |        0.0054 |
+-------------+---------------+
| x           |        0.0055 |
+-------------+---------------+
| w           |        0      |
+-------------+---------------+
| v           |        0.0134 |
+-------------+---------------+
| u           |        0.049  |
+-------------+---------------+
| t           |        0.0483 |
+-------------+---------------+
| s           |        0.0561 |
+-------------+---------------+
| r           |        0.0541 |
+-------------+---------------+
| q           |        0.0078 |
+-----

En utilisant la distribution de porbabilitée trouvée on peut chercher facilement le décalage du chiffrement 

### $1.1.1.3$ Chiffrement par substitution

![chiffrement par substitution](chiffrementparsubstitution.png)

In [75]:
dicofr = {
    'A': 0, 'B': 1, 'C': 2, 'D': 3, 'E': 4, 'F': 5, 'G': 6, 'H': 7, 'I': 8, 'J': 9,
    'K': 10, 'L': 11, 'M': 12, 'N': 13, 'O': 14, 'P': 15, 'Q': 16, 'R': 17, 'S': 18,
    'T': 19, 'U': 20, 'V': 21, 'W': 22, 'X': 23, 'Y': 24, 'Z': 25,
}

# Affichage du dictionnaire pour vérification
print(dicofr)


{'A': 0, 'B': 1, 'C': 2, 'D': 3, 'E': 4, 'F': 5, 'G': 6, 'H': 7, 'I': 8, 'J': 9, 'K': 10, 'L': 11, 'M': 12, 'N': 13, 'O': 14, 'P': 15, 'Q': 16, 'R': 17, 'S': 18, 'T': 19, 'U': 20, 'V': 21, 'W': 22, 'X': 23, 'Y': 24, 'Z': 25}


Compte tenu de notre dictionaire nous allons raisonner modulo 26 le chiffrement se fait simplement en donnant à chaque lettre de numero $l$ une lettre de numero $a$ ou a est l'image de l par la permutation particulière choisie sur  <span style="font-family: 'Arial Unicode MS', sans-serif; font-weight: bold;">Z</span>/<span style="font-family: 'Arial Unicode MS', sans-serif; font-weight: bold;">26</span><span style="font-family: 'Arial Unicode MS', sans-serif; font-weight: bold;">Z</span>



In [81]:
import random

# Liste des clés (lettres)
lettres1 = list(dicofr.keys())
lettres1

['A',
 'B',
 'C',
 'D',
 'E',
 'F',
 'G',
 'H',
 'I',
 'J',
 'K',
 'L',
 'M',
 'N',
 'O',
 'P',
 'Q',
 'R',
 'S',
 'T',
 'U',
 'V',
 'W',
 'X',
 'Y',
 'Z']

In [86]:
# Copiez la liste originale si vous avez besoin de la version non mélangée
lettres2 = lettres.copy()
# Mélange aléatoire des lettres
random.shuffle(lettres2)
lettres2


['T',
 'J',
 'X',
 'O',
 'C',
 'W',
 'G',
 'Z',
 'E',
 'N',
 'Y',
 'I',
 'U',
 'D',
 'A',
 'S',
 'H',
 'Q',
 'K',
 'B',
 'P',
 'F',
 'L',
 'M',
 'V',
 'R']

Cette permutation sera notre clé on chiffre en remplaçant le A par son image dans la permutation le B dans son image dans la permutation et ainsi de suite exemple

In [90]:
testsub="JETAIMEMONAMOUR"
testsub

'JETAIMEMONAMOUR'

In [95]:
def chiffsub(chaine,alph,clé):#il faut un message un alphabet et une clé
    res=[]#vecteur résultat
    for char in chaine:#on parcours les éléments de la chaine
        for i in range(0,len(alph)):#on recherche le caractere dans l'alphabet
            if (char==alph[i]):#on teste la corespondance entre le caractere et les éléments de l'alphabet mis sous forme de tableau
                res.append(clé[i])
    return res


In [99]:
lettres3=chiffsub(testsub,lettres1,lettres2)

Le déchiffrement est tres facile il suffit de chiffrer en échangeant l'alphabet et la clé

In [100]:
chiffsub(lettres3,lettres2,lettres1)

['J', 'E', 'T', 'A', 'I', 'M', 'E', 'M', 'O', 'N', 'A', 'M', 'O', 'U', 'R']

On peut remarquer qu'il s'agit la aussi d'un cryptosysthème à clé privée alice et bob connaissent tout les deux la permutation secrète qui est la clé ici

### $1.1.1.4$ Petits rappels de théorie des nombres +chiffrement affine


![tdn](chiffaff.png)
![tdn](chiffaff1.png)
![chiffrement affine](chiffaff2.png)

Si vous êtes simplement intéréssés par la crypto continuez votre lecture si vous aimez les mathématiques a ce stade je recommende de faire des exercices sur z/nz.

### Cryptographie symétrique (à clé privé)

### Cryptographie asymétrique (à clé publique)

### Cryptosystème de césar