## **TP6 : Cryptographie symétrique**


# 1.   Mise en bouche

Créer une classe `Cesar` contenant en attribut la clé : le constructeur initialise la clé avec son argument, et avec une valeur aléatoire si aucun argument ni fournis. Implémenter deux méthodes permettant de chiffrer et déchiffrer un message. **Important : dans ce TP, on considère des messages sur 27 caractères (A-Z + espace), où les espaces ne sont pas modifiés lors du chiffrement. Pourquoi n'est-ce pas (trop) restrictif ?**

Écrire ensuite trois fonctions permettant de déterminer la clé utilisée par un chiffrement de César. Chacune de ces fonction pourra utiliser les différents niveaux d’attaque suivants :
*   Texte chiffré choisi : elle prend en argument un objet `Cesar` et peut utiliser la méthode de déchiffrement.
*   Texte clair choisi : elle prend en argument un objet `Cesar` et peut seulement utiliser la méthode de chiffrement.
*   Texte clair connu : elle prend en argument deux chaînes (correspondant au message en clair et chiffré).

Avant de s’attaquer au dernier niveau (texte chiffré seul), il faut développer quelques outils.

In [85]:
from random import randint

class Cesar:
    def __init__(self, key=None):
        if key is None:
            key = randint(0, 26)
        self.key = key

    def encode(self, plain):
        cipher = ""
        for char in plain:
            if char.isalpha():  # Vérifiez si le caractère est une lettre
                shifted = ord(char) + self.key
                if char.islower():
                    if shifted > ord('z'):
                        shifted -= 26
                    elif shifted < ord('a'):
                        shifted += 26
                elif char.isupper():
                    if shifted > ord('Z'):
                        shifted -= 26
                    elif shifted < ord('A'):
                        shifted += 26
                cipher += chr(shifted)
            else:
                cipher += char  # Si ce n'est pas une lettre, conservez le caractère tel quel
        return cipher

    def decode(self, cipher):
        plain = ""
        for char in cipher:
            if char.isalpha():
                shifted = ord(char) - self.key
                if char.islower():
                    if shifted > ord('z'):
                        shifted -= 26
                    elif shifted < ord('a'):
                        shifted += 26
                elif char.isupper():
                    if shifted > ord('Z'):
                        shifted -= 26
                    elif shifted < ord('A'):
                        shifted += 26
                plain += chr(shifted)
            else:
                plain += char
        return plain

def bruteforce_decrypt(cesar, cipher):
    assert isinstance(cesar, Cesar)

    print("Les possibilités de déchiffrement de {} sont :".format(cipher))
    for i in range(26):
        cesar.key = i
        plain = cesar.decode(cipher)
        print("Clé : {}, Texte clair : {}".format(i, plain))


def chosen_cipher(cesar):
    assert isinstance(cesar, Cesar)
    #déduire la clé en utilisant cesar.decode()

    key = 26 - ord(cesar.decode('A'))%65

    print("la clé de chiffrement est : {}".format(key))
    return key

def chosen_plain(cesar):
    assert isinstance(cesar, Cesar)
    
    # Texte clair choisi
    known_plain = "A"
    
    # Chiffrer le texte clair choisi
    cipher = cesar.encode(known_plain)
    
    # Calculer la différence entre la première lettre du texte chiffré et la première lettre du texte clair choisi
    # pour trouver la clé
    key = (ord(cipher) - ord(known_plain)) % 26

    print("La clé de chiffrement est : {}".format(key))
    return key




def known_plain(plain, cipher):
    # Connaissant le texte clair et le texte chiffré,
    # vous pouvez calculer directement la clé utilisée
    key = (ord(cipher[0]) - ord(plain[0])) % 26
    print("la clé de chiffrement est : {}".format(key))
    return key


key = int(input("Veuillez saisir une clé de chiffrement ('-1' pour une clé aléatoire) :"))
cesar = Cesar() if key<0 else Cesar(key)

plain = input("Veuillez saisir un texte à chiffrer par la clé {}:".format(cesar.key))

print("Le chiffrement de {} par la clé {} est : {}".format(plain, cesar.key, cesar.encode(plain)))

cipher = input("Veuillez saisir un texte à déchiffrer par la clé {}:".format(cesar.key))

print("Le déchiffrement de {} par la clé {} est : {}".format(cipher, cesar.key, cesar.decode(cipher)))

# Ajoutez vos tests
bruteforce_decrypt(cesar, cipher)
chosen_cipher(Cesar(17))
chosen_plain(Cesar(17))
known_plain(plain, cipher)

Le chiffrement de dsqsdf par la clé 3 est : gvtvgi
Le déchiffrement de sdfsdg par la clé 3 est : pacpad
Les possibilités de déchiffrement de sdfsdg sont :
Clé : 0, Texte clair : sdfsdg
Clé : 1, Texte clair : rcercf
Clé : 2, Texte clair : qbdqbe
Clé : 3, Texte clair : pacpad
Clé : 4, Texte clair : ozbozc
Clé : 5, Texte clair : nyanyb
Clé : 6, Texte clair : mxzmxa
Clé : 7, Texte clair : lwylwz
Clé : 8, Texte clair : kvxkvy
Clé : 9, Texte clair : juwjux
Clé : 10, Texte clair : itvitw
Clé : 11, Texte clair : hsuhsv
Clé : 12, Texte clair : grtgru
Clé : 13, Texte clair : fqsfqt
Clé : 14, Texte clair : epreps
Clé : 15, Texte clair : doqdor
Clé : 16, Texte clair : cnpcnq
Clé : 17, Texte clair : bmobmp
Clé : 18, Texte clair : alnalo
Clé : 19, Texte clair : zkmzkn
Clé : 20, Texte clair : yjlyjm
Clé : 21, Texte clair : xikxil
Clé : 22, Texte clair : whjwhk
Clé : 23, Texte clair : vgivgj
Clé : 24, Texte clair : ufhufi
Clé : 25, Texte clair : tegteh
la clé de chiffrement est : 17
La clé de chiffrem

15

# 2.   Boîte à outils
Implémenter des fonctions permettant de :
*   Calculer les fréquences de chaque lettre dans un message.
*   Calculer la distance (somme des valeurs absolues des différences) entre un tableau de fréquences et celui du français (en %)

|lettre|fréquence|
|:-:|:-:|
|A|8.15|
|B|0.97|
|C|3.15|
|D|3.73|
|E|17.39|
|F|1.12|
|G|0.97|
|H|0.85|
|I|7.31|
|J|0.45|
|K|0.02|
|L|5.69|
|M|2.87|
|N|7.12|
|O|5.28|
|P|2.80|
|Q|1.21|
|R|6.64|
|S|8.14|
|T|7.22|
|U|6.38|
|V|1.64|
|W|0.03|
|X|0.41|
|Y|0.28|
|Z|0.15|

*   calculer l’indice de coïncidence 



In [86]:
import string

fr_frequencies = {'A' : 8.15,\
                  'B' : 0.97,\
                  'C' : 3.15,\
                  'D' : 3.73,\
                  'E' : 17.39,\
                  'F' : 1.12,\
                  'G' : 0.97,\
                  'H' : 0.85,\
                  'I' : 7.31,\
                  'J' : 0.45,\
                  'K' : 0.02,\
                  'L' : 5.69,\
                  'M' : 2.87,\
                  'N' : 7.12,\
                  'O' : 5.28,\
                  'P' : 2.80,\
                  'Q' : 1.21,\
                  'R' : 6.64,\
                  'S' : 8.14,\
                  'T' : 7.22,\
                  'U' : 6.38,\
                  'V' : 1.64,\
                  'W' : 0.03,\
                  'X' : 0.41,\
                  'Y' : 0.28,\
                  'Z' : 0.15}

def calcul_iterations_letter_message(message):
    iterationByLetter = {}
    message = message.upper()
    for lettre in string.ascii_uppercase:
        iterationByLetter[lettre] = 0

    for lettre in message:
        if lettre.isalpha():
            iterationByLetter[lettre] += 1

    return iterationByLetter

def frequencies(message):
    f = {}
    
    dictionnaire_iterations = calcul_iterations_letter_message(message)
    len_message = sum(dictionnaire_iterations.values())

    for lettre, iterations in dictionnaire_iterations.items():
        f[lettre] = (iterations / len_message) * 100

    return f, len_message


def abs_distance(calculated_frequencies, target_frequencies, shift=0):
    distance = 0
    for lettre in calculated_frequencies:
        difference = calculated_frequencies[lettre] - target_frequencies[lettre]
        distance += abs(difference)

    return distance


def coincidence_index(calculated_occurrences, len_message):
    somme_freq = sum(iteration * (iteration - 1) for iteration in calculated_occurrences.values())
    indice_coincidence = somme_freq / (len_message * (len_message - 1))
    return indice_coincidence

msg_fq_test = input("Veuillez saisir un texte pour tester la class Decrypt")
fq, len_msg = frequencies(msg_fq_test)
print("Les fréquences sont : \n {}".format(fq))

print("La distance par rapport au tableau de fréquences du français est : {}".format(abs_distance(fq, fr_frequencies)))

print(" l’indice de coïncidence est : {}".format(coincidence_index(calcul_iterations_letter_message(msg_fq_test), len_msg)))

Les fréquences sont : 
 {'A': 0.0, 'B': 0.0, 'C': 0.0, 'D': 25.0, 'E': 0.0, 'F': 25.0, 'G': 25.0, 'H': 0.0, 'I': 0.0, 'J': 0.0, 'K': 0.0, 'L': 0.0, 'M': 0.0, 'N': 0.0, 'O': 0.0, 'P': 0.0, 'Q': 0.0, 'R': 0.0, 'S': 25.0, 'T': 0.0, 'U': 0.0, 'V': 0.0, 'W': 0.0, 'X': 0.0, 'Y': 0.0, 'Z': 0.0}
La distance par rapport au tableau de fréquences du français est : 172.04999999999998
 l’indice de coïncidence est : 0.0


Utiliser ces fonctions pour déterminer la clé la plus probable dans une attaque de type texte chiffré seul. 

Pouvez-vous décoder le message suivant ?

*VK MSQKVO KIKXD MRKXDO DYED VODO CO DBYEFK PYBD NOZYEBFEO AEKXN VK LSCO PED FOXEO*

Oui, le texte déchiffré donne : LA CIGALE AYANT CHANTE TOUT LETE SE TROUVA FORT DEPOURVUE QUAND LA BISE FUT VENUE. Pour ce faire, on a utilisé notre fonction calculant la fréquence de chaque lettre dans un message, et on a attribué la lettre avec la plus grande fréquence comme correspondant à la lettre “E” (lettre la plus utilisée dans l’alphabet français). On calcule ensuite l’écart entre ces deux lettres et nous n'avons plus qu'à décoder le message avec cet écart.

In [87]:
def cipher_only(cipher):
    freq, len_cipher = frequencies(cipher)
    max_freq_letter = max(freq, key=freq.get)

    max_freq_position = ord(max_freq_letter.lower()) - ord('a')
    e_position = ord('e') - ord('a')
    key = (max_freq_position - e_position) % 26
    coincidence = coincidence_index(calcul_iterations_letter_message(cipher), len_cipher)
    cesar = Cesar(key)
    plain = cesar.decode(cipher)
    
    return plain, key, coincidence

cipher = "VK MSQKVO KIKXD MRKXDO DYED VODO CO DBYEFK PYBD NOZYEBFEO AEKXN VK LSCO PED FOXEO"
plain, key, coincidence = cipher_only(cipher)
print("L'indice de coïncidence de votre séquence est : {} \n La clé la plus probable est {} \n Le message déchiffré est \n {}".format(coincidence, key, plain))


L'indice de coïncidence de votre séquence est : 0.06829488919041157 
 La clé la plus probable est 10 
 Le message déchiffré est 
 LA CIGALE AYANT CHANTE TOUT LETE SE TROUVA FORT DEPOURVUE QUAND LA BISE FUT VENUE


# 3.   Substitution
Adapter la classe `Cesar` pour chiffrer et déchiffrer par substitution. Implémenter des méthodes d'attaque dans les cadres de texte chiffré choisi, texte clair choisi et texte clair connu. Essayez de décrypter quelques messages (assez longs). 

In [88]:
from random import shuffle

class Subs:
    def __init__(self, key=None):
        if key is None:
            # Si aucune clé n'est fournie, générer une clé aléatoire
            alphabet = list('ABCDEFGHIJKLMNOPQRSTUVWXYZ')
            shuffled_alphabet = list('ABCDEFGHIJKLMNOPQRSTUVWXYZ')
            shuffle(shuffled_alphabet)
            self.key = dict(zip(alphabet, shuffled_alphabet))
            self.key_inv = dict(zip(shuffled_alphabet, alphabet))
        else:
            # Utiliser la clé fournie
            self.key = key
            self.key_inv = {v: k for k, v in key.items()}  # Construire la clé inverse

    def encode(self, plain):
        cipher = ""
        for char in plain.upper():
            if char.isalpha():  # Vérifier si le caractère est une lettre
                cipher += self.key.get(char, char)  # Utiliser la substitution, sinon conserver le caractère tel quel
            else:
                cipher += char  # Si ce n'est pas une lettre, conserver le caractère tel quel
        return cipher

    def decode(self, cipher):
        plain = ""
        for char in cipher.upper():
            if char.isalpha():  # Vérifier si le caractère est une lettre
                plain += self.key_inv.get(char, char)  # Utiliser la substitution inverse, sinon conserver le caractère tel quel
            else:
                plain += char  # Si ce n'est pas une lettre, conserver le caractère tel quel
        return plain

def chosen_cipher(subs):
    assert isinstance(subs, Subs)

    # Déduire la clé en utilisant subs.decode()
    LETTERS = 'ABCDEFGHIJKLMNOPQRSTUVWXYZ'
    key = {}

    for letter in LETTERS:
        k = subs.decode(letter)
        key[k] = letter

    print("la clé de chiffrement est : {}".format(key))
    return key

def chosen_plain(subs):
    assert isinstance(subs, Subs)

    # Déduire la clé en utilisant subs.encode() mais sans utiliser subs.decode()
    key = subs.encode('ABCDEFGHIJKLMNOPQRSTUVWXYZ')

    print("la clé de chiffrement est : {}".format(key))
    return key

def known_plain(plain, cipher):
    # Déduire une clé possible à partir de plain et cipher
    key = {}
    for p, c in zip(plain, cipher):
        if p.isalpha() and c.isalpha():  # Vérifier si les caractères sont des lettres
            key[p] = c

    print("la clé de chiffrement est : {}".format(key))
    return key


subs = Subs({'A': 'R', 'B': 'Y', 'C': 'B', 'D': 'Z', 'E': 'W', 'F': 'S', 'G': 'U', 'H': 'D', 'I': 'F', 'J': 'I', 'K': 'H', 'L': 'T', 'M': 'N', 'N': 'L', 'O': 'A', 'P': 'E', 'Q': 'K', 'R': 'G', 'S': 'C', 'T': 'P', 'U': 'Q', 'V': 'X', 'W': 'O', 'X': 'V', 'Y': 'M', 'Z': 'J'})
print(subs.key)
print(subs.key_inv)
cipher = subs.encode("LA CIGALE AYANT CHANTE TOUT LETE SE TROUVA FORT DEPOURVUE QUAND LA BISE FUT VENUE")
print(cipher)
print(subs.decode("TR BFURTW RMRLP BDRLPW PAQP TWPW CW PGAQXR SAGP ZWEAQGXQW KQRLZ TR YFCW SQP XWLQW"))

# Déduire la clé à partir de plain et cipher
key = known_plain("LA CIGALE AYANT CHANTE TOUT LETE SE TROUVA FORT DEPOURVUE QUAND LA BISE FUT VENUE", cipher)

# Déduire la clé à partir de subs
key = chosen_cipher(subs)

# Déduire la clé à partir de subs
key = chosen_plain(subs)

{'A': 'R', 'B': 'Y', 'C': 'B', 'D': 'Z', 'E': 'W', 'F': 'S', 'G': 'U', 'H': 'D', 'I': 'F', 'J': 'I', 'K': 'H', 'L': 'T', 'M': 'N', 'N': 'L', 'O': 'A', 'P': 'E', 'Q': 'K', 'R': 'G', 'S': 'C', 'T': 'P', 'U': 'Q', 'V': 'X', 'W': 'O', 'X': 'V', 'Y': 'M', 'Z': 'J'}
{'R': 'A', 'Y': 'B', 'B': 'C', 'Z': 'D', 'W': 'E', 'S': 'F', 'U': 'G', 'D': 'H', 'F': 'I', 'I': 'J', 'H': 'K', 'T': 'L', 'N': 'M', 'L': 'N', 'A': 'O', 'E': 'P', 'K': 'Q', 'G': 'R', 'C': 'S', 'P': 'T', 'Q': 'U', 'X': 'V', 'O': 'W', 'V': 'X', 'M': 'Y', 'J': 'Z'}
TR BFURTW RMRLP BDRLPW PAQP TWPW CW PGAQXR SAGP ZWEAQGXQW KQRLZ TR YFCW SQP XWLQW
LA CIGALE AYANT CHANTE TOUT LETE SE TROUVA FORT DEPOURVUE QUAND LA BISE FUT VENUE
la clé de chiffrement est : {'L': 'T', 'A': 'R', 'C': 'B', 'I': 'F', 'G': 'U', 'E': 'W', 'Y': 'M', 'N': 'L', 'T': 'P', 'H': 'D', 'O': 'A', 'U': 'Q', 'S': 'C', 'R': 'G', 'V': 'X', 'F': 'S', 'D': 'Z', 'P': 'E', 'Q': 'K', 'B': 'Y'}
la clé de chiffrement est : {'O': 'A', 'C': 'B', 'S': 'C', 'H': 'D', 'P': 'E', 'I': '

Implémenter une attaque à texte chiffré seul par analyse de fréquences. Cette fonction sera raffinée en section 5.

In [89]:
def cipher_only(cipher):
    key = {}

    letter_iterations = calcul_iterations_letter_message(cipher)

    sorted_cipher_letters = sorted(letter_iterations.items(), key=lambda x: x[1], reverse=True)
    sorted_fr_letters = sorted(fr_frequencies.items(), key=lambda x: x[1], reverse=True)

    for i in range(len(sorted_cipher_letters)):
        key[sorted_fr_letters[i][0]] = sorted_cipher_letters[i][0]

    subs = Subs(key)
    plain = subs.decode(cipher)

    coincidence = coincidence_index(letter_iterations, sum(letter_iterations.values()))

    return plain, key, coincidence

plain, key, coincidence = cipher_only(cipher)
print(cipher)
print(plain)
print(key)
print(coincidence) 

TR BFURTW RMRLP BDRLPW PAQP TWPW CW PGAQXR SAGP ZWEAQGXQW KQRLZ TR YFCW SQP XWLQW
RS OCGSRE SBSNA OVSNAE ATIA REAE DE AUTILS MTUA PEQTIULIE FISNP RS HCDE MIA LENIE
{'E': 'W', 'A': 'P', 'S': 'R', 'I': 'Q', 'T': 'A', 'N': 'L', 'R': 'T', 'U': 'G', 'L': 'X', 'O': 'B', 'D': 'C', 'C': 'F', 'M': 'S', 'P': 'Z', 'V': 'D', 'Q': 'E', 'F': 'K', 'B': 'M', 'G': 'U', 'H': 'Y', 'J': 'H', 'X': 'I', 'Y': 'J', 'Z': 'N', 'W': 'O', 'K': 'V'}
0.06829488919041157


Que constatez-vous ?

Ici, on constate que l’attaque d’un texte chiffré seul ne fonctionne pas ou très peu. Pour cette implémentation, on calcule la fréquence de chaque lettre dans le message, puis l’on trie le tableau des fréquences par ordre décroissant. On trie également le tableau des fréquences des lettres de l’alphabet français et l’on fait correspondre les deux tableaux pour faire un mapping des lettres. Une erreur peut paraître logique en effet, car même un message de plusieurs lignes ne représente pas la répartition des lettres dans l’alphabet français et leur fréquence d’utilisation. Les erreurs sont donc récurrentes.
Cependant, cette méthode de déchiffrage devrait, ou du moins être plus efficace sur des textes longs.

# 4.   Vigenère

Adapter la classe `Cesar` pour chiffrer et déchiffrer un code de Vigenère.  Implémenter des méthodes d'attaque dans les cadres de texte chiffré choisi, texte clair choisi et texte clair connu. 

In [90]:
from random import randint

class Vigenere:
    def __init__(self, key=None):
        if key is None:
            # Si aucune clé n'est fournie, générer une clé aléatoire
            self.key = ''.join(chr(randint(65, 90)) for _ in range(randint(5, 10)))  # Génération d'une clé aléatoire
        else:
            self.key = key.upper()  # Assurez-vous que la clé est en majuscules

    def encode(self, plain):
        cipher = ""
        key_length = len(self.key)
        for i, char in enumerate(plain):
            if char.isalpha():
                shift = ord(self.key[i % key_length]) - 65  # Convertir la lettre de la clé en décalage
                if char.islower():
                    cipher += chr(((ord(char) - 97 + shift) % 26) + 97)
                elif char.isupper():
                    cipher += chr(((ord(char) - 65 + shift) % 26) + 65)
            else:
                cipher += char  # Conserver les caractères non alphabétiques inchangés
        return cipher

    def decode(self, cipher):
        plain = ""
        key_length = len(self.key)
        for i, char in enumerate(cipher):
            if char.isalpha():
                shift = ord(self.key[i % key_length]) - 65  # Convertir la lettre de la clé en décalage
                if char.islower():
                    plain += chr(((ord(char) - 97 - shift) % 26) + 97)
                elif char.isupper():
                    plain += chr(((ord(char) - 65 - shift) % 26) + 65)
            else:
                plain += char  # Conserver les caractères non alphabétiques inchangés
        return plain

class DecryptVigenere:
    def known_plain(self, plain, cipher):
        # Déduire la clé à partir de plain et cipher
        key = ''.join(chr(((ord(cipher[i]) - ord(plain[i])) % 26) + 65) for i in range(len(plain)))
        return key

    def chosen_cipher(self, vigenere):
        assert isinstance(vigenere, Vigenere)
        key_len = len(vigenere.key)
        # Choisir un texte clair arbitraire
        chosen_plain = "ATTACKATDAWN"
        # Chiffrer le texte clair à l'aide de la méthode encode de l'objet Vigenere fourni
        chosen_cipher = vigenere.encode(chosen_plain)
        # Déduire la clé à partir du texte clair choisi et du texte chiffré résultant
        key = ''.join(chr(((ord(chosen_cipher[i]) - ord(chosen_plain[i])) % 26) + 65) for i in range(len(chosen_plain)))
        key = key[:key_len]
        print("La clé de chiffrement est :", key)
        return key

    def chosen_plain(self, vigenere):
        assert isinstance(vigenere, Vigenere)
        key_len = len(vigenere.key)
        # Choisir un texte chiffré arbitraire
        chosen_cipher = "XFKLVXFKZHU"
        # Déchiffrer le texte chiffré à l'aide de la méthode decode de l'objet Vigenere fourni
        chosen_plain = vigenere.decode(chosen_cipher)
        # Déduire la clé à partir du texte chiffré choisi et du texte clair résultant
        key = ''.join(chr(((ord(chosen_cipher[i]) - ord(chosen_plain[i])) % 26) + 65) for i in range(len(chosen_plain)))
        key = key[:key_len]
        print("La clé de chiffrement est :", key)
        return key


## Test de Friedman
Si la longueur de la clé est `k`, alors pour tout `i`, le sous-message formé par les lettres aux positions
`i mod k` est chiffré avec un chiffrement de César. En particulier, son indice de coïncidence doit
être proche de 0.07 (et non de 0.03).

En utilisant ce critère, écrire une fonction qui détermine la longueur (la plus probable) de la
clé. Écrire ensuite une fonction qui calcule la clé (la plus probable).

In [91]:
def friedman_length(cipher):
    # Longueur maximale de la clé que nous allons tester
    max_key_length = 20

    # Longueur du texte chiffré
    n = len(cipher)

    # Recherche de la longueur de clé la plus probable
    for k in range(1, max_key_length + 1):
        # Calculer l'indice de coïncidence moyenne pour les sous-messages de longueur k
        sum_coincidence = 0
        for i in range(k):
            # Extraire le sous-message formé par les lettres aux positions i modulo k
            sub_message = cipher[i::k]
            # Calculer l'indice de coïncidence du sous-message
            sub_message_length = len(sub_message)
            sub_coincidence = sum(sub_message.count(c) * (sub_message.count(c) - 1) for c in set(sub_message))
            if sub_message_length > 1:
                sub_coincidence /= (sub_message_length * (sub_message_length - 1))
            sum_coincidence += sub_coincidence

        # Calculer l'indice de coïncidence moyen pour toutes les positions
        avg_coincidence = sum_coincidence / k

        # Si l'indice de coïncidence moyen est proche de 0.07, nous avons probablement trouvé la longueur de la clé
        if abs(avg_coincidence - 0.07) < 0.01:
            return k

    return None


def cipher_only(cipher, key_length):
    key = ""
    for i in range(key_length):
        # On obtient un sous-texte contenant les lettres chiffrées avec la même lettre de la clé
        sub_cipher = cipher[i::key_length]
        
        # On trouve la fréquence des lettres dans le sous-texte
        frequencies = calculate_frequencies(sub_cipher)
        
        # On trie les lettres par fréquence décroissante
        sorted_letters = sorted(frequencies.keys(), key=lambda x: frequencies[x], reverse=True)
        
        # On déduit la lettre de la clé en supposant que la lettre la plus fréquente est la lettre 'E'
        shift = (ord(sorted_letters[0]) - ord('E')) % 26
        key += chr(shift + 65)
    
    return key

def calculate_frequencies(text):
    frequencies = {}
    for char in text:
        if char.isalpha():
            char = char.upper()
            if char in frequencies:
                frequencies[char] += 1
            else:
                frequencies[char] = 1
    return frequencies

## Test de Babbage-Kasiski

Implémenter une fonction qui détermine la liste des (positions des) sous-mots d’au moins
`p` lettres apparaîssant plusieurs fois dans un message.

In [92]:
import re
def repetitions(cipher,p):
    NONLETTRES_PATTERN = re.compile('[^A-Z]')
    message = NONLETTRES_PATTERN.sub('', cipher.upper())
    #taille max des chaines que l'on va chercher dans le texte. On ne devrait pas en mettre
    #Elle est mise pour que ça mette moins de temps lors de tests sur des gros textes
    maxLenRepetitions = 15

    liste_sous_mots = {}
    for sous_mot_len in range(p, maxLenRepetitions):
        for sous_mot_start in range(len(message) - sous_mot_len):
            seq = message[sous_mot_start:sous_mot_start + sous_mot_len]
            for i in range(sous_mot_start + sous_mot_len, len(message) - sous_mot_len):
                if message[i:i + sous_mot_len] == seq:
                    if seq not in liste_sous_mots:
                        liste_sous_mots[seq] = []
                    liste_sous_mots[seq].append(i - sous_mot_start)
    return liste_sous_mots

La plupart de ces répétitions correspondent (sauf faux-positif) à des sous-mots du message en
clair qui ont été chiffrés avec les mêmes portions de la clé. Dans ce cas, l’écart entre leurs positions
est un multiple de la longueur de la clé. En déduire une fonction qui fournit la longueur (probable) de la clé.

In [93]:
#taille max cherchée de la clé. On la met à 18. Idem, on pourrait mettre plus, mais ça n'a pas d'intérêt ici.
MAX_LEN_CLE = 18
def calcul_diviseurs(num):
    if num < 2:
        return []

    l_diviseurs = []

    for i in range(2, MAX_LEN_CLE + 1):
        if num % i == 0:
            l_diviseurs.append(i)
            l_diviseurs.append(int(num / i))

    if 1 in l_diviseurs:
        l_diviseurs.remove(1)

    return list(set(l_diviseurs))


def iterations_diviseurs(liste_diviseurs):
    nb_iterations_sous_mot = {}

    for div in liste_diviseurs:
        iterations_diviseurs = liste_diviseurs[div]
        for cle in iterations_diviseurs:
            if cle not in nb_iterations_sous_mot:
                nb_iterations_sous_mot[cle] = 0
            nb_iterations_sous_mot[cle] += 1

    diviseur_avec_iterations = []
    for diviseur in nb_iterations_sous_mot:
        if diviseur <= MAX_LEN_CLE:
            diviseur_avec_iterations.append((diviseur, nb_iterations_sous_mot[diviseur]))

    diviseur_avec_iterations.sort(key= lambda x: x[1], reverse=True)
    return diviseur_avec_iterations


def bk_length(cipher):
    liste_sous_mots = repetitions(cipher, 3)

    liste_diviseurs = {}

    for sous_mot in liste_sous_mots:
        liste_diviseurs[sous_mot] = []
        for div in liste_sous_mots[sous_mot]:
            liste_diviseurs[sous_mot].extend(calcul_diviseurs(div))

    liste_iterations_diviseurs = iterations_diviseurs(liste_diviseurs)
    
    cles_probables = []

    for tuple_diviseurs in liste_iterations_diviseurs:
        cles_probables.append(tuple_diviseurs[0])
        
    return cles_probables

Construisez ensuite quelques exemples et testez les deux algorithmes.

In [94]:
def taux_correspondance(key1, key2):
    #Retourne le taux de correspondance entre deux clés
    if len(key1) != len(key2):
        return
    n = len(key1)
    return sum(key1[i] == key2[i] for i in range(n)) / n


vigenere = Vigenere()
print("Clé de chiffrement : {}".format(vigenere.key))
plain = "themodelcheckerperformsautomaticverificationofsafetyandboundedlivenesspropertiesittakesasinputanetworkoftimedautomataandaformulatheverifiercanalsobeusedinteractivelytoexamineseveralpropertiesofasystemincasetheverificationofaparticularrealtimesystemfailswhichhappensmoreoftenthannotadiagnostictraceisautomaticallyreportedinordertofacilitatedebuggingitispossibletoinstructtheverifiertooptimisethatistrytoreducetheverificationtimewhenseveralpropertiesofasystemareexaminedinsequenceasimilaroptionforspaceoptimisationalsoexistsx" 
cipher = vigenere.encode(plain)

length_key = friedman_length(cipher)
print("Longueur de la clé : {}".format(length_key))
if length_key is not None:
    key = cipher_only(cipher, length_key)
    print("Clé de chiffrement : {}".format(key))
    print("Taux de correspondance : {}".format(taux_correspondance(key, vigenere.key)))


Clé de chiffrement : TATEP
Longueur de la clé : 5
Clé de chiffrement : TATED
Taux de correspondance : 0.8


In [95]:
vigenere = Vigenere()
print("Clé de chiffrement : {}".format(vigenere.key))
plain = "themodelcheckerperformsautomaticverificationofsafetyandboundedlivenesspropertiesittakesasinputanetworkoftimedautomataandaformulatheverifiercanalsobeusedinteractivelytoexamineseveralpropertiesofasystemincasetheverificationofaparticularrealtimesystemfailswhichhappensmoreoftenthannotadiagnostictraceisautomaticallyreportedinordertofacilitatedebuggingitispossibletoinstructtheverifiertooptimisethatistrytoreducetheverificationtimewhenseveralpropertiesofasystemareexaminedinsequenceasimilaroptionforspaceoptimisationalsoexistsx" 
cipher = vigenere.encode(plain)
cles_probables = bk_length(cipher)
#Pour voir la liste des tailles de clé probables, par ordre de probabilité
# print("les tailles de clés probables sont : ", cles_probables)
print("La taille de clé trouvée est : ", cles_probables[0])
print("clé de base : ", vigenere.key)

Clé de chiffrement : RBNGJ
La taille de clé trouvée est :  5
clé de base :  RBNGJ
