Chiffrement de Vigenère
============


Réouvrir la page principale
--------------------------

[Cliquer ici](../main.ipynb)



Présentation de ce chiffrement
----------------------------

Le code de Vigenère, en référence au diplomate du XVI-ième siècle Blaise de Vigenère qui le décrit en 1586, est un système de chiffrement utilisant une clé et le tableau de correspondance suivant où chaque ligne peut être vue comme un chiffrement de César.

        |a|b|c|d|e|f|g|h|i|j|k|l|m|n|o|p|q|r|s|t|u|v|w|x|y|z
    ========================================================
    a ->|a|b|c|d|e|f|g|h|i|j|k|l|m|n|o|p|q|r|s|t|u|v|w|x|y|z
    b ->|b|c|d|e|f|g|h|i|j|k|l|m|n|o|p|q|r|s|t|u|v|w|x|y|z|a
    c ->|c|d|e|f|g|h|i|j|k|l|m|n|o|p|q|r|s|t|u|v|w|x|y|z|a|b
    d ->|d|e|f|g|h|i|j|k|l|m|n|o|p|q|r|s|t|u|v|w|x|y|z|a|b|c
    e ->|e|f|g|h|i|j|k|l|m|n|o|p|q|r|s|t|u|v|w|x|y|z|a|b|c|d
    f ->|f|g|h|i|j|k|l|m|n|o|p|q|r|s|t|u|v|w|x|y|z|a|b|c|d|e
    g ->|g|h|i|j|k|l|m|n|o|p|q|r|s|t|u|v|w|x|y|z|a|b|c|d|e|f
    h ->|h|i|j|k|l|m|n|o|p|q|r|s|t|u|v|w|x|y|z|a|b|c|d|e|f|g
    i ->|i|j|k|l|m|n|o|p|q|r|s|t|u|v|w|x|y|z|a|b|c|d|e|f|g|h
    j ->|j|k|l|m|n|o|p|q|r|s|t|u|v|w|x|y|z|a|b|c|d|e|f|g|h|i
    k ->|k|l|m|n|o|p|q|r|s|t|u|v|w|x|y|z|a|b|c|d|e|f|g|h|i|j
    l ->|l|m|n|o|p|q|r|s|t|u|v|w|x|y|z|a|b|c|d|e|f|g|h|i|j|k
    m ->|m|n|o|p|q|r|s|t|u|v|w|x|y|z|a|b|c|d|e|f|g|h|i|j|k|l
    n ->|n|o|p|q|r|s|t|u|v|w|x|y|z|a|b|c|d|e|f|g|h|i|j|k|l|m
    o ->|o|p|q|r|s|t|u|v|w|x|y|z|a|b|c|d|e|f|g|h|i|j|k|l|m|n
    p ->|p|q|r|s|t|u|v|w|x|y|z|a|b|c|d|e|f|g|h|i|j|k|l|m|n|o
    q ->|q|r|s|t|u|v|w|x|y|z|a|b|c|d|e|f|g|h|i|j|k|l|m|n|o|p
    r ->|r|s|t|u|v|w|x|y|z|a|b|c|d|e|f|g|h|i|j|k|l|m|n|o|p|q
    s ->|s|t|u|v|w|x|y|z|a|b|c|d|e|f|g|h|i|j|k|l|m|n|o|p|q|r
    t ->|t|u|v|w|x|y|z|a|b|c|d|e|f|g|h|i|j|k|l|m|n|o|p|q|r|s
    u ->|u|v|w|x|y|z|a|b|c|d|e|f|g|h|i|j|k|l|m|n|o|p|q|r|s|t
    v ->|v|w|x|y|z|a|b|c|d|e|f|g|h|i|j|k|l|m|n|o|p|q|r|s|t|u
    w ->|w|x|y|z|a|b|c|d|e|f|g|h|i|j|k|l|m|n|o|p|q|r|s|t|u|v
    x ->|x|y|z|a|b|c|d|e|f|g|h|i|j|k|l|m|n|o|p|q|r|s|t|u|v|w
    y ->|y|z|a|b|c|d|e|f|g|h|i|j|k|l|m|n|o|p|q|r|s|t|u|v|w|x
    z ->|z|a|b|c|d|e|f|g|h|i|j|k|l|m|n|o|p|q|r|s|t|u|v|w|x|y

Voici la méthode à employer.

1. Choisir une clé qui peut être soit un mot, soit une phrase ne contenant que des lettres minuscules non accentuées sans aucun caractère spécial tel qu'un espace, un point... etc. Prenons par exemple, "lebeautemps".

1. On lit lettre par lettre et en parallèle le texte à coder et la clé. Si on arrive à la fin de la clé, on recommence à son départ. La lettre de la clé permet de coder la lettre du texte via le tableau de Vigenère. Par exemple, si le texte à coder est "c est le moment de tester", on obtient ce qui suit où les espaces sont juste là pour facilités la lecture.

        Texte en clair | c est le moment de tester
        Clef répétée   | l ebe au tempsl eb eautemps
        Texte codé     | n itx ly fsytfe hf xemmid 
    
    Le "c" est codé en "n" d'après la ligne nommée "l", le "e" en "i" d'après la ligne nommée "e"... etc.



À vous de jouer : crypter et décrypter quand on connaît la clé
----------------------------------------------------------

Voici ce que vous devez faire dans le programme ci-après.

1. Vous devez commencer par construire le tableau de Vigenère sous forme d'un dictionnaire `table_vigenere` dont les clés seront les lettres nommant les lignes, et les valeurs seront des dictionnaires similaires à ceux utilisés pour le chiffrement de César. L'idée est de pouvoir utiliser `table_vigenere["l"]["c"]` pour obtenir la valeur `"n"` qui traduit le fait que la ligne nommée "l" code le "c" en "n". 

1. Utilisez ensuite le dictionnaire à deux niveaux `table_vigenere` pour coder le texte contenu dans la variable `texte` en utilisant la clé donné par la variable `clef`.

1. Pour finir, décoder le texte codé. Ceci permet au passage de vérifier que le programme ne fait pas n'importe quoi.

In [1]:
# ----------------------- #
# -- À VOUS DE JOUER ! -- #
# ----------------------- #

alphabet = "abcdefghijklmnopqrstuvwxyz"

table_vigenere = {}


# ---------- #
# -- TEST -- #
# ---------- #

clef = "lebeautemps"

texte = "c est le moment de tester"
texte = texte.replace(" ", "")

print(texte)

cestlemomentdetester


Pour les plus rapides : une première étape pour casser un code de Vigenère 
----------------------------------------------------------------------

Le décodage complet est compliqué à mener sans une étude théorique préalable. Il existe une méthode statistique mais nous ne l'aborderons pas dans ce document. Ceci étant dit, cette méthode s'appuie sur la connaisance de la taille de la clé.
Tout le problème consiste donc à trouver la taille de la clé. Friedrich Kasiski publie en 1863 une méthode efficace pour faire cela, c'est ce que l'on appelle aujourd'hui le test de Kasiski. Considérons le texte "messager tres mesquin mesopotamien" que l'on code en utilisant la clé "abcd" *(nous reprenons l'exemple proposé dans [cette page](http://fr.wikipedia.org/wiki/Cryptanalyse_du_chiffre_de_Vigenère))*. On obtient ce qui suit.

    Texte en clair | [mes]sager tres [mes]quin [mes]opotamien
    Clef répétée   |  abc dabcd abcd  abc dabc  dab cdabcdabc
    Texte codé     | [mfu]vahgu tsgv [mfu]tujp [pet]qsoucpifp
                      ^^^             ^^^       ^^^  
                      
Le texte à coder contient plusieurs fois le trigramme "mes" qui est codé deux fois en "mfu", et une seule fois en "pet". Ce sont ces séquences codées répétées qu'il faut exploiter car elles peuvent indiquer deux caractéristiques.

1. Soit la même séquence de lettres du texte clair a été chiffrée avec la même partie de la clef.

1. Soit deux suites de lettres différentes dans le texte clair auraient par pure coïncidence engendré la même suite dans le texte chiffré. Ceci est faiblement probable.


L'idée consiste donc à repérer des répétitions de $n$ lettres dans le code en faisant l'hypothèse que ces répétitions ne sont pas dues au hasard. On obtient ainsi des distances séparant ces répétitions, des distances qui sont alors par hypothèse des multiples de la longeur de la clé. La longueur de la clé sera alors un diviseur commun de ces distances, c'est à dire un diviseur du PGCD de ces distances, pour peu que les répétitions repérées ne soient pas dues au hasard. 


**Note :** voici comment calculer facilement le PGCD de deux naturels avec Python 3.

In [2]:
from fractions import gcd

print(gcd(30, 70))

10


Faire un programme qui tente de trouver des longeurs probables de la clé utilisée pour obtenir le texte codé ci-dessous. Le texte initial ne contenait que des lettres minuscules non accentuées.

In [3]:
from fractions import gcd

texte_code = """
ctoojesldmhmbkietaimucbjzpavueumqxppivovbxvkkrpkcgumixrlroqqjahkvtpz
bvptcmleuyirdiwyzltaimulslrmxstiowprveijwrocsyfnelzikmottocazsmmixfr
spvejzsjvsvbmvsmgrliupbhpvbkiuclmhvkozzocjtetawwleiymwqwiyjetsmrwwmg
etevcvdmzgrppyqwmirucehjmrumbvioupbebdsiqealizjlsjvcduvejaggectzqpfb
ijzaxamrdwfkrlpnmqvzszvuijwqnmagztglatpcfrvgglkiutvksrtbbysvshveikwv
bbwrtocucxvvskoihamrdmhxvsbvczfustketlvgpzszfuiqmyomwrrcrvutbobgcecc
wcflsliacjmppcwyrdwlueslsmiivuirbtojzeillixwfsjpjpatfvrgetescwjmixja
cumitqzbfypnmeqwixjocjwqqbsvrrrvcvbvhkeppybmdczovrahtpfuomeetateiwzr
rnslqpemjoettuayjbsgmicnbuvihxvaczaidzszrigllyecqjvntcmvtkvgigtxcmmk
ctjegcinvaearlptwvulsivstporfcfkkdtzwrgqzyzlkpamuifudepbksvzgjlnttqw
tqctuieswqbbwwlesllivfotjeiptcsmhulrchtssaeazlnmcxowasvstjziuiwxvdpt
jetaojvyglaxbvhzioxzirtxstuacakitlsaostqwysawrcuikmwmqjxvsiyimuibzue
rygtuwuxrpwpmiumbziatuksoboikaklkhfaqxppivtshcsyvnupvlfvfozixxcmbdoo
kbthcgpcdjvsipuiqwixcuxsmjjbgktrtaimsmrkjaroiqczsocfjamruzszvmezyyft
eavptbasmlozvtblvevvsbzeiymwqmikoebwtejzsocmdbzyulittacjmvemzgxognmw
bbcssetzbemmurzstzimobszzecumhvuctk
"""

# On nettoie les espaces initaux et finaux inutiles.
texte_code = texte_code.strip()

# On remplace les retours à la ligne par des espaces.
texte_code = texte_code.replace("\n", " ")


# ----------------------- #
# -- À VOUS DE JOUER ! -- #
# ----------------------- #
