# Notebook Examen PAPY 2022

# Partie 2: Programmation sur machine
Vous avez terminé la partie connaissance du python de cet examen. Maintenant, vous devez proposer un programme qui réalise le chiffrement suivant.

## Présentation du problème: Chiffrment par dictionnaire

### Chiffrement de César
En cryptographie, le chiffrement par décalage, aussi connu comme le chiffre de César, est une méthode de chiffrement très simple utilisée par Jules César dans ses correspondances secrètes.

![](img/Caesar3.svg)

Le texte chiffré s'obtient en remplaçant chaque lettre du texte clair original par une lettre à distance fixe, toujours du même côté, dans l'ordre de l'alphabet. Pour les dernières lettres (dans le cas d'un décalage à droite), on reprend au début. Par exemple avec un décalage de 3 vers la droite, A est remplacé par D, B devient E, et ainsi jusqu'à W qui devient Z, puis X devient A etc. Il s'agit d'une permutation circulaire de l'alphabet. La longueur du décalage, 3 dans l'exemple évoqué, constitue la clé du chiffrement qu'il suffit de transmettre au destinataire pour que celui-ci puisse déchiffrer le message. 

#### Example
Le chiffrement peut être représenté par la superposition de deux alphabets, l'alphabet clair présenté dans l'ordre normal et l'alphabet chiffré décalé, à gauche ou à droite, du nombre de lettres voulu. Nous avons ci-dessous l'exemple d'un encodage de 3 lettres vers la droite. Le paramètre de décalage (ici 3) est la clé de chiffrement :


| clair  |  ABCDEFGHIJKLMNOPQRSTUVWXYZ
|---    |:-:    |
|   chiffré       |DEFGHIJKLMNOPQRSTUVWXYZABC|

Pour encoder un message, il suffit de regarder chaque lettre du message clair, et d'écrire la lettre encodée correspondante. Pour déchiffrer, on fait tout simplement l'inverse.

| clair  | WIKIPEDIA L'ENCYCLOPEDIE LIBRE    
|---    |:-:    |
| chiffré |ZLNLSHGLD O'HQFBFORSHGLH OLEUH

*Source: Wikipedia*

### Chiffre de Vigenère
Le chiffrage ci-dessus est très faible, même pour une longue table de caractères, par exemple ASCII.

Pour améliorer la sécurité de notre chiffrement, on introduit un chiffrage plus complexe (aussi connue sous le nom de chiffre de Vigenère). Cette fois-ci, au lieu d'utiliser le même décalage pour tous les caractères, on va faire varier le décalage (shift) à chaque caractère. On utilisera pour cela une clé de chiffrage sous la forme d'une chaine de caractères (un mot ou une phrase) pour laquelle chaque lettre détermine le décalage (place dans la table de caractères). Lorsque la clé est épuisée, on reprend au premier élément de celle-ci.

Pour un indice donné `i`, on chiffrera le i-eme caractère du texte  `texte[i]` en applicant le décalage donné par la position de la `clé[i]`  dans le dictionnaire i.e. `shift[i]=position(clé[i],dic)`.


```
alpha="ABCDEFGHIJKLMNOPQRSTUVWXYZ"

Texte en clair :   j'adore ecouter la radio toute la journee
Clé répétée    :   M USIQU EMUSIQU EM USIQU EMUSI QU EMUSIQU
                   ^ ^^^
                   | ||Texte O, clé I : shift=8, on obtient le chiffré W
                   | |Texte D, clé S : shift=8, on obtient le chiffré L
                   | Texte A, clé U : shift=8, on obtient le chiffré I
                   Texte J, clé M : shift=8, on obtient le chiffré R
```

<div class="alert alert-danger" role="alert">
   <b> Attention : </b> vous devez documenter vos codes en utilisant a bon escient les commentaires et docstrings. Cela fait partie intégrante de l'évaluation de vos compétences.
</div>

## Implémentation du Code César
1. Écrire une fonction `caesar(message, alpha, shift)-> str` du codage César. Elle prend pour argument le texte (`message`), la clé (`shift`) et l'alphabet `alpha` et renvoie le texte chiffré. Vous testerez de façon adéquate avec l'alphabet standard `"ABCDEFGHIJKLMNOPQRSTUVWXYZ"`.
1. Encoder le message suivant : "Tu quoque mi fili" avec un décalage de 8.
1. Décoder ce message (en anglais): "ROVVY GYBVN" et en donner la clé.


In [20]:
# 2.2.1 Fonction caesar
def caesar(message, alpha, shift) -> str:
    res = []
    alpha = alpha.lower()       # On travaille toujours avec les lettres en lowercase pour éviter d'erreurs
    message = message.lower()
    for k in message:           # On chiffre seulement les lettres, les autres symboles restent égaux
        if k in alpha:
            current = alpha.index(k, 0)
            new = (current + shift) % 26 # On faire le modulu pour s'assurrer de retourner à premier lettre
            res.append(alpha[new])
        else:
            res.append(k)

    return ''.join(res)

caesar('salut!', 'ABCDEFGHIJKLMNOPQRSTUVWXYZ', -1)

'rzkts!'

In [14]:
#2.2.2 Encodage 
caesar('Tu quoque mi fili', 'ABCDEFGHIJKLMNOPQRSTUVWXYZ', 8)

'bc ycwycm uq nqtq'

On va maintenant utiliser les caractères de la table ASCII imprimable qui va assurer le bon fonctionnement sur un texte en anglais (sans accent). On peut obtenir avec la commande suivante: 
```python
>>> [chr(i) for i in range(32,127)]
[' ', '!', '"', '#', '$', '%', '&', "'", '(', ')', '*', '+', ',', 
'-', '.', '/', '0', '1', '2', '3', '4', '5', '6', '7', '8', '9', ':', 
';', '<', '=', '>', '?', '@', 'A', 'B', 'C', 'D', 'E', 'F', 'G', 'H',
 'I', 'J', 'K', 'L', 'M', 'N', 'O', 'P', 'Q', 'R', 'S', 'T', 'U', 
 'V', 'W', 'X', 'Y', 'Z', '[', '\\', ']', '^', '_', '`', 'a', 'b', 
 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j', 'k', 'l', 'm', 'n', 'o', 
 'p', 'q', 'r', 's', 't', 'u', 'v', 'w', 'x', 'y', 'z', '{', '|', '}
 ', '~']
```

## Chiffre de Vigenère avec une classe
1. Créer une classe de chiffrement `Vigenere` qui stocke la clé `key` et le tableau de chiffrement `alpha` et qui possède la méthode `code` et `decode`. On s'assurera que l'exemple d'implémentation suivant fonctionne bien:
```python
>>> ASCII=[chr(i) for i in range(32,127)]
>>> enigma=Vigenere(alpha=ASCII,key="my fancy key!")
>>> print(enigma)
Vigenere encoder-decoder with
key="my fancy key!"
alpha=[' ', '!', '"', '#', '$', '%', '&', "'", '(', ')', '*', '+', ',
', '-', '.', '/', '0', '1', '2', '3', '4', '5', '6', '7', '8', '9', 
':', ';', '<', '=', '>', '?', '@', 'A', 'B', 'C', 'D', 'E', 'F', 'G', 
'H', 'I', 'J', 'K', 'L', 'M', 'N', 'O', 'P', 'Q', 'R', 'S', 'T', 'U', 
'V', 'W', 'X', 'Y', 'Z', '[', '\\', ']', '^', '_', '`', 'a', 'b', 
'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j', 'k', 'l', 'm', 'n', 'o', 'p', 
'q', 'r', 's', 't', 'u', 'v', 'w', 'x', 'y', 'z', '{', '|', '}', '~']
>>> coded_farm=enigma.code(animal_farm)
>>> enigma.decode(coded_farm)
Mr. Jones, of the Manor Farm, had locked the hen-houses for the 
night, but was too drunk to remember to shut the pop-holes...
```
2. Exécuter l'algorithme sur l'exemple de texte ci-dessous avec la clé `"George Orwell wrote more than 1984"` et stocker le résultat dans la variable `code_farm`. 

**Exemple de texte suffisamment long pour obtenir de bonnes statistiques. Animal Farm, George Orwell (1945) en version originale:**

Mr. Jones, of the Manor Farm, had locked the hen-houses for the night, but was too drunk to remember to shut the pop-holes. With the ring of light from his lantern dancing from side to side, he lurched across the yard, kicked off his boots at the back door, drew himself a last glass of beer from the barrel in the scullery, and made his way up to bed, where Mrs. Jones was already snoring.

As soon as the light in the bedroom went out there was a stirring and a fluttering all through the farm buildings. Word had gone round during the day that old Major, the prize Middle White boar, had had a strange dream on the previous night and wished to communicate it to the other animals. It had been agreed that they should all meet in the big barn as soon as Mr. Jones was safely out of the way. Old Major (so he was always called, though the name under which he had been exhibited was Willingdon Beauty) was so highly regarded on the farm that everyone was quite ready to lose an hour's sleep in order to hear what he had to say.

At one end of the big barn, on a sort of raised platform, Major was already ensconced on his bed of straw, under a lantern which hung from a beam. He was twelve years old and had lately grown rather stout, but he was still a majestic-looking pig, with a wise and benevolent appearance in spite of the fact that his tushes had never been cut. Before long the other animals began to arrive and make themselves comfortable after their different fashions. First came the three dogs, Bluebell, Jessie, and Pincher, and then the pigs, who settled down in the straw immediately in front of the platform. The hens perched themselves on the window-sills, the pigeons fluttered up to the rafters, the sheep and cows lay down behind the pigs and began to chew the cud. The two cart-horses, Boxer and Clover, came in together, walking very slowly and setting down their vast hairy hoofs with great care lest there should be some small animal concealed in the straw. Clover was a stout motherly mare approaching middle life, who had never quite got her figure back after her fourth foal. Boxer was an enormous beast, nearly eighteen hands high, and as strong as any two ordinary horses put together. A white stripe down his nose gave him a somewhat stupid appearance, and in fact he was not of first-rate intelligence, but he was universally respected for his steadiness of character and tremendous powers of work. After the horses came Muriel, the white goat, and Benjamin, the donkey. Benjamin was the oldest animal on the farm, and the worst tempered. He seldom talked, and when he did, it was usually to make some cynical remark—for instance, he would say that God had given him a tail to keep the flies off, but that he would sooner have had no tail and no flies. Alone among the animals on the farm he never laughed. If asked why, he would say that he saw nothing to laugh at. Nevertheless, without openly admitting it, he was devoted to Boxer; the two of them usually spent their Sundays together in the small paddock beyond the orchard, grazing side by side and never speaking.

In [42]:
### 2.3.1 Classe Vignemere
class Vignemere:

    def __init__(self, key = None, alpha = None) -> None:
        
        self.alpha = alpha
        self.key = key
        

    def code(self, message):        # Comme les spaces sont en l'alphabet, ils sont codés aussi
        res = []                    # Comme tous les symboles spéciales
        for k in range(len(message)):
            current = self.alpha.index(message[k], 0)
            new = (current + self.alpha.index(self.key[k % (len(self.key))], 0)) % (len(self.alpha))
            res.append(self.alpha[new])

        return ''.join(res)

    def decode(self, message):
        res = []
        for k in range(len(message)):
            current = self.alpha.index(message[k], 0)
            new = (current - self.alpha.index(self.key[k % (len(self.key))], 0)) % (len(self.alpha))
            res.append(self.alpha[new])

        return ''.join(res)



ASCII = [chr(i) for i in range(32,137)]
enigma = Vignemere(alpha = ASCII, key = 'my fancy key')
ex = enigma.code('salut!')
print(ex)
print(enigma.decode(ex))

WQlRLo
salut!


In [38]:
### 2.3.2 Encodage d'animal farm
ASCII = [chr(i) for i in range(32,137)]
enigma = Vignemere(alpha = ASCII, key = "George Orwell wrote more than 1984")
text = "Mr. Jones, of the Manor Farm, had locked the hen-houses for the night, but was too drunk to remember to shut the pop-holes. With the ring of light from his lantern dancing from side to side, he lurched across the yard, kicked off his boots at the back door, drew himself a last glass of beer from the barrel in the scullery, and made his way up to bed, where Mrs. Jones was already snoring. As soon as the light in the bedroom went out there was a stirring and a fluttering all through the farm buildings. Word had gone round during the day that old Major, the prize Middle White boar, had had a strange dream on the previous night and wished to communicate it to the other animals. It had been agreed that they should all meet in the big barn as soon as Mr. Jones was safely out of the way. Old Major (so he was always called, though the name under which he had been exhibited was Willingdon Beauty) was so highly regarded on the farm that everyone was quite ready to lose an hour's sleep in order to hear what he had to say. At one end of the big barn, on a sort of raised platform, Major was already ensconced on his bed of straw, under a lantern which hung from a beam. He was twelve years old and had lately grown rather stout, but he was still a majestic-looking pig, with a wise and benevolent appearance in spite of the fact that his tushes had never been cut. Before long the other animals began to arrive and make themselves comfortable after their different fashions. First came the three dogs, Bluebell, Jessie, and Pincher, and then the pigs, who settled down in the straw immediately in front of the platform. The hens perched themselves on the window-sills, the pigeons fluttered up to the rafters, the sheep and cows lay down behind the pigs and began to chew the cud. The two cart-horses, Boxer and Clover, came in together, walking very slowly and setting down their vast hairy hoofs with great care lest there should be some small animal concealed in the straw. Clover was a stout motherly mare approaching middle life, who had never quite got her figure back after her fourth foal. Boxer was an enormous beast, nearly eighteen hands high, and as strong as any two ordinary horses put together. A white stripe down his nose gave him a somewhat stupid appearance, and in fact he was not of first-rate intelligence, but he was universally respected for his steadiness of character and tremendous powers of work. After the horses came Muriel, the white goat, and Benjamin, the donkey. Benjamin was the oldest animal on the farm, and the worst tempered. He seldom talked, and when he did, it was usually to make some cynical remark—for instance, he would say that God had given him a tail to keep the flies off, but that he would sooner have had no tail and no flies. Alone among the animals on the farm he never laughed. If asked why, he would say that he saw nothing to laugh at. Nevertheless, without openly admitting it, he was devoted to Boxer; the two of them usually spent their Sundays together in the small paddock beyond the orchard, grazing side by side and never speaking."


code_farm = enigma.code(text)

## Codage et décodage d'un vrai texte
*On va maintenant démontrer la faiblesse du code César et la relative force du code de Vigenère.*

### Casser César
Dans cet exercice, on va attaquer le texte chiffré (avec la table `ASCII`) par la méthode César suivant:

In [None]:
message_secret="""Lok ~sp v*s}*lo~~o|*~rkx* qv$8
O#zvsms~*s}*lo~~o|*~rkx*swzvsms~8
]swzvo*s}*lo~~o|*~rkx*mywzvo#8
Mywzvo#*s}*lo~~o|*~rkx*mywzvsmk~on8
Pvk~*s}*lo~~o|*~rkx*xo}~on8
]zk|}o*s}*lo~~o|*~rkx*nox}o8
\oknklsvs~$*my x~}8
]zomskv*mk}o}*k|ox1~*}zomskv*oxy qr*~y*l|oku*~ro*| vo}8
Kv~ry qr*z|km~smkvs~$*lok~}*z |s~$8
O||y|}*}ry vn*xo!o|*zk}}*}svox~v$8
_xvo}}*o#zvsms~v$*}svoxmon8
Sx*~ro*pkmo*yp*kwlsq s~$6*|op }o*~ro*~owz~k~syx*~y*q o}}8
^ro|o*}ry vn*lo*yxo77*kxn*z|opo|klv$*yxv$*yxo*77yl!sy }*"k$*~y*ny*s~8
Kv~ry qr*~rk~*"k$*wk$*xy~*lo*yl!sy }*k~*ps|}~* xvo}}*$y 1|o*N ~mr8
Xy"*s}*lo~~o|*~rkx*xo!o|8
Kv~ry qr*xo!o|*s}*yp~ox*lo~~o|*~rkx*4|sqr~4*xy"8
Sp*~ro*swzvowox~k~syx*s}*rk|n*~y*o#zvksx6*s~1}*k*lkn*snok8
Sp*~ro*swzvowox~k~syx*s}*ok}$*~y*o#zvksx6*s~*wk$*lo*k*qyyn*snok8
Xkwo}zkmo}*k|o*yxo*ryxusxq*q|ok~*snok*77*vo~1}*ny*wy|o*yp*~ry}o+"""

Puisqu'il est mono-dictionnaire, on propose de l'attaquer par une analyse fréquentielle. En effet, la fréquence des lettres dans une langue donnée tend vers une valeur connue si le texte est suffisamment long et varié. Par exemple, on retrouve les 5 lettres les plus utilisées dans les textes en anglais.

| Lettre  |  Fréquence |
|---    |:-:    |
|E 	|13%  |	 
|T 	|9.1% |  	
|A 	|8.2% | 	
|O 	|7.5% | 	
|I 	|7%   | 	

On aura par exemple la répartition suivante sur le texte clair de notre `message_secret`.

![](img/freq_en.png)

1. Écrire une fonction `compute_frequency` qui calcule la fréquence des caractères dans un texte donné.
```python
>>> compute_frequency(message)
'*': 0.14355231143552297,
 'o': 0.10462287104622861,
 '~': 0.09002433090024323,
 'k': 0.06082725060827245,
 's': 0.059610705596107004
```
2. Grâce à `matplotlib` et en particulier `plt.bar(coord,height, label=...)`, proposer un graphe similaire à celui présenté au-dessus.
3. À partir de `compute_frequency`, décoder le `message_secret` sans utiliser la force brute. 

In [None]:
### 2.4.1.1 fonction compute_frequency +  test

In [None]:
### 2.4.1.2 Plot

In [None]:
### Décodage de message_secret

### Se casser les dents sur Vigenère
*À l'inverse, le code de Vigenère ne peut pas être attaqué directement par recherche fréquentielle.*

1. Utiliser `compute_frequency` sur le résultat de codage Vigenère `code_farm`. Expliquer le résultat.
2. À la lumière de cette analyse, proposer une méthode ou un critère qui assure une bonne robustesse pour le code de Vigenère.
3. Proposer un algorithme d'attaque par force brute.
   1. Quel est le nombre d'évaluations en fonction de la longueur de la clé? 
   2. Le tester sur le texte chiffré suivant (clé à deux caractères). 
   
```
'!)9-Jy4(4C!-.-'
```

In [None]:
### 2.4.2.1 application sur du Vigenère

Réponse textuelle 2.4.2.2

Réponse textuelle 2.4.2.3.1

In [None]:
#### Attaque par force brute