# Le XOR (ou exclusif) comme méthode de chiffrement

En Python, on connaît bien les opérateurs sur les nombres
(opérations usuelles), mais moins les opérateurs qui agissent bit à
bit sur les représentations des entiers signés (relatifs). Dans ce
document, on ne traite que des entiers positifs.

Ces opérations sont parfaitement documentés dans la [documentation
officielle de
Python](https://docs.python.org/fr/3.9/library/stdtypes.html).

Explorons tout d'abord les possibilités de ces opérateurs.

__*Consignes*__ Coder une fonction `operation_bits` qui prend trois arguments :
 deux nombres entiers et une fonction ; `operation_bits` renvoie un
 triplet de chaînes correspondant aux representations binaires des
 deux nombres entiers et du résultat de l'application de la
 fonction aux deux nombres passés en argument.

La fonction passée en argument est du style : `lambda x, y: x+y`

Ici c'est la fonction correspondant à l'addition.
Attention, la représentation binaire devra être d'identique longueur pour les trois nombres, donc nécessitera d'éventuels zéros inutiles (voir [ce code](https://docs.python.org/3/whatsnew/3.6.html#pep-498-formatted-string-literals) illustrant les possibilités des `f-strings` lors de leur introduction dans Python).

In [1]:
import math

def operation_bits(A, B, f):
    resultat = f(A, B)
    longueur = 1 + int(math.log2(resultat))
    return tuple([f"{x:0{longueur}b}" for x in (A, B, resultat)])

N1 = 236
N2 = 100
for nombre in operation_bits(N1, N2, lambda x, y: x + y):
    print(nombre)

011101100
001100100
101010000


**Ce qu'on va réaliser : l'idée de ce document jupyter est d'utiliser le `XOR` (OU EXCLUSIF) pour transformer un message caractère par caractère en utilisant une clé. C'est un chiffrement symétrique : la clé sert à chiffrer et à décrypter.**

Pour **réellement** coder un message écrit sous forme de chaînes, on va transformer chaque lettre du message en un entier.

_**Question :**_ Quelle fonction/commande Python réalise cela ?

__*Votre réponse :*__ 

__*Consigne*__ Tester avec la chaîne `nsi spécialité` en utilisant une liste par compréhension.

In [3]:
# Dans cette cellule, il faut vérifier la fonction trouvée sur des caractères.
liste_entiers = [ord(char) for char in "nsi spécialité"]
liste_entiers

[110, 115, 105, 32, 115, 112, 233, 99, 105, 97, 108, 105, 116, 233]

__*Consigne*__ Prenons comme clé de 8 bits un caractère, par exemple `!`. Utiliser la fonction `operation_bits` avec `!`, `n` et la fonction `XOR` (OU EXCLUSIF).

In [4]:
operation_bits(ord("!"), ord("n"), lambda x, y: x ^ y)

('0100001', '1101110', '1001111')

__*Consigne*__ Quel résultat en écriture hexadécimale obtient-on ?

In [7]:
hex(0b1001111)

Traceback (most recent call last):
  File "<input>", line 1, in <module>
TypeError: 'str' object cannot be interpreted as an integer


__*Question :*__ À l'aide de la page Web [Table unicode](https://unicode-table.com/fr/), déterminer de quel carctère il s'agit.

__*Votre réponse :*__

Chiffrons maintenant le message avec `xor` :

In [8]:
codage_exc = [ord(c) ^ ord("!") for c in "nsi spécialité"]
codage_exc

[79, 82, 72, 1, 82, 81, 200, 66, 72, 64, 77, 72, 85, 200]

__*Question :*__ Retransformons en chaîne de caractères la liste précédente. Quelle fonction/commande Python réalise cela ?


__*Votre réponse :*__ la commande `chr`

__*Consignes*__ Tester avec la liste d'entiers `liste_entiers` obtenue sur la transformation de `"nsi spécialité"` : retrouver la chaîne.

On utilisera une liste par compréhension et la méthode `join` qui agit sur les objets de la classe `str`.

In [15]:
liste_char = ([chr(e) for e in liste_entiers])
resultat = ""
for i in liste_char:
    resultat += i
resultat

'nsi spécialité'

__*Consigne*__ Appliquer enfin la transformation précédente à `codage_exc` pour voir le message chiffré.

In [19]:
resultat = "".join([chr(i) for i in codage_exc])
resultat

'ORH\x01RQÈBH@MHUÈ'

__*Question :*__ Comment expliquer `\x01` ?

__*Votre réponse :*__ 

__*Consigne*__ Coder maintenant avec le caractère `z` et observer.

In [None]:
codage_z = [...........]
message_chiffre = # à compléter
message_chiffre

__*Consigne*__ Déchiffrons ce message en réappliquant le `xor` sur la chaîne obtenue.

In [None]:
decodage_z = [.............]
message_decrypte = # à compléter
message_decrypte

**Bilan intermédiaire :** pour chiffrer un message, on peut utiliser le `XOR` (OU EXCLUSIF). On chiffre et décrypte le message de la même manière. Le message chiffré peut contenir alors des caractères non-imprimables, voire descaractères qui ne s'affichent pas car le glyphe est absent dans la police d'écriture utilisée.

__*Consignes*__ Améliorons notre chiffrement en ne chiffrant pas avec la même lettre mais avec un caractère différent à chaque fois.

Prenons toujours le message `nsi spécialité`, et choisissons la clé `lycée J.Moulin`.

Chiffrer et décrypter : on créera une unique fonction `xor` qui chiffre et décrypte avec deux arguments, la clé et le message.

On s'assurera dans la fonction que la clé et le message ont bien la même longueur.

In [None]:
message = "nsi spécialité"
cle = "lycée J.Moulin"

def xor(cle, message):
    # à compléter (plusieurs lignes)

message_chiffre = xor(cle, message)
message_chiffre

In [None]:
# on décrypte
xor(.............)

__*Consignes*__ La contrainte de la longueur est très handicapante. Elle peut être résolue de manières différentes : on choisit une clé et on la recopie autant de fois que nécessaire, ou alors on choisit une clé aléatoire de même longueur que le message. Dans le deuxième cas, il peut être difficile de transmettre la clé.

Prenons le premier cas avec le même message `nsi spécialité` et la clé `lycée`.
On doit donc générer la clé `lycéelycéelycé`.

Pour ce faire, on va boucler sur les caractères du message et on utilise le caractère correspondant de la clé : dans l'exemple précédent, en arrivant au 6e caractère du message, on doit choisir le caractère 0 de la clé, même chose en arrivant au 12e.

In [None]:
message = "nsi spécialité"
cle = "lycée"

def xor(cle, message):
    M = len(message)
    C = len(cle)
    #
    message_transforme = []
    for i in range(M):
        message_transforme.append(.............)
    #
    return # à compléter

message_chiffre = xor(cle, message)
xor(cle, message_chiffre)

On peut s'interroger sur l'efficacité d'une telle méthode, notamment pour des caractères sortant de l'ordinaire, typiquement au-delà de 255 dans la table unicode.

Si on revient à l'opération basique, prenons des caractères adjacents dans la table unicode de 913 à 937 (en décimal), ils correspondent aux caractères majuscules grecs.

__*Consigne*__ Afficher les écritures binaires des nombres entre 913 et 937.

In [None]:
for n in range(# à compléter
    # à compléter

__*Consigne*__ Coder ces caractères avec le `XOR` et la lettre `z`.

In [None]:
codage_z = # à compléter
message_chiffre = # à compléter
message_chiffre

__*Consigne*__ Afficher l'écriture binaire du message chiffré :

In [None]:
# à compléter

__*Question*__ Que remarquez-vous ?

__*Votre réponse :*__ 

**Une remarque importante :** Si on intercepte un message chiffré dont on connaît le message en clair, le chiffrement est alors cassé : il suffit d'appliquer le `XOR`.

__*Consigne*__ Reprenons le message en clair `nsi spécialité` et le message chiffré `\x02\n\nÉ\x16P£M$\x0e\x19\x05\x1d\x87`.

En appliquant la fonction `xor`, retrouver la clé utilisée.

In [None]:
message_clair = "nsi spécialité"
message_chiffre = "\x02\n\nÉ\x16P£M$\x0e\x19\x05\x1d\x87"
xor(.................)

Auteur : David COBAC

Licence CC-BY-NC-SA