TANG Kévin p1501263

# TP2 Cryptographie & Sécurité

09/05/2023

## Calcul de hash

**Question 1.1 que permet de vérifier le fichier openssl-3.1.0.tar.gz.sha256 ?**

Un fichier .sha256 permet de vérifier l'intégrité du fichier openssl-3.1.0.tar.gz, il contient un hash de 256 bits qui est une somme de contrôle obtenue à partir d'un calcul cryptographique pour s'assurer que le fichier n’a pas été altéré ou corrompu pendant le téléchargement.

**Question 1.2 donner la commande utilisant sha256sum pour faire la vérification précédente.**

Commande : sha256sum -c openssl-3.1.0.tar.gz.sha256

Cela permet de calculer la somme de contrôle du fichier openssl-3.1.0.tar.gz et la compare avec celle du fichier openssl-3.1.0.tar.gz.sha256

**Question 1.3 donner la commande utilisant openssl pour faire la même vérification.**

Commande : openssl dgst -sha256 -verify openssl-3.1.0.tar.gz.sha256 -signature openssl-3.1.0.tar.gz

In [None]:
import hashlib

def get_sha256_hashlib(filename, buffer_size=2**13):
    """See https://www.pythonmorsels.com/reading-binary-files-in-python/"""
    file_hash = hashlib.sha256()
    with open(filename, mode="rb") as file:
        while chunk := file.read(buffer_size):
            file_hash.update(chunk)
    return file_hash.hexdigest()

**Question 1.4 compléter le script précédent pour vérifier openssl-3.1.0.tar.gz, c’est-à-dire, faire en Python ce qui a été fait précédemment en ligne de commande.**



In [None]:
import hashlib

def get_sha256_hashlib(filename, buffer_size=2**13):
    """See https://www.pythonmorsels.com/reading-binary-files-in-python/"""
    file_hash = hashlib.sha256()
    with open(filename, mode="rb") as file:
        while chunk := file.read(buffer_size):
            file_hash.update(chunk)
    return file_hash.hexdigest()


# Nom du fichier source
source_file = "openssl-3.1.0.tar.gz"
# Nom du fichier de somme de contrôle
checksum_file = "openssl-3.1.0.tar.gz.sha256"

# Calcul de la somme de contrôle SHA-256 du fichier source
source_checksum = get_sha256_hashlib(source_file)

# Lecture de la somme de contrôle fournie dans le fichier .sha256
with open(checksum_file, "r") as file:
    provided_checksum = file.read().strip()

# Comparaison des sommes de contrôle
if source_checksum == provided_checksum:
    print(f"La vérification de la somme de contrôle a réussi pour le fichier {source_file}")
else:
    print(f"La vérification de la somme de contrôle a échoué pour le fichier {source_file}")

**Question 1.5 implémenter une fonction get_sha256_cryptodome() qui fait la même chose que que get_sha256_hashlib() mais utilisant Crypto.Hash**



In [None]:
from Crypto.Hash import SHA256

def get_sha256_cryptodome(filename, buffer_size=2**13):
    """Calculate the SHA-256 checksum of a file using pycryptodome's Crypto.Hash"""
    file_hash = SHA256.new()
    with open(filename, mode="rb") as file:
        while chunk := file.read(buffer_size):
            file_hash.update(chunk)
    return file_hash.hexdigest()

**Question (bonus) 1.6 une nouvelle fonction fonction Python 3.11 permet de remplacer get_sha256_hashlib(). L’identifier et si possible, la tester.**

En Python 3.11, une nouvelle fonction hashlib.blake3 a été ajoutée à la bibliothèque hashlib pour calculer la somme de contrôle BLAKE3 d’un fichier. Cette fonction peut être utilisée pour remplacer get_sha256_hashlib.

In [None]:
import hashlib

def get_blake3_hashlib(filename, buffer_size=2**13):
    """Calculate the BLAKE3 checksum of a file using hashlib.blake3"""
    file_hash = hashlib.blake3()
    with open(filename, mode="rb") as file:
        while chunk := file.read(buffer_size):
            file_hash.update(chunk)
    return file_hash.hexdigest()

**On considère les deux versions suivantes logo v1 et logo v2 du logo de l’UCBL.**

**Question 1.7 comparer en binaire les deux fichiers, à quels octets different-ils ? On peut utiliser l’outil cmp par exemple.**

D'après la commande cmp, les deux fichiers diffèrent au "byte 59722, line 216".

**Question 1.8 calculer la somme MD5 de ces deux fichiers avec md5sum, que constatez-vous ? Pourquoi le résultat est différent avec sha256sum**

Les deux fichiers ont un seul byte différent.
Les sommes obtenues par sha256sum sont bien différentes mais celles obtenues avec md5sum sont identiques. Une collision s'est produite.

**Question 1.9 pourquoi visuellement ces fichiers apparaissent-ils comme identiques ? On donne aussi le logo original pour vous aider.**

Il est possible que deux fichiers image différents apparaissent visuellement identiques si la différence entre les deux fichiers peut être dans les métadonnées (date, heure, auteur...) ou si la différence est minime comme un seul pixel ou une légère variation de couleur.

**Question 1.10 expliquer pourquoi il est possible de générer de tels fichiers.**

Il est possible de générer de tels fichiers en les compressant.

**Question 1.11 donner des exemples problèmes de sécurité que cela peut poser.**

Cela peut provoquer divers problèmes :     
*   Falsification de contenu : Un attaquant peut créer un fichier malveillant qui a la même somme de contrôle MD5 qu’un fichier légitime. Si le système de vérification utilise uniquement MD5 pour vérifier l’intégrité des fichiers, l’attaquant peut remplacer le fichier légitime par le fichier malveillant sans être détecté
*   Contournement des contrôles de sécurité : Un attaquant peut utiliser des techniques d’attaque pour générer une collision MD5 et créer un fichier malveillant qui a la même somme de contrôle qu’un fichier légitime.
*   Attaques de phishing: Un attaquant peut utiliser des techniques d’attaque pour générer une collision MD5 et créer un site web malveillant qui a la même somme de contrôle que celle d’un site web légitime.


## Chiffrement à clef publique RSA

In [None]:
from Crypto.PublicKey import RSA

key = RSA.generate(2048)
secret_key = key.export_key(format="PEM", pkcs=8)
public_key = key.publickey().export_key()

with open("rsa_key.pem", "wb") as file_out:
    file_out.write(secret_key)

with open("rsa_key.pub", "wb") as file_out:
    file_out.write(public_key)

**Question 2.1 expliquer ce que fait le script précédent.**

Ce script génère une paire de clés RSA de 2048 bits et les enregistre dans des fichiers.

**Question 2.2 que contiennent les objets secret_key et public_key du script ? Consulter la documentation ou le code source.**

La clé privée est exportée au format PEM en utilisant le standard PKCS#8, ce qui signifie que la variable secret_key contient une chaîne d’octets représentant la clé privée encodée en base64 et entourée des balises -----BEGIN PRIVATE KEY----- et -----END PRIVATE KEY-----.

La clé publique est également exportée au format PEM, ce qui signifie que la variable public_key contient une chaîne d’octets représentant la clé publique encodée en base64 et entourée des balises -----BEGIN PUBLIC KEY----- et -----END PUBLIC KEY-----.

**On donne les nombres p = 559212886079726860470346917343663228747 et q = 155668656214909251471186475194459383417 et un exposant public e = 2 ** 16 + 1**

**Question 2.3 calculer en Python n = p * q, le nombre de bits de n, p et q. Ces tailles sont-elles satisfaisantes en 2023 ?**

n = p * q
  = 559212886079726860470346917343663228747 * 155668656214909251471186475194459383417
  = 87004129986261235108233470355673480478499

Nombre de bits de p: 109

Nombre de bits de q: 107

Nombre de bits de n: 216

En 2023, une taille de clé RSA d’au moins 2048 bits est recommandée pour une sécurité suffisante. Dans votre exemple, n a une taille de 216 bits, ce qui est inférieur à la recommandation minimale et ne serait donc pas considéré comme satisfaisant en termes de sécurité.

**Question 2.4 vérifier avec PyCryptodome que p et q sont (très probablement) premiers et que e n’est pas un facteur de (p - 1) * (q - 1).**



In [None]:
from Crypto.Util.number import isPrime

p = 559212886079726860470346917343663228747
q = 155668656214909251471186475194459383417
e = 2 ** 16 + 1

# Vérification de la primalité de p et q
p_is_prime = isPrime(p)
q_is_prime = isPrime(q)

print(f"p est premier: {p_is_prime}")
print(f"q est premier: {q_is_prime}")

# Vérification si e est un facteur de (p - 1) * (q - 1)
phi = (p - 1) * (q - 1)
e_is_factor = phi % e == 0

print(f"e est un facteur de (p - 1) * (q - 1): {e_is_factor}")


p est premier: True

q est premier: True

e est un facteur de (p - 1) * (q - 1): False


**Question 2.5 avec RSA.construct() construire la clef secrète ayant les paramètres précédents et l’enregistrer dans un fichier rsa_key.pem.**

In [None]:
from Crypto.PublicKey import RSA

p = 559212886079726860470346917343663228747
q = 155668656214909251471186475194459383417
e = 2 ** 16 + 1

# Calcul de n et d
n = p * q
phi = (p - 1) * (q - 1)
d = pow(e, -1, phi)

# Construction de la clé privée RSA
key = RSA.construct((n, e, d))

# Exportation de la clé privée au format PEM
secret_key = key.export_key(format="PEM", pkcs=8)

# Enregistrement de la clé privée dans un fichier
with open("rsa_key.pem", "wb") as file_out:
    file_out.write(secret_key)


**Question 2.6 en reprenant l’exemple de la documentation avec le schema PKCS1_v1_5, chiffrer un message avec la clef en enregistrer le message chiffré dans un fichier binaire secret.enc.**

In [None]:
from Crypto.Cipher import PKCS1_v1_5
from Crypto.PublicKey import RSA

# Lecture de la clé publique à partir d'un fichier
with open("rsa_key.pub", "rb") as file_in:
    public_key = RSA.import_key(file_in.read())

# Création d'un objet de chiffrement RSA avec PKCS1 v1.5
cipher = PKCS1_v1_5.new(public_key)

# Message à chiffrer
message = "Un message secret"

# Chiffrement du message
ciphertext = cipher.encrypt(message)

# Enregistrement du message chiffré dans un fichier binaire
with open("secret.enc", "wb") as file_out:
    file_out.write(ciphertext)


**Question 2.7 PKCS1_v1_5 pose des problèmes fondamentaux. Quel est le schéma recommandé par la documentation de PyCryptodome ? Donner le lien vers la documentation.**

Le schéma PKCS1 v1.5 est considéré comme obsolète et peut poser des problèmes de sécurité. La documentation de pycryptodome recommande d’utiliser le schéma OAEP (Optimal Asymmetric Encryption Padding) pour le chiffrement RSA. OAEP offre une sécurité prouvée contre les attaques de chiffré choisi et est recommandé pour toutes les nouvelles applications.

Voici un lien vers la documentation de pycryptodome qui décrit l’utilisation du schéma OAEP pour le chiffrement RSA: https://www.pycryptodome.org/en/latest/src/cipher/oaep.html