# Chiffrement D√©terministe des Identifiants Patients

Ce script Python permet de chiffrer de mani√®re d√©terministe des portions sp√©cifiques d'identifiants patients contenus dans un fichier texte, en utilisant l'algorithme AES-256 en mode ECB avec padding PKCS7. Le chiffrement est d√©terministe car une m√™me entr√©e produira toujours le m√™me r√©sultat chiffr√© avec la m√™me cl√©.

## S√©curit√© de la Cl√© Secr√®te

- **Longueur minimale** : La phrase secr√®te doit contenir au moins 12 caract√®res
- **Complexit√©** : Utilisez un m√©lange de lettres (majuscules/minuscules), chiffres et caract√®res sp√©ciaux
- **Confidentialit√©** : Cette cl√© doit √™tre gard√©e secr√®te et ne pas √™tre partag√©e
- **Perte de cl√©** : Sans la cl√© exacte, il est impossible de d√©chiffrer les donn√©es

## Caract√©ristiques du Chiffrement

- **Format de sortie** : Base64 URL-safe (s√©curis√© pour les URLs/fichiers)
- **Longueur fixe** : Toute entr√©e chiffr√©e produit **exactement 24 caract√®res** en sortie
- **Marqueur de fin** : Les r√©sultats se terminent toujours par `==` (double √©gal)
    
    *Astuce de v√©rification* : Si vous avez un doute sur la longueur, comptez 24 caract√®res depuis la fin en incluant les `==`.

## 1. Importer les biblioth√®ques n√©cessaires

In [1]:
import pandas as pd
from cryptography.hazmat.primitives.ciphers import Cipher, algorithms, modes
from cryptography.hazmat.primitives import padding
from cryptography.hazmat.backends import default_backend
import base64
import hashlib
import os

## 2. Fonction 1 : G√©n√®re une cl√© AES 256 bits √† partir d'une phrase secr√®te

In [2]:
def generer_clef(personnalisation: str):
    cle_hash = hashlib.sha256(personnalisation.encode()).digest()
    return cle_hash[:32]  # Utiliser les 32 premiers octets pour AES-256

## 3. Fonction 2 : Chiffre l'identifiant avec padding PKCS7

In [3]:
def chiffrer_identifiant(cle, id_str):
    # Compter le nombre d'espaces √† la fin
    nb_espaces_fin = len(id_str) - len(id_str.rstrip())

    # Supprimer tous les espaces
    id_str_sans_espaces = id_str.replace(" ", "")
    
    # Convertir l'identifiant en bytes
    id_bytes = id_str_sans_espaces.encode()

    # Appliquer le padding PKCS7 pour s'assurer que la longueur est multiple de 16
    padder = padding.PKCS7(128).padder()
    id_bytes_padded = padder.update(id_bytes) + padder.finalize()

    # Chiffrement AES-ECB
    cipher = Cipher(algorithms.AES(cle), modes.ECB(), backend=default_backend())
    encryptor = cipher.encryptor()
    encrypted = encryptor.update(id_bytes_padded) + encryptor.finalize()

    # Encodage base64
    encrypted_b64 = base64.urlsafe_b64encode(encrypted).decode()

    # Ajouter les espaces √† la fin
    return encrypted_b64 + (" " * nb_espaces_fin)

## 4. Fonction 3 : La fonction principale

In [4]:
# Fonction principale
def main():
    print("=== Chiffrement D√©terministe des Identifiants Patients ===")

    # Cl√© secr√®te
    phrase_secrete = input("Entrez votre cl√© secr√®te complexe (au moins 12 caract√®res, m√©lange de lettres/chiffres) : ")
    if len(phrase_secrete) < 12:
        print("‚ùå Cl√© trop courte. Utilisez au moins 12 caract√®res.")
        return
    cle = generer_clef(phrase_secrete)

    # R√©pertoires
    repertoire_entree = input("Entrez le r√©pertoire contenant les fichiers √† chiffrer : ").strip()
    repertoire_sortie = input("Entrez le r√©pertoire o√π sauvegarder les fichiers chiffr√©s : ").strip()
    numero_finess = input("Entrez le num√©ro de FINESS : ").strip()
    annees = [2024, 2023, 2022]

    # Plages √† chiffrer
    plages = [(0, 20), (40, 44)]

    fichiers_cryptes = []
    fichiers_non_trouves = []

    def chiffrer_ligne(ligne):
        ligne_mod = ligne
        offset = 0
        for debut, fin in plages:
            vrai_debut = debut + offset
            vrai_fin = fin + offset
            if vrai_fin > len(ligne_mod):
                continue
            a_chiffrer = ligne_mod[vrai_debut:vrai_fin]
            chiffre = chiffrer_identifiant(cle, a_chiffrer)
            ligne_mod = ligne_mod[:vrai_debut] + chiffre + ligne_mod[vrai_fin:]
            offset += len(chiffre) - (fin - debut)
        return ligne_mod

    for annee in annees:
        nom_fichier_entree = f"{numero_finess}.{annee}.12.tra.raa"
        chemin_entree = os.path.join(repertoire_entree, nom_fichier_entree)

        if not os.path.exists(chemin_entree):
            fichiers_non_trouves.append(nom_fichier_entree)
            continue

        try:
            data = pd.read_csv(chemin_entree, names=["colonnes"])
        except Exception as e:
            print(f"‚ùå Erreur de lecture {nom_fichier_entree} : {e}")
            fichiers_non_trouves.append(nom_fichier_entree)
            continue

        data["colonnes"] = data["colonnes"].apply(chiffrer_ligne)

        nom_fichier_sortie = f"TRA.RAA.{numero_finess}.{annee}.crypte.txt"
        chemin_sortie = os.path.join(repertoire_sortie, nom_fichier_sortie)

        try:
            data.to_csv(chemin_sortie, index=False, header=False)
            fichiers_cryptes.append(nom_fichier_sortie)
        except Exception as e:
            print(f"‚ùå Erreur lors de la sauvegarde de {nom_fichier_sortie} : {e}")
            fichiers_non_trouves.append(nom_fichier_entree)

    # R√©sum√© final
    print("\n=== R√©sum√© du traitement ===")
    if fichiers_cryptes:
        print("‚úÖ Fichiers chiffr√©s avec succ√®s :")
        for f in fichiers_cryptes:
            print("  -", f)
    if fichiers_non_trouves:
        print("‚ùå Fichiers non trouv√©s ou en erreur :")
        for f in fichiers_non_trouves:
            print("  -", f)

## Ex√©cute ce bloc pour commencer

In [5]:
if __name__ == "__main__":
    main()

=== Chiffrement D√©terministe des Identifiants Patients ===


Entrez votre cl√© secr√®te complexe (au moins 12 caract√®res, m√©lange de lettres/chiffres) :  xavierboucher
Entrez le r√©pertoire contenant les fichiers √† chiffrer :  C:\Users\Youba\Documents\
Entrez le r√©pertoire o√π sauvegarder les fichiers chiffr√©s :  C:\Users\Youba\Documents\
Entrez le num√©ro de FINESS :  20001



=== R√©sum√© du traitement ===
‚ùå Fichiers non trouv√©s ou en erreur :
  - 20001.2024.12.tra.raa
  - 20001.2023.12.tra.raa
  - 20001.2022.12.tra.raa


### Voir le r√©pertoire de sauvegarde des fichiers crypt√©s üòä

***Pr√©par√© par : Lekehal Hammada***

***√âquipe : I4S***

***20/04/2025***