## Devoir du 17/10/25 : Chiffrement par substitution


Ce script met en œuvre un algorithme inspiré du chiffrement par substitution, une méthode classique de cryptographie. À partir d’une clé secrète, on génère un alphabet de substitution unique : chaque lettre du texte est remplacée par une autre selon cet alphabet, rendant le message illisible pour toute personne qui ne possède pas la clé.


---



### Partie 1 : Chiffrement
Pour ce devoir, nous utiliserons le texte extrait du lien suivant : https://ecogestion.univ-paris13.fr/parcours-big-data-analyse-et-business-intelligence/
.

Ce texte sera chiffré à l’aide de la clé "palmistelorie". L’algorithme préserve les espaces, la ponctuation et normalise les lettres accentuées, ce qui permet de chiffrer un texte réaliste tout en conservant sa structure et sa lisibilité.

In [22]:
import unicodedata

### CHIFFREMENT PAR SUBSTITUTION

# Suppression des accents:
def trtmt_accents(texte):
    return ''.join(
        c for c in unicodedata.normalize('NFD', texte)
        if unicodedata.category(c) != 'Mn'
    )

# Construction de l'alphabet chiffrant ( à partir de la clé secrète ):

def alphabet_chiffrant(cle):
    cle = trtmt_accents(cle).upper()
    alphabet_cle = []
    for c in cle:
        if c.isalpha() and c not in alphabet_cle:
            alphabet_cle.append(c)

    alphabet_normal = [chr(i) for i in range(ord('A'), ord('Z') + 1)]
    for c in alphabet_normal:
        if c not in alphabet_cle:
            alphabet_cle.append(c)

    return ''.join(alphabet_cle)

# Création de la table de correspondance

def table_substitution(alphabet_chiffrant):
    alphabet_normal = [chr(i) for i in range(ord('A'), ord('Z') + 1)]
    return {alphabet_normal[i]: alphabet_chiffrant[i] for i in range(26)}

def chiffrement(texte, table):
    texte = trtmt_accents(texte)
    resultat = ""
    for ch in texte:
        if ch.isalpha():
            code = table[ch.upper()]
            resultat += code if ch.isupper() else code.lower()
        else:
            resultat += ch
    return resultat

def dechiffrement(texte_chiffre, table):
    table_inverse = {v: k for k, v in table.items()}
    resultat = ""
    for ch in texte_chiffre:
        if ch.isalpha():
            code = table_inverse[ch.upper()]
            resultat += code if ch.isupper() else code.lower()
        else:
            resultat += ch
    return resultat

### Application :

cle = "palmistelorie"
texte_clair = """ ORGANISATION
L’année de M1 comprend deux semestres composés de 4 UE fondamentales pour le premier et de 5 UE de spécialisation au deuxième semestre. Les étudiants en parcours Big Data suivent des UE spécifiques. En M2, l’encadrement pédagogique est assuré par des enseignants universitaires et par des professionnels. La réalisation de nombreux dossiers et travaux en groupe permettent aux étudiants d’affiner leurs compétences (écrit, présentation orale, synthèse, projet…).

En M2, les cours se déroulent de mi-septembre à fin février, la deuxième partie de l’année est consacrée au stage (3 mois minimum, 6 mois maximum).

OBJECTIFS PEDAGOGIQUES
« Au-delà de l’aspect statistique, il faudra être capable de visualiser, communiquer et utiliser les données. Savoir accéder à, comprendre et transmettre les conclusions tirées des données: Ces talents vont être extrêmement importants » (Hal Varian, chef économiste de Google)

La prolifération des objets connectés engendre une immense quantité de données structurées ou non et la tendance va se poursuivre. L’objectif du master est de former les étudiants aux métiers des données massives (big data) et de leur traitement / analyse. Répondant aux attentes des professionnels, le master propose aux étudiants un enseignement marquant autour notamment des outils liés aux big data (statistiques, outils d’analyses, machine learning, business intelligence….) et de l’économétrie.

Les étudiants seront capables d’analyser ces données massives, afin de dégager des indicateurs utiles aux décideurs et de permettre une prise de décision efficace par d’autres services de l’entreprise. Il s’agit donc de former des personnes qui seront à l’interface entre les scientifiques des données massives (data scientists) et la prise de décisions stratégiques (marketing, production….). Ils joueront donc un rôle transverse dans l’entreprise.

PRE-REQUIS
Le titulaire aura une bonne maîtrise de l’outil rédactionnel. Il doit aussi manier efficacement les outils informatiques et de présentation orale (type Power Point). La maîtrise de l’anglais est nécessaire. Des connaissances de base en économétrie sont requises.

les compétences développées :
• Analyser et décrypter les données massives à l’aide d’outils statistiques et économétriques pour proposer une analyse stratégique.
• Gérer des grands volumes de données
• Acquérir la capacité de mise en forme des données et présenter les données via des formats accessibles
• Interagir avec les scientifiques des données via la connaissance des problématiques et enjeux de base liés au big data.
• Maîtriser les logiciels de base du big data.
• Comprendre les architectures informatiques et contraintes des data scientists
• Comprendre les principaux algorithmes utilisés dans le big data.
• Etre capable de travailler en équipe
• Organisation, rigueur, capacité rédactionnelle
• Connaissance de l’écosystème et des principaux acteurs qui produisent / gèrent / travaillent la data

PUBLIC VISE
– Etudiants venant d’un parcours économie ou gestion en M1
– Etudiants venant d’un parcours économie ou gestion ou d’un parcours data en M2

MOBILITE INTERNATIONALE
Echange possible au cours de l’année de M1 sous réserve d’accord du responsable sur les cours suivis à l’étranger.

Le stage de M2 peut être effectué à l’étranger.

AUTRES PARTENAIRES
Nous travaillons avec les entreprises Akabi et Alteryx qui proposent des interventions dans l’année. Nous avons également mis en place un partenariat avec MyJobGlasses afin d’améliorer l’insertion des étudiants."""


AC = alphabet_chiffrant(cle)
table = table_substitution(AC)

texte_c = chiffrement(texte_clair, table)
texte_d = dechiffrement(texte_c, table)

print(f"Clé : {cle}")
print(f"Alphabet chiffrant : {AC}\n")

print("Texte chiffré : ", texte_c)
print(" \n Texte déchiffré : \n", texte_d)


Clé : palmistelorie
Alphabet chiffrant : PALMISTEORBCDFGHJKNQUVWXYZ

Texte chiffré :   GKTPFONPQOGF 
C’pffii mi D1 lgdhkifm miux nidinqkin lgdhgnin mi 4 UI sgfmpdifqpcin hguk ci hkidoik iq mi 5 UI mi nhilopconpqogf pu miuxoidi nidinqki. Cin iqumopfqn if hpklgukn Aot Mpqp nuovifq min UI nhilosojuin. If D2, c’iflpmkidifq himptgtojui inq pnnuki hpk min ifniotfpfqn ufoviknoqpokin iq hpk min hkgsinnogfficn. Cp kipconpqogf mi fgdakiux mgnnoikn iq qkpvpux if tkguhi hikdiqqifq pux iqumopfqn m’pssofik ciukn lgdhiqiflin (ilkoq, hkinifqpqogf gkpci, nyfqeini, hkgriq…).

If D2, cin lgukn ni mikgucifq mi do-nihqidaki p sof sivkoik, cp miuxoidi hpkqoi mi c’pffii inq lgfnplkii pu nqpti (3 dgon dofodud, 6 dgon dpxodud).

GARILQOSN HIMPTGTOJUIN
« Pu-micp mi c’pnhilq nqpqonqojui, oc spumkp iqki lphpaci mi vonupconik, lgddufojuik iq uqoconik cin mgffiin. Npvgok pllimik p, lgdhkifmki iq qkpfndiqqki cin lgflcunogfn qokiin min mgffiin: Lin qpcifqn vgfq iqki ixqkididifq odhgkqpfqn » (Epc Vpkopf, leis ilgfgdon

### Partie 2: Déchiffrement par analyse séquentielle

La seconde partie du script met en œuvre une analyse fréquentielle, une méthode de cryptanalyse permettant de déchiffrer un texte sans connaître la clé. Cette approche repose sur l’observation que certaines lettres apparaissent plus souvent que d’autres dans la langue française. En étudiant la fréquence des lettres dans le texte chiffré et en les comparant aux fréquences typiques du français, le script établit une correspondance statistique entre lettres chiffrées et lettres probables du texte original. Cette technique met en évidence qu’il est possible de retrouver une grande partie du contenu initial sans disposer de la clé secrète, illustrant ainsi à la fois la puissance de l’analyse fréquentielle en cryptanalyse et la vulnérabilité du chiffrement par substitution face à ce type d’attaque.

In [25]:
from collections import Counter

### ANALYSE FREQUENTIELLE

# Compte la fréquence des lettres dans le texte
def analyse_frequence(texte):

    texte = texte.upper()
    lettres = [c for c in texte if c.isalpha()]
    total = len(lettres)
    compteur = Counter(lettres)
    freqs = {lettre: (compteur[lettre] / total) * 100 for lettre in compteur}
    return dict(sorted(freqs.items(), key=lambda x: x[1], reverse=True))

 #Déchiffrement en se basant sur les fréquences du français
def dechiffrement_frequentiel(texte_chiffre):

    # Fréquence moyenne des lettres françaises
    freq_fr = list("ESAITNRULODCMPVQGBFJHXZYKW")

    # Fréquences dans le texte chiffré
    freqs = analyse_frequence(texte_chiffre)
    lettres_chiffrees = list(freqs.keys())

    # Création d'une correspondance approximative
    mapping = {}
    for i, l in enumerate(lettres_chiffrees):
        if i < len(freq_fr):
            mapping[l] = freq_fr[i]

    # Déchiffrement approximatif
    resultat = ""
    for ch in texte_chiffre:
        if ch.upper() in mapping:
            subst = mapping[ch.upper()]
            resultat += subst if ch.isupper() else subst.lower()
        else:
            resultat += ch
    return resultat, mapping


# Application de l'analyse


# Utilise le texte chiffré déjà obtenu précédemment : texte_c
freqs = analyse_frequence(texte_c)

print("Fréquences des lettres dans le texte chiffré :")
for l, f in list(freqs.items())[:10]:
    print(f"{l} : {f:.2f}%")

texte_estime, mapping_estime = dechiffrement_frequentiel(texte_c)

print("\nCorrespondances estimées (lettre_chiffrée → lettre_probable) :")
print(mapping_estime)

print("\nExtrait du texte déchiffré (approximatif) :")
print(texte_estime)


Fréquences des lettres dans le texte chiffré :
I : 17.55%
N : 10.02%
P : 8.15%
F : 7.94%
Q : 7.66%
O : 7.39%
K : 6.69%
G : 5.24%
M : 4.72%
U : 4.54%

Correspondances estimées (lettre_chiffrée → lettre_probable) :
{'I': 'E', 'N': 'S', 'P': 'A', 'F': 'I', 'Q': 'T', 'O': 'N', 'K': 'R', 'G': 'U', 'M': 'L', 'U': 'O', 'C': 'D', 'L': 'C', 'D': 'M', 'H': 'P', 'T': 'V', 'V': 'Q', 'S': 'G', 'A': 'B', 'J': 'F', 'X': 'J', 'Y': 'H', 'E': 'X', 'R': 'Z', 'B': 'Y', 'W': 'K'}

Extrait du texte déchiffré (approximatif) :
 URVAINSATNUI 
D’aiiee le M1 cumpreil leoj semestres cumpuses le 4 OE guilameitades puor de premner et le 5 OE le specnadnsatnui ao leojneme semestre. Des etolnaits ei parcuors Bnv Lata sonqeit les OE specngnfoes. Ei M2, d’eicalremeit pelavuvnfoe est assore par les eisenviaits oinqersntanres et par les prugessnuiieds. Da readnsatnui le iumbreoj lussners et traqaoj ei vruope permetteit aoj etolnaits l’aggnier deors cumpeteices (ecrnt, preseitatnui urade, shitxese, pruzet…).

Ei M2, des c