# Chapitre 1 : Histoire de la Cryptographie

**Cours de S√©curit√© Informatique** - Partie 1 : Cryptographie √† Cl√© Secr√®te

---

## Objectifs

Ce notebook explore l'√©volution historique de la cryptographie, des chiffres classiques √† la cryptographie moderne :

1. **Chiffres de substitution** : C√©sar, affine
2. **Chiffres polyalphab√©tiques** : Vigen√®re
3. **Cryptanalyse** : Analyse de fr√©quence, attaque Kasiski
4. **Transition vers la cryptographie moderne**

---

In [None]:
import string
from collections import Counter
import matplotlib.pyplot as plt
import numpy as np

## 1. Chiffre de C√©sar

Le **chiffre de C√©sar** est l'un des plus anciens chiffres connus. Il consiste √† d√©caler chaque lettre de l'alphabet d'un nombre fixe de positions.

### D√©finition math√©matique

Soit $k \in \{0, 1, \ldots, 25\}$ la cl√© (d√©calage) :

$$
\text{Enc}_k(m) = (m + k) \mod 26
$$

$$
\text{Dec}_k(c) = (c - k) \mod 26
$$

In [None]:
def cesar_encrypt(plaintext: str, shift: int) -> str:
    """
    Chiffrement C√©sar.
    
    Args:
        plaintext: Texte en clair (lettres majuscules)
        shift: D√©calage (0-25)
    
    Returns:
        Texte chiffr√©
    """
    result = []
    for char in plaintext.upper():
        if char.isalpha():
            # Convertir A-Z en 0-25
            num = ord(char) - ord('A')
            # Appliquer le d√©calage
            encrypted_num = (num + shift) % 26
            # Reconvertir en lettre
            encrypted_char = chr(encrypted_num + ord('A'))
            result.append(encrypted_char)
        else:
            result.append(char)
    return ''.join(result)

def cesar_decrypt(ciphertext: str, shift: int) -> str:
    """D√©chiffrement C√©sar."""
    return cesar_encrypt(ciphertext, -shift)

In [None]:
# Exemple
plaintext = "HELLO WORLD"
shift = 3

ciphertext = cesar_encrypt(plaintext, shift)
decrypted = cesar_decrypt(ciphertext, shift)

print(f"Plaintext:  {plaintext}")
print(f"Ciphertext: {ciphertext}")
print(f"Decrypted:  {decrypted}")

### ‚ö†Ô∏è S√©curit√© du chiffre de C√©sar

**Probl√®me fondamental** : L'espace de cl√©s est **tr√®s petit** (seulement 26 possibilit√©s).

**Attaque par force brute** : Essayer toutes les cl√©s possibles !

In [None]:
def cesar_brute_force(ciphertext: str):
    """Attaque par force brute sur le chiffre de C√©sar."""
    print("üîì Attaque par force brute:\n")
    for shift in range(26):
        decrypted = cesar_decrypt(ciphertext, shift)
        print(f"Shift {shift:2d}: {decrypted}")

# Exemple d'attaque
secret_message = "KHOOR ZRUOG"
print(f"Message chiffr√©: {secret_message}\n")
cesar_brute_force(secret_message)

## 2. Chiffre de Vigen√®re

Le **chiffre de Vigen√®re** (16√®me si√®cle) am√©liore C√©sar en utilisant une **cl√© r√©p√©t√©e** de plusieurs lettres.

### Fonctionnement

Soit $k = k_0 k_1 \ldots k_{l-1}$ la cl√© de longueur $l$ :

$$
c_i = (m_i + k_{i \bmod l}) \mod 26
$$

In [None]:
def vigenere_encrypt(plaintext: str, key: str) -> str:
    """
    Chiffrement Vigen√®re.
    
    Args:
        plaintext: Texte en clair
        key: Cl√© (mot)
    
    Returns:
        Texte chiffr√©
    """
    plaintext = plaintext.upper()
    key = key.upper()
    result = []
    key_index = 0
    
    for char in plaintext:
        if char.isalpha():
            # Position dans l'alphabet
            p = ord(char) - ord('A')
            k = ord(key[key_index % len(key)]) - ord('A')
            # Chiffrement
            c = (p + k) % 26
            result.append(chr(c + ord('A')))
            key_index += 1
        else:
            result.append(char)
    
    return ''.join(result)

def vigenere_decrypt(ciphertext: str, key: str) -> str:
    """D√©chiffrement Vigen√®re."""
    ciphertext = ciphertext.upper()
    key = key.upper()
    result = []
    key_index = 0
    
    for char in ciphertext:
        if char.isalpha():
            c = ord(char) - ord('A')
            k = ord(key[key_index % len(key)]) - ord('A')
            p = (c - k) % 26
            result.append(chr(p + ord('A')))
            key_index += 1
        else:
            result.append(char)
    
    return ''.join(result)

In [None]:
# Exemple
plaintext = "ATTACK AT DAWN"
key = "SECRET"

ciphertext = vigenere_encrypt(plaintext, key)
decrypted = vigenere_decrypt(ciphertext, key)

print(f"Plaintext:  {plaintext}")
print(f"Key:        {key}")
print(f"Ciphertext: {ciphertext}")
print(f"Decrypted:  {decrypted}")

## 3. Cryptanalyse : Analyse de Fr√©quence

L'**analyse de fr√©quence** est une technique qui exploite le fait que dans une langue donn√©e, certaines lettres apparaissent plus fr√©quemment que d'autres.

### Fr√©quences en fran√ßais

Les lettres les plus fr√©quentes en fran√ßais sont : **E, A, S, I, N, T, R**

In [None]:
def frequency_analysis(text: str) -> dict:
    """Analyse de fr√©quence des lettres."""
    # Garder seulement les lettres
    text = ''.join(c for c in text.upper() if c.isalpha())
    
    # Compter les occurrences
    counter = Counter(text)
    total = sum(counter.values())
    
    # Calculer les fr√©quences en %
    frequencies = {char: (count / total) * 100 
                   for char, count in counter.items()}
    
    return dict(sorted(frequencies.items(), key=lambda x: x[1], reverse=True))

def plot_frequencies(frequencies: dict, title: str = "Fr√©quences"):
    """Visualisation des fr√©quences."""
    plt.figure(figsize=(12, 4))
    chars = list(frequencies.keys())
    freqs = list(frequencies.values())
    
    plt.bar(chars, freqs, color='steelblue')
    plt.xlabel('Lettre')
    plt.ylabel('Fr√©quence (%)')
    plt.title(title)
    plt.grid(axis='y', alpha=0.3)
    plt.show()

In [None]:
# Fr√©quences th√©oriques du fran√ßais
french_freq = {
    'E': 14.7, 'A': 7.6, 'S': 7.9, 'I': 7.5, 'N': 7.1, 'T': 7.2,
    'R': 6.6, 'U': 6.3, 'L': 5.5, 'O': 5.4, 'D': 3.7, 'C': 3.3,
    'P': 3.0, 'M': 3.0, 'V': 1.6, 'Q': 1.3, 'F': 1.1, 'B': 0.9,
    'G': 0.9, 'H': 0.7, 'J': 0.5, 'X': 0.4, 'Y': 0.3, 'Z': 0.1, 'K': 0.0, 'W': 0.0
}

plot_frequencies(french_freq, "Fr√©quences th√©oriques (fran√ßais)")

In [None]:
# Analyse d'un texte chiffr√© avec C√©sar
plaintext = """LA CRYPTOGRAPHIE EST UNE SCIENCE FASCINANTE QUI PERMET 
DE PROTEGER LES COMMUNICATIONS ET LES DONNEES"""

ciphertext = cesar_encrypt(plaintext, 7)

print("Texte chiffr√©:")
print(ciphertext)
print("\nAnalyse de fr√©quence:")

freq = frequency_analysis(ciphertext)
plot_frequencies(freq, "Fr√©quences du texte chiffr√© (C√©sar)")

# Afficher les 5 lettres les plus fr√©quentes
print("\nTop 5 lettres les plus fr√©quentes:")
for i, (char, f) in enumerate(list(freq.items())[:5], 1):
    print(f"{i}. {char}: {f:.1f}%")

### üí° D√©duction de la cl√©

Si la lettre la plus fr√©quente dans le ciphertext est **L**, et que **E** est la plus fr√©quente en fran√ßais, alors :

$$
k = (L - E) \mod 26 = (11 - 4) \mod 26 = 7
$$

## 4. Attaque sur Vigen√®re : M√©thode de Kasiski

La **m√©thode de Kasiski** (1863) permet de casser Vigen√®re en trouvant la **longueur de la cl√©**.

### Principe

1. Rechercher les **r√©p√©titions** dans le ciphertext
2. Calculer les **distances** entre ces r√©p√©titions
3. Le **PGCD** de ces distances r√©v√®le probablement la longueur de la cl√©
4. Une fois la longueur connue, appliquer l'analyse de fr√©quence sur chaque "sous-chiffre" (C√©sar)

In [None]:
import math
from collections import defaultdict

def find_repeats(ciphertext: str, min_length: int = 3):
    """Trouve les s√©quences r√©p√©t√©es dans le ciphertext."""
    ciphertext = ''.join(c for c in ciphertext.upper() if c.isalpha())
    repeats = defaultdict(list)
    
    # Chercher toutes les s√©quences de longueur >= min_length
    for length in range(min_length, min(len(ciphertext) // 2, 10)):
        for i in range(len(ciphertext) - length + 1):
            sequence = ciphertext[i:i+length]
            # Chercher cette s√©quence ailleurs
            for j in range(i + length, len(ciphertext) - length + 1):
                if ciphertext[j:j+length] == sequence:
                    distance = j - i
                    repeats[sequence].append(distance)
    
    return {seq: dist for seq, dist in repeats.items() if len(dist) > 0}

def kasiski_examination(ciphertext: str):
    """M√©thode de Kasiski pour trouver la longueur de la cl√©."""
    repeats = find_repeats(ciphertext)
    
    print("S√©quences r√©p√©t√©es trouv√©es:")
    all_distances = []
    for seq, distances in list(repeats.items())[:10]:  # Top 10
        print(f"  {seq}: distances = {distances}")
        all_distances.extend(distances)
    
    if not all_distances:
        print("\nAucune r√©p√©tition trouv√©e.")
        return None
    
    # Calculer le PGCD de toutes les distances
    gcd_result = all_distances[0]
    for d in all_distances[1:]:
        gcd_result = math.gcd(gcd_result, d)
    
    print(f"\nPGCD des distances: {gcd_result}")
    print(f"Longueur probable de la cl√©: {gcd_result}")
    return gcd_result

In [None]:
# Exemple d'attaque Kasiski
plaintext = """LA CRYPTOGRAPHIE EST VRAIMENT UNE SCIENCE FASCINANTE 
QUI PERMET DE PROTEGER LES COMMUNICATIONS ET LES DONNEES 
CONTRE LES ATTAQUES MALVEILLANTES"""

key = "SECURITY"
ciphertext = vigenere_encrypt(plaintext, key)

print(f"Cl√© utilis√©e: {key} (longueur: {len(key)})")
print(f"\nCiphertext:\n{ciphertext}")
print("\n" + "="*50)
print("Attaque de Kasiski:")
print("="*50 + "\n")

key_length = kasiski_examination(ciphertext)

## 5. Transition vers la Cryptographie Moderne

### Pourquoi les chiffres classiques sont-ils cass√©s ?

1. **Espace de cl√©s trop petit** (C√©sar : 26 cl√©s)
2. **Patterns pr√©serv√©s** (fr√©quences, r√©p√©titions)
3. **Pas de confusion ni diffusion** (concepts de Shannon)
4. **Vuln√©rables √† l'analyse statistique**

### Principes de la cryptographie moderne

**Principes de Kerckhoffs (1883)** :

> "Un syst√®me cryptographique doit √™tre s√ªr m√™me si tout est public, sauf la cl√©."

**Confusion et Diffusion (Shannon, 1949)** :

- **Confusion** : Relation complexe entre cl√© et ciphertext
- **Diffusion** : Un bit de plaintext affecte plusieurs bits de ciphertext

### One-Time Pad : Le seul chiffre parfaitement s√©curis√©

Le **One-Time Pad** (OTP) est le **seul** chiffre prouv√© **math√©matiquement incassable** (perfect security).

**Conditions** :
1. Cl√© de **m√™me longueur** que le message
2. Cl√© **vraiment al√©atoire**
3. Cl√© utilis√©e **une seule fois**

‚Üí Voir le notebook `01_demo_otp.ipynb` pour une impl√©mentation compl√®te.

## Exercices

### Exercice 1 : Cassage de C√©sar

D√©chiffrez le message suivant (chiffr√© avec C√©sar) :

```
WKXUH FDHVDU HVW XQ FKLIIU VLPSOH PDLV YXOQHUDEOH
```

In [None]:
# Votre code ici
mystery_cipher = "WKXUH FDHVDU HVW XQ FKLIIU VLPSOH PDLV YXOQHUDEOH"

# M√©thode 1 : Force brute
cesar_brute_force(mystery_cipher)

# M√©thode 2 : Analyse de fr√©quence
freq = frequency_analysis(mystery_cipher)
print("\nLettre la plus fr√©quente:", list(freq.keys())[0])

### Exercice 2 : Cassage de Vigen√®re

D√©chiffrez le message suivant (chiffr√© avec Vigen√®re, cl√© de 5 lettres) :

```
VPXZG IWEVH VFASD WEUKJ KTLWE VUSDG
```

In [None]:
# Votre code ici
vigenere_cipher = "VPXZG IWEVH VFASD WEUKJ KTLWE VUSDG"

# √âtape 1 : Trouver la longueur de la cl√©
key_length = kasiski_examination(vigenere_cipher)

# √âtape 2 : Analyse de fr√©quence sur chaque sous-chiffre
# ... √† compl√©ter

## Conclusion

Dans ce notebook, nous avons vu :

‚úÖ **Chiffres classiques** : C√©sar, Vigen√®re  
‚úÖ **Cryptanalyse** : Analyse de fr√©quence, m√©thode de Kasiski  
‚úÖ **Limitations** : Pourquoi ces chiffres sont vuln√©rables  
‚úÖ **Transition** : Vers la cryptographie moderne (OTP, perfect security)

**Prochaines √©tapes** :
- √âtudier le **One-Time Pad** et la **perfect security** (notebook `01_demo_otp.ipynb`)
- Comprendre les **limitations fondamentales** de la perfect security
- Introduction √† la **computational security** (Chapitre 2)

---

üìö **R√©f√©rences** :
- Serious Cryptography (Aumasson) - Chapitre 1
- The Joy of Cryptography (Rosulek) - Chapitre 1-2
- Histoire de la cryptographie : Simon Singh, "The Code Book"