# Image Preprocessing et Classification CNN
## Impact du Pr√©traitement sur la Reconnaissance de Panneaux Routiers

---

### üéØ Objectifs P√©dagogiques

Dans ce TP, vous allez :
1. **Comprendre** comment le pr√©traitement d'images affecte les performances d'un mod√®le CNN
2. **Exp√©rimenter** avec diff√©rentes techniques de filtrage du bruit (P1)
3. **Explorer** les m√©thodes de correction de luminosit√© (P2)
4. **Analyser** pourquoi certains pr√©traitements am√©liorent la classification et d'autres la d√©gradent

### üìã √Ä propos du Dataset

- **GTSRB** : German Traffic Sign Recognition Benchmark
- **43 classes** de panneaux routiers
- Images de taille **64x64 pixels** en couleur (RGB)

### üìã Pr√©requis

- Vous disposez du code du mod√®le CNN de base (P0_Model_Tensorflow.py)
- Le dataset GTSRB complet est disponible ici : https://www.kaggle.com/datasets/meowmeowmeowmeowmeow/gtsrb-german-traffic-sign 
- On travaillera avec un sous-ensemble  de 10% `./images/Train_small/` et des images de test `./images/Test/` 
- D'autres images "hors contexte" sont disponibles dans `./images/`
- Le fichier `utils.py` contient des fonctions utilitaires (affichage...etc)
- Le fichier `P0_Model_Tensorflow.py` contient le CNN (TensorFlow)

---

## üîß Configuration de l'Environnement

### ‚ú®Premi√®re utilisation

Suivez ces √©tapes **avant** de lancer ce notebook :

1. **Ouvrir un terminal** dans le dossier du projet
2. **Cr√©er l'environnement virtuel** :
   ```bash
   python -m venv .venv
   ```
3. **Activer l'environnement** :
   - Windows : `.venv\Scripts\activate`
   - Linux/Mac : `source .venv/bin/activate`
4. **Installer les d√©pendances** :
   ```bash
   pip install -r requirements.txt
   ```
5. **Enregistrer le kernel Jupyter** (pour que Jupyter utilise cet environnement) :
   ```bash
   python -m ipykernel install --user --name=icv-env --display-name "Python (ICV)"
   ```
6. **Lancer Jupyter** :
   ```bash
   jupyter notebook
   ```
7. Dans le menu du notebook (Visual Studio Code) : `Select Kernel` ‚Üí `Jupyter Kernel...` ‚Üí `Python (ICV)`

### üì¶ Imports et Configuration

In [1]:
import os
import cv2
import numpy as np
import matplotlib.pyplot as plt
from utils import show, add_noise
from P0_Model_Tensorflow import create_model_and_evaluate

# Configuration pour de meilleures visualisations
plt.rcParams['figure.figsize'] = (14, 8)
plt.rcParams['font.size'] = 10

print("‚úì Imports r√©ussis")

‚úì Imports r√©ussis


---

## Partie 0 : Mod√®le de base (Sans Pr√©traitement)

### üéØ √âtablir une R√©f√©rence

Avant d'exp√©rimenter avec diff√©rentes techniques de pr√©traitement, nous devons **√©tablir une baseline** :
- Mesurer les performances du mod√®le CNN sur les images **brutes** (sans aucun traitement)
- Cette pr√©cision de r√©f√©rence nous permettra de **quantifier l'impact** de chaque technique de pr√©traitement

### üèóÔ∏è Architecture du CNN

Le mod√®le de base (`P0_Model_Tensorflow.py`) utilise :
- 3 couches convolutionnelles (32 ‚Üí 64 ‚Üí 128 filtres)
- Max pooling apr√®s chaque convolution
- Couche dense de 128 neurones + Dropout (50%)
- Optimiseur Adam, fonction de perte categorical crossentropy

---

In [None]:
# -------------------------------------------------------------------------------------------------
#
# Utiliser `create_model_and_evaluate` afin de d√©terminer la pr√©cision du mod√®le sans pr√©traitements
# Cette fonction :
#
# --------------------------------------------------------------------------------------------------


---

## Partie 1 : Filtrage du Bruit

### üîç Contexte Th√©orique

Le **bruit** dans les images peut provenir de :
- Capteurs de cam√©ra (bruit thermique, photonique)
- Compression JPEG
- Transmission de donn√©es

### üéß Types de Bruit

Le bruit d√©grade la qualit√© des images en ajoutant des variations ind√©sirables aux valeurs des pixels. On distingue plusieurs types :

#### 1. Bruit Gaussien (Additif)
- **Mod√®le** : $I_{bruit√©e}(x,y) = I_{originale}(x,y) + N(0, \sigma^2)$
- **Caract√©ristiques** : Suit une distribution normale (courbe en cloche)
- **Origine** : Bruit √©lectronique des capteurs, faible luminosit√©
- **Aspect visuel** : Grain uniforme sur toute l'image
- **Param√®tres** : Moyenne (g√©n√©ralement 0) et √©cart-type $\sigma$

#### 2. Bruit Sel et Poivre (Impulsionnel)
- **Mod√®le** : Certains pixels prennent des valeurs extr√™mes (0 = poivre noir, 255 = sel blanc)
- **Caract√©ristiques** : Pixels isol√©s tr√®s clairs ou tr√®s sombres
- **Origine** : D√©fauts de transmission, pixels morts du capteur
- **Aspect visuel** : Points blancs et noirs dispers√©s al√©atoirement
- **Param√®tre** : Densit√© de bruit (proportion de pixels affect√©s)

#### 3. Bruit de Poisson (D√©pendant du Signal)
- **Mod√®le** : Variance proportionnelle √† l'intensit√© du signal
- **Caract√©ristiques** : Plus visible dans les zones sombres
- **Origine** : Nature quantique de la lumi√®re (comptage de photons)
- **Aspect visuel** : Grain variable selon l'intensit√© lumineuse

#### 4. Bruit Uniforme
- **Mod√®le** : Distribution uniforme sur un intervalle $[a, b]$
- **Origine** : Quantification, arrondis num√©riques
- **Moins courant** en pratique que les bruits gaussien et impulsionnel

### üîá Types de Filtres

#### Filtres Lin√©aires (filtres convolutifs)
1. **Filtre Moyenne** : Moyenne simple des pixels voisins
2. **Filtre Gaussien** : Moyenne pond√©r√©e avec poids gaussiens

#### Filtres Non Lin√©aires
3. **Filtre M√©dian** : Remplace chaque pixel par la m√©diane de son voisinage (robuste aux valeurs aberrantes)
4. **Filtre Bilat√©ral** : Lisse les zones homog√®nes tout en pr√©servant les contours
5. **NLM (Non-Local Means)** : Exploite la redondance des patches dans toute l'image

### üìä M√©trique d'√âvaluation : PSNR

Le **PSNR (Peak Signal-to-Noise Ratio)** mesure la qualit√© de reconstruction. C'est une mesure courament utilis√©e en compression pour √©valuer la qualit√© de reconstruction. Elle peut aussi √™tre utilis√©e pour quantifier la suppression de bruit, **dans les cas o√π l'on connait une *v√©rit√© terrain*** :
- Exprim√© en d√©cibels (dB)
- **Plus √©lev√© = meilleur** (typiquement 20-40 dB)
- Formule : $PSNR = 20 \cdot \log_{10}\left(\frac{MAX}{\sqrt{MSE}}\right)$

o√π :
- **MAX** = Valeur maximale possible d'un pixel (255 pour des images 8 bits)
- **MSE** = Mean Squared Error (erreur quadratique moyenne) : $MSE = \frac{1}{N} \sum_{i=1}^{N} (I_{originale}(i) - I_{trait√©e}(i))^2$
  - $N$ = nombre total de pixels dans l'image
  - Plus le MSE est faible, plus les images sont similaires

**Interpr√©tation** :
- PSNR > 40 dB : Excellente qualit√©, diff√©rences quasi imperceptibles
- 30-40 dB : Bonne qualit√©, l√©g√®res diff√©rences visibles
- 20-30 dB : Qualit√© acceptable, diff√©rences notables
- < 20 dB : Faible qualit√©, d√©gradation importante

### üìä Estimateur de bruit

Concerant notre dataset, nous ne connaissons pas de *v√©rit√© terrain* (si l'on suppose les images brui√©es, nous ne connaissons pas les images d'origines correspondante). On peut cependant estimer la quantiti√© de bruit dans une image en mesurant la variance de son laplacien.

Sur notre image de test (lenna) nous allons tester diff√©rent filtre, mesurer le PSNR et la r√©duction de bruit avec notre estimateur, et v√©rifier que notre estimateur fonctionne bien.

---

### Ajout de Bruit Synth√©tique

In [None]:
# ------------------------------------------------------------------------------------------------------
#
# Utiliser la fonction `add_noise` pour ajouer du bruit gaussien et 'salt and pepper' √† l'image lenna.jpg
# Observer les 2 types de bruits s√©par√©ment puis cumul√©s
# (Utiliser `show` pour visualiser les images)
#
# -------------------------------------------------------------------------------------------------------

### Impl√©mentation des Filtres de D√©bruitage

In [None]:
# -----------------------------------------------------------------------------------------------
#
# Appliquer les filtres suivants √† l'image bruit√©e
# - **Moyenneur** : utiliser `cv2.blur()` avec un noyau 5√ó5
# - **Gaussien** : utiliser `cv2.GaussianBlur()` avec un noyau 5√ó5 et sigma=1
# - **M√©dian** : utiliser `cv2.medianBlur()` avec un noyau de taille 5
# - **Bilat√©ral** : utiliser `cv2.bilateralFilter()` avec d=9, sigmaColor=75, sigmaSpace=75
# - **NLM (Non-Local Means)** : utiliser `cv2.fastNlMeansDenoisingColored()` avec h=10, hColor=10
#
# Visualiser l'ex√©cution pour chaque type de filtre
#
# -----------------------------------------------------------------------------------------------

    

### √âvaluation Quantitative

In [None]:
# -----------------------------------------------------------------------------------------
#
# Ecire une fonction qui calcule le PSNR entre une image d√©bruit√©e et son originale
# Ecire une focntion qui estime le niveau de bruit dans une image (variance du laplacien)
#
# Appliquer ces 2 calculs aux diff√©rents filtres
#
# ------------------------------------------------------------------------------------------

   

### üí≠ Questionnement ?

- Est ce que notre estimateur de bruit est correct ?
- Est ce que les valeurs de PSNR et de notre estimateur sont corr√©l√©es ?
- Est ce que les r√©sultats donn√©s par le PSNR ou l'estimateur de bruit confirme ce que vous voyez visuellement ?
- Est ce qu'on va pouvoir se servir de l'estimateur pour estimer le bruit dans les images du dataset et choisir un filtre ?


---

### Application sur le Dataset GTSRB

In [None]:
# ----------------------------------------------------------------------------------------------------
#
# Calculer le bruit moyen, minimun et maximum du dataset
# Isoler les images correspondantes
#
# Tester les diff√©rents filtres sur ces 3 images
# Observer visuellement les r√©sultats donn√©es par le meilleur et moins bon au sens de notre estimateur. 
#
# ------------------------------------------------------------------------------------------------------


### ‚ùì Questionnement

- Les images du dataset GTSRB semblent-elles tr√®s bruit√©es ?
- Le filtrage du bruit est-il vraiment n√©cessaire pour ce dataset ?
- A-t-on int√©r√™t √† choisir le filtre le plus performant au sens de notre estimateur ?
- Ou plut√¥t un filtre qui pr√©serve mieux les contour ?

---

### Cr√©ation d'un Dataset D√©bruit√© et √âvaluation CNN

In [None]:
# ---------------------------------------------------------------------------------------------------------------------------
#
# Cr√©er 2 dossiers `.image/Train_small_denoised` et `.image/Test_denoised` contenant les images filtr√©e avec le filtre retenu
#
# Recalculer le bruit moyen min et max sur le dossier .image/Train_small_denoised
#
# ----------------------------------------------------------------------------------------------------------------------------

### üß™ √âvaluation du Mod√®le sur Images D√©bruit√©es

In [None]:
# -----------------------------------------
#
# Entrainer le CNN avec ce nouveau dataset
#
# -----------------------------------------


### ü§î Analyse ?

- Pourquoi cr√©er `.image/Test_denoised` ?
- Comment expliquer ces r√©sultats ?

---

## Partie 2 : Correction de Luminosit√©

### üåì Contexte Th√©orique

Les images du dataset GTSRB pr√©sentent une **grande variabilit√© de luminosit√©** :
- Photos prises √† diff√©rents moments de la journ√©e (matin, midi, soir)
- Conditions m√©t√©orologiques vari√©es (ensoleill√©, nuageux)
- Ombres projet√©es par des arbres, b√¢timents, v√©hicules
- Cam√©ras diff√©rentes avec expositions variables

### Techniques de Normalisation

#### 1. √âgalisation d'Histogramme Classique
- Redistribue les intensit√©s pour couvrir toute la plage [0, 255]
- **Avantage** : Simple et rapide
- **Inconv√©nient** : Peut sur-amplifier le bruit dans les zones homog√®nes ou supprimer du contraste localement

#### 2. CLAHE (Contrast Limited Adaptive Histogram Equalization)
- √âgalisation locale par tuiles (tiles)
- Limitation du contraste (`clipLimit`) pour √©viter la sur-amplification
- **Avantage** : Am√©liore le contraste tout en pr√©servant les d√©tails
- **Inconv√©nient** : L√©g√®rement plus co√ªteux en calcul

### üé® Espace Colorim√©trique YCrCb

On travaille dans l'espace **YCrCb** plut√¥t que RGB :
- **Y** : Luminance (information de luminosit√©)
- **Cr, Cb** : Chrominance (information de couleur)


La transformation RGB ‚Üí YCrCb suit les formules standardis√©es **ITU-R BT.601** :

$$Y = 0.299 \cdot R + 0.587 \cdot G + 0.114 \cdot B$$

$$Cr = 128 + 0.500 \cdot (R - Y) = 128 + 0.500 \cdot R - 0.419 \cdot G - 0.081 \cdot B$$

$$Cb = 128 + 0.500 \cdot (B - Y) = 128 - 0.169 \cdot R - 0.331 \cdot G + 0.500 \cdot B$$

o√π $R$, $G$, $B \in [0, 255]$ et $Y$, $Cr$, $Cb \in [0, 255]$


Le canal Y correspond √† une conversion en niveaux de gris mais avec une pond√©ration diff√©rente sur les canaux RGB d√©riv√©e de la perception humaine :
- L'≈ìil humain est plus sensible au vert (coefficient 0.587)
- Moyennement sensible au rouge** (0.299)
- Peu sensible au bleu** (0.114)

En changeant d'espace colorim√©trique :

1. **S√©paration luminosit√©/couleur** : En isolant Y, on peut traiter la luminosit√© ind√©pendamment de la teinte
2. **Pr√©servation des couleurs** : En modifiant uniquement Y, on normalise la luminosit√© tout en gardant les canaux Cr et Cb intacts ‚Üí les couleurs originales sont pr√©serv√©es !

---

### Impl√©mentation des Techniques de Correction

In [None]:
# ------------------------------------------------------------------------------
#
# Ecrire 2 fonctions pour appliquer les corrections de luminosit√© sur le canal Y
# (utiliser cvtColor, equalizeHist, createCLAHE) 
#
# Visualiser les 2 corrections sur l'image 2under-exposed.jpg
#
# ------------------------------------------------------------------------------

### Analyse de la Variabilit√© de Luminosit√© dans le Dataset

In [None]:
# ------------------------------------------------------------------------------------------------------
#
# Ecrire une focntion qui permet d'estimer la luminosit√© d'une image
# Comparer la distribution de la luminosit√© (histogramme) sur l'ensemble du dataset avant et apr√®s CLAHE
# observer visuellement l'effet de CLAHE sur l'image la plus sombre, la plus claire et de luminosit√© moyenne
#
# -------------------------------------------------------------------------------------------------------

### üí° Observation Cl√©

Remarquez comment CLAHE **normalise** les trois images malgr√© leurs diff√©rences initiales de luminosit√©. Cela permet au CNN de se concentrer sur la **forme et le contenu** du panneau plut√¥t que sur les conditions d'√©clairage.

---

## 2.5 - Cr√©ation d'un Dataset Normalis√© et √âvaluation CNN

### üß™ √âvaluation du Mod√®le avec Correction de Luminosit√©

## ‚úÖ Conclusions ?

---