In [3]:
from tensorflow.keras.preprocessing.image import ImageDataGenerator
from tensorflow.keras import layers, models
from tensorflow.keras.applications import VGG16
from sklearn.metrics import confusion_matrix, classification_report, roc_curve, auc
import numpy as np
import matplotlib.pyplot as plt
from tensorflow.keras.models import load_model
import tensorflow as tf
import os
from tensorflow.keras.preprocessing.image import load_img, img_to_array
import random
import pandas as pd
import seaborn as sns
import re

In [None]:
train_dir = '../../T_DEV_810/chest_xray/train'
val_dir = '../../T_DEV_810/chest_xray/val'
test_dir = '../../T_DEV_810/chest_xray/test'

train_datagen = ImageDataGenerator(
    rescale=1./255,
    rotation_range=40,
    width_shift_range=0.2,
    height_shift_range=0.2,
    shear_range=0.2,
    zoom_range=0.2,
    horizontal_flip=True)

val_datagen = ImageDataGenerator(rescale=1./255)
test_datagen = ImageDataGenerator(rescale=1./255)

train_generator = train_datagen.flow_from_directory(
    train_dir,
    target_size=(150, 150),
    batch_size=32,
    class_mode='binary')

val_generator = val_datagen.flow_from_directory(
    val_dir,
    target_size=(150, 150),
    batch_size=32,
    class_mode='binary')

test_generator = test_datagen.flow_from_directory(
    test_dir,
    target_size=(150, 150),
    batch_size=32,
    class_mode='binary')

Found 4684 images belonging to 2 classes.
Found 585 images belonging to 2 classes.
Found 587 images belonging to 2 classes.


## 2. Configuration des Donn√©es et Pr√©paration

### üìÅ D√©finition de l'architecture des dossiers

Cette structure organise le dataset en trois ensembles distincts :
- **`train`** : Donn√©es d'entra√Ænement pour l'apprentissage du mod√®le
- **`val`** : Donn√©es de validation pour ajuster les hyperparam√®tres  
- **`test`** : Donn√©es de test pour l'√©valuation finale non biais√©e

### üîÑ Configuration des g√©n√©rateurs d'images

#### G√©n√©rateur d'entra√Ænement avec augmentation de donn√©es

L'augmentation de donn√©es permet de :
- ‚úÖ Augmenter artificiellement la taille du dataset
- ‚úÖ Am√©liorer la robustesse du mod√®le aux variations naturelles
- ‚úÖ R√©duire le surapprentissage (overfitting)

**Param√®tres d'augmentation :**
- `rescale=1./255` : Normalisation des pixels [0-255] ‚Üí [0-1]
- `rotation_range=40` : Rotation al√©atoire jusqu'√† 40¬∞
- `width_shift_range=0.2` : D√©calage horizontal jusqu'√† 20%
- `height_shift_range=0.2` : D√©calage vertical jusqu'√† 20%
- `shear_range=0.2` : Cisaillement jusqu'√† 20%
- `zoom_range=0.2` : Zoom al√©atoire jusqu'√† 20%
- `horizontal_flip=True` : Retournement horizontal al√©atoire

#### G√©n√©rateurs de validation et test

‚ö†Ô∏è **Important** : Seule la normalisation est appliqu√©e pour maintenir la coh√©rence d'√©valuation.

### ‚öôÔ∏è Cr√©ation des flux de donn√©es

**Configuration commune :**
- `target_size=(150, 150)` : Redimensionnement √† 150√ó150 pixels
- `batch_size=32` : Traitement par lots de 32 images
- `class_mode='binary'` : Classification binaire (pneumonie vs normal)

**Avantages des g√©n√©rateurs :**
- üíæ Charger les images √† la demande (√©conomie m√©moire)
- ‚ö° Appliquer les transformations en temps r√©el
- üóÇÔ∏è Organiser automatiquement les classes selon la structure des dossiers

### üìÇ Structure attendue des donn√©es

```
chest_xray/
‚îú‚îÄ‚îÄ train/
‚îÇ   ‚îú‚îÄ‚îÄ NORMAL/
‚îÇ   ‚îî‚îÄ‚îÄ PNEUMONIA/
‚îú‚îÄ‚îÄ val/
‚îÇ   ‚îú‚îÄ‚îÄ NORMAL/
‚îÇ   ‚îî‚îÄ‚îÄ PNEUMONIA/
‚îî‚îÄ‚îÄ test/
    ‚îú‚îÄ‚îÄ NORMAL/
    ‚îî‚îÄ‚îÄ PNEUMONIA/
```

> üí° **Note** : Cette configuration pr√©pare un pipeline de donn√©es efficace pour l'entra√Ænement d'un mod√®le de classification d'images m√©dicales.