In [1]:
from tensorflow.keras.preprocessing.image import ImageDataGenerator
from tensorflow.keras import layers, models
from tensorflow.keras.applications import VGG16
from sklearn.metrics import confusion_matrix, classification_report, roc_curve, auc
import numpy as np
import matplotlib.pyplot as plt
from tensorflow.keras.models import load_model
import tensorflow as tf
import os
from tensorflow.keras.preprocessing.image import load_img, img_to_array
import random
import pandas as pd
import seaborn as sns
import re

In [2]:
def create_vgg16_model():
    conv_base = VGG16(weights='imagenet',
                      include_top=False,
                      input_shape=(150, 150, 3))
    
    for layer in conv_base.layers[:-4]:
        layer.trainable = False
    
    model = models.Sequential([
        conv_base,
        layers.Flatten(),
        layers.Dense(256, activation='relu'),
        layers.Dropout(0.5),
        layers.Dense(1, activation='sigmoid')
    ])
    
    model.compile(loss='binary_crossentropy',
                  optimizer=tf.keras.optimizers.Adam(learning_rate=0.0001),
                  metrics=['accuracy'])
    return model

## 3. Architecture du Mod√®le - VGG16 avec Fine-Tuning

### üß¨ Principe du Transfer Learning

Le **transfer learning** consiste √† utiliser un mod√®le pr√©-entra√Æn√© (ici VGG16) et l'adapter √† notre t√¢che sp√©cifique. Cette approche pr√©sente plusieurs avantages :

- ‚ö° **Acc√©l√©ration de l'entra√Ænement** : Utilisation de features d√©j√† apprises
- üìà **Am√©lioration des performances** : B√©n√©fice de l'expertise acquise sur ImageNet
- üíæ **R√©duction des donn√©es n√©cessaires** : Efficace m√™me avec un dataset limit√©
- üéØ **Meilleure g√©n√©ralisation** : Features pr√©-entra√Æn√©es robustes

### üèóÔ∏è Architecture du mod√®le VGG16

**VGG16** est un r√©seau de neurones convolutionnel compos√© de :
- **13 couches convolutionnelles** avec filtres 3√ó3
- **5 couches de pooling** pour r√©duire la dimensionnalit√©  
- **3 couches fully connected** (exclues avec `include_top=False`)

### ‚öôÔ∏è Configuration du Fine-Tuning

#### Chargement du mod√®le pr√©-entra√Æn√©
```python
conv_base = VGG16(weights='imagenet',           # Poids pr√©-entra√Æn√©s sur ImageNet
                  include_top=False,            # Exclusion des couches de classification
                  input_shape=(150, 150, 3))    # Adaptation √† nos images 150√ó150√ó3
```

#### Strat√©gie de gel des couches
```python
for layer in conv_base.layers[:-4]:
    layer.trainable = False
```

**Principe du fine-tuning :**
- üîí **Couches gel√©es** : Les premi√®res couches (features de bas niveau) restent fig√©es
- üîì **Couches d√©gel√©es** : Les 4 derni√®res couches sont r√©entra√Æn√©es pour notre t√¢che
- üéØ **Objectif** : Adapter les features de haut niveau aux radiographies thoraciques

### üèõÔ∏è Architecture finale du mod√®le

#### Couches ajout√©es pour la classification
1. **`Flatten()`** : Conversion des feature maps 2D en vecteur 1D
2. **`Dense(256, activation='relu')`** : Couche fully connected avec 256 neurones
3. **`Dropout(0.5)`** : R√©gularisation pour √©viter le surapprentissage (50% dropout)
4. **`Dense(1, activation='sigmoid')`** : Couche de sortie pour classification binaire

#### Configuration de l'optimisation
- **Loss function** : `binary_crossentropy` (adapt√© √† la classification binaire)
- **Optimizer** : `Adam` avec learning rate faible (0.0001)
- **M√©triques** : `accuracy` pour suivre les performances

### üí° Avantages de cette architecture

|           Aspect          |                       B√©n√©fice                            |
|---------------------------|-----------------------------------------------------------|
| **Poids pr√©-entra√Æn√©s**   | Connaissance pr√©alable des motifs visuels                 |
| **Fine-tuning s√©lectif**  | Adaptation sp√©cifique sans perdre les features g√©n√©rales  |
| **Dropout**               | Pr√©vention du surapprentissage                            |
| **Learning rate faible**  | Ajustements fins sans perturber les features pr√©-apprises |

> ‚ö†Ô∏è **Conseil** : Cette architecture √©quilibre performance et efficacit√© computationnelle, particuli√®rement adapt√©e √† la classification d'images m√©dicales avec des datasets de taille mod√©r√©e.