In [9]:
import tensorflow as tf
from tensorflow.keras.preprocessing.image import ImageDataGenerator
from tensorflow.keras.applications.resnet50 import ResNet50, preprocess_input
from tensorflow.keras import layers, models, callbacks
from tensorflow.keras import mixed_precision
import os



try:
    mixed_precision.set_global_policy('mixed_float16')
except:
    print("Attention : Impossible d'activer la précision mixte (pas de GPU compatible ?). On continue en normal.") 

# --- 1. Configuration des Chemins ---
base_dir = 'chest_xray/chest_xray'
train_dir = os.path.join(base_dir, 'train')
val_dir = os.path.join(base_dir, 'val')
test_dir = os.path.join(base_dir, 'test')

# Paramètres
IMG_SIZE = (224, 224) # taille native pour ResNet50
BATCH_SIZE = 32

# --- 2. Préparation des Données (Data Loaders) ---
train_datagen = ImageDataGenerator(
    preprocessing_function=preprocess_input, # Spécifique à ResNet
    rotation_range=20,
    zoom_range=0.2,
    width_shift_range=0.1,
    height_shift_range=0.1,
    horizontal_flip=True,
    fill_mode='nearest'
)

# Pour la validation/test
test_val_datagen = ImageDataGenerator(
    preprocessing_function=preprocess_input
)

print("Chargement des données d'entraînement :")
train_generator = train_datagen.flow_from_directory(
    train_dir,
    target_size=IMG_SIZE,
    batch_size=BATCH_SIZE,
    class_mode='binary'
)

print("Chargement des données de validation (via le dossier test pour stabilité) :")
val_generator = test_val_datagen.flow_from_directory(
    test_dir, 
    target_size=IMG_SIZE,
    batch_size=BATCH_SIZE,
    class_mode='binary'
)

# --- 3. Construction du Modèle ResNet50 ---

# chargement de ResNet50 pré-entraîné sur ImageNet
base_model = ResNet50(weights='imagenet', include_top=False, input_shape=(224, 224, 3))

# gèle des couches du modèle de base
for layer in base_model.layers:
    layer.trainable = False

# ajoute tête de classification
x = base_model.output
x = layers.GlobalAveragePooling2D()(x)
x = layers.Dense(256, activation='relu')(x)
x = layers.Dropout(0.5)(x) # réduire l'overfitting
predictions = layers.Dense(1, activation='sigmoid')(x)

model = models.Model(inputs=base_model.input, outputs=predictions)

# --- 4. Compilation ---
model.compile(optimizer='adam',
              loss='binary_crossentropy',
              metrics=['accuracy', tf.keras.metrics.Recall(name='recall')])

model.summary()

# --- 5. Entraînement avec Callbacks ---
# Sauvegarde le meilleur modèle uniquement
checkpoint = callbacks.ModelCheckpoint('pneumonia_resnet_best.keras', 
                                       save_best_only=True, 
                                       monitor='val_recall', 
                                       mode='max')

# Arrête si ça ne s'améliore plus après 5 époques
early_stopping = callbacks.EarlyStopping(monitor='val_loss', 
                                         patience=5, 
                                         restore_best_weights=True)

history = model.fit(
    train_generator,
    epochs=30,
    validation_data=val_generator,
    callbacks=[checkpoint, early_stopping]
)


# --- 6. Évaluation Finale sur le Jeu de Test ---
test_generator = test_val_datagen.flow_from_directory(
    test_dir, 
    target_size=IMG_SIZE,
    batch_size=BATCH_SIZE,
    class_mode='binary',
    shuffle=False
)

Chargement des données d'entraînement :
Found 5216 images belonging to 2 classes.
Chargement des données de validation (via le dossier test pour stabilité) :
Found 624 images belonging to 2 classes.


Epoch 1/30
[1m 36/163[0m [32m━━━━[0m[37m━━━━━━━━━━━━━━━━[0m [1m38s[0m 304ms/step - accuracy: 0.7703 - loss: 0.7231 - recall: 0.8389

KeyboardInterrupt: 