In [None]:
# Import des biblioth√®ques n√©cessaires
import sys
import os
sys.path.append('../src')

import tensorflow as tf
import matplotlib.pyplot as plt
import seaborn as sns
import numpy as np
from pathlib import Path

# Import de nos modules personnalis√©s
from data_utils import DataManager
from model_architecture import ImageClassifierBuilder, create_data_augmentation_layer, create_preprocessing_layer

print(f"TensorFlow version: {tf.__version__}")
print(f"GPU Available: {tf.config.list_physical_devices('GPU')}")

# Configuration pour les graphiques
plt.style.use('seaborn-v0_8')
sns.set_palette("husl")


In [None]:
# Initialisation du DataManager
data_manager = DataManager(data_dir="../data")

# V√©rification et t√©l√©chargement du dataset si n√©cessaire
if not data_manager.verify_dataset_structure():
    print("Dataset non trouv√©. Tentative de t√©l√©chargement...")
    success = data_manager.download_dataset()
    if not success:
        print("‚ö†Ô∏è √âchec du t√©l√©chargement automatique.")
        print("Veuillez t√©l√©charger manuellement le dataset depuis:")
        print("https://www.kaggle.com/datasets/anthonytherrien/image-classification-dataset-32-classes")
        print("Et l'extraire dans le dossier '../data/raw/'")
else:
    print("‚úÖ Dataset trouv√© et v√©rifi√©!")

# Obtenir les informations sur le dataset
dataset_info = data_manager.get_dataset_info()
print(f"\nüìä Informations sur le dataset:")
print(f"Nombre de classes: {dataset_info['num_classes']}")
print(f"Nombre total d'images: {dataset_info['total_images']}")
print(f"Classes: {dataset_info['class_names'][:10]}...")  # Afficher les 10 premi√®res classes


In [None]:
# Chargement des datasets pour visualisation
if dataset_info.get('num_classes', 0) > 0:
    # Charger un petit √©chantillon pour la visualisation
    train_ds, val_ds = data_manager.load_datasets(
        image_size=(224, 224),
        batch_size=16,  # Plus petit batch pour la visualisation
        validation_split=0.2
    )
    
    # Visualiser quelques √©chantillons
    plt.figure(figsize=(15, 10))
    
    # Prendre le premier batch
    for images, labels in train_ds.take(1):
        for i in range(min(12, len(images))):
            plt.subplot(3, 4, i + 1)
            # Convertir l'image en format affichable
            img = images[i].numpy().astype("uint8")
            plt.imshow(img)
            
            # Obtenir le nom de la classe
            class_idx = tf.argmax(labels[i]).numpy()
            class_name = train_ds.class_names[class_idx]
            plt.title(f"Classe: {class_name}", fontsize=10)
            plt.axis('off')
    
    plt.tight_layout()
    plt.show()
    
    print(f"üìä √âchantillons du dataset visualis√©s")
    print(f"Classes disponibles: {train_ds.class_names}")
else:
    print("‚ö†Ô∏è Dataset non disponible pour la visualisation")


In [None]:
# Configuration d'entra√Ænement
training_config = {
    'architecture': 'resnet50',        # Options: resnet50, efficientnet_b0, vgg16, custom_cnn
    'epochs': 20,                      # Nombre d'√©poques (r√©duit pour le test)
    'batch_size': 32,                  # Taille du batch
    'learning_rate': 0.001,            # Taux d'apprentissage
    'image_size': (224, 224),          # Taille des images
    'validation_split': 0.2,           # Fraction pour la validation
    'trainable_base': False,           # Transfer learning avec base gel√©e
    'optimizer': 'adam',               # Optimiseur
    'early_stopping_patience': 5      # Patience pour l'arr√™t pr√©coce
}

print("üîß Configuration d'entra√Ænement:")
for key, value in training_config.items():
    print(f"  {key}: {value}")

print(f"\nüí° Conseils:")
print(f"  - Commencez avec peu d'√©poques (10-20) pour tester")
print(f"  - Utilisez ResNet50 pour de bonnes performances")
print(f"  - R√©duisez batch_size si vous manquez de m√©moire GPU")


In [None]:
# Import du module d'entra√Ænement
from train import ModelTrainer
from datetime import datetime

print("üöÄ Pr√©paration de l'entra√Ænement...")

# Cr√©er une instance du trainer avec notre configuration
trainer = ModelTrainer(training_config)

print("‚úÖ Trainer initialis√© avec succ√®s!")
print(f"üìÅ Dossier de sortie: {trainer.output_dir}")
print(f"üìä Dossier des logs: {trainer.log_dir}")

# Afficher un r√©sum√© avant de commencer
print(f"\nüìã R√©sum√© de l'entra√Ænement:")
print(f"  Architecture: {training_config['architecture']}")
print(f"  √âpoques: {training_config['epochs']}")
print(f"  Batch size: {training_config['batch_size']}")
print(f"  Learning rate: {training_config['learning_rate']}")

print(f"\n‚è∞ Temps estim√©: ~{training_config['epochs'] * 2} minutes (selon votre mat√©riel)")
print(f"üíæ Les mod√®les seront sauvegard√©s automatiquement")
print(f"üìà Suivez les m√©triques en temps r√©el avec TensorBoard: tensorboard --logdir=../logs")


In [None]:
# √âtape 1: Pr√©paration des donn√©es
print("üì• √âtape 1/3: Pr√©paration des donn√©es...")

try:
    trainer.prepare_data()
    print("‚úÖ Donn√©es pr√©par√©es avec succ√®s!")
    
    # Afficher les informations sur le dataset
    print(f"\nüìä Informations du dataset:")
    print(f"  Nombre de classes: {trainer.dataset_info['num_classes']}")
    print(f"  Total d'images: {trainer.dataset_info['total_images']}")
    print(f"  Classes: {trainer.dataset_info['class_names'][:5]}... (et {trainer.dataset_info['num_classes']-5} autres)")
    
except Exception as e:
    print(f"‚ùå Erreur lors de la pr√©paration des donn√©es: {e}")
    print("üí° V√©rifiez que le dataset est disponible ou t√©l√©chargeable depuis Kaggle")


In [None]:
# √âtape 2: Construction du mod√®le
print("üèóÔ∏è √âtape 2/3: Construction du mod√®le...")

try:
    trainer.build_model()
    print("‚úÖ Mod√®le construit avec succ√®s!")
    
    # Afficher un r√©sum√© du mod√®le
    print(f"\nüß† R√©sum√© du mod√®le:")
    trainer.model.summary()
    
    # Compter les param√®tres
    total_params = trainer.model.count_params()
    trainable_params = sum([tf.keras.backend.count_params(w) for w in trainer.model.trainable_weights])
    non_trainable_params = total_params - trainable_params
    
    print(f"\nüìä Param√®tres du mod√®le:")
    print(f"  Total: {total_params:,}")
    print(f"  Entra√Ænables: {trainable_params:,}")
    print(f"  Non-entra√Ænables: {non_trainable_params:,}")
    
except Exception as e:
    print(f"‚ùå Erreur lors de la construction du mod√®le: {e}")
    print("üí° V√©rifiez la configuration du mod√®le")


In [None]:
# √âtape 3: Entra√Ænement du mod√®le
print("üéØ √âtape 3/3: Entra√Ænement du mod√®le...")
print(f"‚è∞ D√©but de l'entra√Ænement: {datetime.now().strftime('%H:%M:%S')}")

try:
    # Lancer l'entra√Ænement
    trainer.train()
    
    print("üéâ Entra√Ænement termin√© avec succ√®s!")
    print(f"‚è∞ Fin de l'entra√Ænement: {datetime.now().strftime('%H:%M:%S')}")
    print(f"üíæ Mod√®le sauvegard√© dans: {trainer.output_dir}")
    
    # Afficher les m√©triques finales si disponibles
    if trainer.history:
        final_epoch = len(trainer.history.history['accuracy']) - 1
        final_acc = trainer.history.history['val_accuracy'][final_epoch]
        final_loss = trainer.history.history['val_loss'][final_epoch]
        
        print(f"\nüìä R√©sultats finaux:")
        print(f"  Pr√©cision validation: {final_acc:.4f}")
        print(f"  Perte validation: {final_loss:.4f}")
        
except Exception as e:
    print(f"‚ùå Erreur lors de l'entra√Ænement: {e}")
    print("üí° V√©rifiez les logs ci-dessus pour plus de d√©tails")


In [None]:
# Visualisation des r√©sultats d'entra√Ænement
if hasattr(trainer, 'history') and trainer.history:
    history = trainer.history.history
    
    # Cr√©er les graphiques
    fig, axes = plt.subplots(2, 2, figsize=(15, 10))
    
    # Pr√©cision
    axes[0, 0].plot(history['accuracy'], label='Entra√Ænement', linewidth=2)
    axes[0, 0].plot(history['val_accuracy'], label='Validation', linewidth=2)
    axes[0, 0].set_title('Pr√©cision du Mod√®le', fontsize=14, fontweight='bold')
    axes[0, 0].set_xlabel('√âpoque')
    axes[0, 0].set_ylabel('Pr√©cision')
    axes[0, 0].legend()
    axes[0, 0].grid(True, alpha=0.3)
    
    # Perte
    axes[0, 1].plot(history['loss'], label='Entra√Ænement', linewidth=2)
    axes[0, 1].plot(history['val_loss'], label='Validation', linewidth=2)
    axes[0, 1].set_title('Perte du Mod√®le', fontsize=14, fontweight='bold')
    axes[0, 1].set_xlabel('√âpoque')
    axes[0, 1].set_ylabel('Perte')
    axes[0, 1].legend()
    axes[0, 1].grid(True, alpha=0.3)
    
    # Top-3 Accuracy
    if 'top_3_accuracy' in history:
        axes[1, 0].plot(history['top_3_accuracy'], label='Entra√Ænement Top-3', linewidth=2)
        axes[1, 0].plot(history['val_top_3_accuracy'], label='Validation Top-3', linewidth=2)
        axes[1, 0].set_title('Pr√©cision Top-3', fontsize=14, fontweight='bold')
        axes[1, 0].set_xlabel('√âpoque')
        axes[1, 0].set_ylabel('Pr√©cision Top-3')
        axes[1, 0].legend()
        axes[1, 0].grid(True, alpha=0.3)
    
    # Top-5 Accuracy
    if 'top_5_accuracy' in history:
        axes[1, 1].plot(history['top_5_accuracy'], label='Entra√Ænement Top-5', linewidth=2)
        axes[1, 1].plot(history['val_top_5_accuracy'], label='Validation Top-5', linewidth=2)
        axes[1, 1].set_title('Pr√©cision Top-5', fontsize=14, fontweight='bold')
        axes[1, 1].set_xlabel('√âpoque')
        axes[1, 1].set_ylabel('Pr√©cision Top-5')
        axes[1, 1].legend()
        axes[1, 1].grid(True, alpha=0.3)
    
    plt.tight_layout()
    plt.show()
    
    # R√©sum√© des performances
    print("üìä R√©sum√© des Performances:")
    print(f"  Meilleure pr√©cision validation: {max(history['val_accuracy']):.4f}")
    print(f"  Perte finale validation: {history['val_loss'][-1]:.4f}")
    if 'val_top_3_accuracy' in history:
        print(f"  Meilleure pr√©cision Top-3: {max(history['val_top_3_accuracy']):.4f}")
    if 'val_top_5_accuracy' in history:
        print(f"  Meilleure pr√©cision Top-5: {max(history['val_top_5_accuracy']):.4f}")
        
else:
    print("‚ö†Ô∏è Aucun historique d'entra√Ænement disponible pour la visualisation")
