# Test du modèle de classification des prunes africaines

Ce notebook utilise les fonctions existantes dans le dépôt pour tester le modèle de classification des prunes africaines en utilisant le jeu de données Kaggle "African Plums Dataset".

## 1. Configuration de l'environnement pour Google Colab

Commençons par cloner le dépôt GitHub et configurer l'environnement.

In [None]:
# Vérifier si nous sommes dans Google Colab
import sys
IN_COLAB = 'google.colab' in sys.modules
print(f"Exécution dans Google Colab: {IN_COLAB}")

if IN_COLAB:
    # Cloner le dépôt GitHub
    !git clone https://github.com/CodeStorm-mbe/african-plums-classifier.git
    %cd african-plums-classifier
    
    # Installer les dépendances requises
    !pip install -r requirements.txt
    !pip install kaggle

## 2. Monter Google Drive pour la persistance des données

Pour accéder aux modèles entraînés dans les notebooks précédents, nous allons utiliser Google Drive comme stockage persistant.

In [None]:
# Monter Google Drive si nous sommes dans Colab
if IN_COLAB:
    from google.colab import drive
    drive.mount('/content/drive')
    
    # Définir les chemins dans Google Drive
    DRIVE_PROJECT_DIR = "/content/drive/MyDrive/african-plums-classifier"
    DRIVE_DATA_DIR = f"{DRIVE_PROJECT_DIR}/data"
    DRIVE_KAGGLE_DIR = f"{DRIVE_DATA_DIR}/kaggle"
    DRIVE_RAW_DATA_DIR = f"{DRIVE_DATA_DIR}/raw"
    DRIVE_PLUM_DATA_DIR = f"{DRIVE_RAW_DATA_DIR}/plums"
    DRIVE_NON_PLUM_DATA_DIR = f"{DRIVE_RAW_DATA_DIR}/non_plums"
    DRIVE_MODELS_DIR = f"{DRIVE_PROJECT_DIR}/models"
    DRIVE_TEST_IMAGES_DIR = f"{DRIVE_PROJECT_DIR}/test_images"
    
    # Vérifier si les répertoires existent, sinon les créer
    !mkdir -p {DRIVE_PROJECT_DIR}
    !mkdir -p {DRIVE_DATA_DIR}
    !mkdir -p {DRIVE_KAGGLE_DIR}
    !mkdir -p {DRIVE_RAW_DATA_DIR}
    !mkdir -p {DRIVE_PLUM_DATA_DIR}
    !mkdir -p {DRIVE_NON_PLUM_DATA_DIR}
    !mkdir -p {DRIVE_MODELS_DIR}
    !mkdir -p {DRIVE_TEST_IMAGES_DIR}
    
    print(f"Google Drive monté et répertoires créés dans {DRIVE_PROJECT_DIR}")

In [None]:
import os
import sys
import json
import torch
import numpy as np
import matplotlib.pyplot as plt
from PIL import Image
import glob
import random
import seaborn as sns
from sklearn.metrics import confusion_matrix
import zipfile
import shutil

# Ajouter le répertoire courant au chemin pour pouvoir importer nos modules
if IN_COLAB:
    # Dans Colab, nous sommes déjà dans le répertoire du projet
    if "/content/african-plums-classifier" not in sys.path:
        sys.path.append("/content/african-plums-classifier")
else:
    # En local, ajouter le répertoire parent
    module_path = os.path.abspath(os.path.join('..'))
    if module_path not in sys.path:
        sys.path.append(module_path)

# Importer nos modules personnalisés
from data.data_preprocessing import preprocess_single_image
from models.model_architecture import get_model, TwoStageModel

# Définir les chemins
if IN_COLAB:
    # Utiliser les chemins dans Google Drive pour la persistance
    DATA_ROOT = DRIVE_RAW_DATA_DIR
    KAGGLE_DIR = DRIVE_KAGGLE_DIR
    MODELS_DIR = DRIVE_MODELS_DIR
    TEST_IMAGES_DIR = DRIVE_TEST_IMAGES_DIR
    
    # Créer également des liens symboliques pour faciliter l'accès depuis le code existant
    LOCAL_DATA_ROOT = "data/raw"
    LOCAL_KAGGLE_DIR = "data/kaggle"
    LOCAL_MODELS_DIR = "models/saved"
    LOCAL_TEST_IMAGES_DIR = "data/test_images"
    
    # Créer les répertoires locaux s'ils n'existent pas
    !mkdir -p {LOCAL_DATA_ROOT}
    !mkdir -p {LOCAL_KAGGLE_DIR}
    !mkdir -p {LOCAL_MODELS_DIR}
    !mkdir -p {LOCAL_TEST_IMAGES_DIR}
    
    # Créer des liens symboliques si nécessaire
    if not os.path.exists(LOCAL_DATA_ROOT) or not os.path.islink(LOCAL_DATA_ROOT):
        !rm -rf {LOCAL_DATA_ROOT}
        !ln -s {DATA_ROOT} {LOCAL_DATA_ROOT}
    
    if not os.path.exists(LOCAL_KAGGLE_DIR) or not os.path.islink(LOCAL_KAGGLE_DIR):
        !rm -rf {LOCAL_KAGGLE_DIR}
        !ln -s {KAGGLE_DIR} {LOCAL_KAGGLE_DIR}
        
    if not os.path.exists(LOCAL_MODELS_DIR) or not os.path.islink(LOCAL_MODELS_DIR):
        !rm -rf {LOCAL_MODELS_DIR}
        !ln -s {MODELS_DIR} {LOCAL_MODELS_DIR}
        
    if not os.path.exists(LOCAL_TEST_IMAGES_DIR) or not os.path.islink(LOCAL_TEST_IMAGES_DIR):
        !rm -rf {LOCAL_TEST_IMAGES_DIR}
        !ln -s {TEST_IMAGES_DIR} {LOCAL_TEST_IMAGES_DIR}
else:
    # En local
    DATA_ROOT = "../data/raw"
    KAGGLE_DIR = "../data/kaggle"
    MODELS_DIR = "../models/saved"
    TEST_IMAGES_DIR = "../data/test_images"

PLUM_DATA_DIR = os.path.join(DATA_ROOT, "plums")  # Sous-dossier pour les prunes
NON_PLUM_DATA_DIR = os.path.join(DATA_ROOT, "non_plums")  # Sous-dossier pour les non-prunes

# Créer les répertoires s'ils n'existent pas
os.makedirs(PLUM_DATA_DIR, exist_ok=True)
os.makedirs(NON_PLUM_DATA_DIR, exist_ok=True)
os.makedirs(MODELS_DIR, exist_ok=True)
os.makedirs(TEST_IMAGES_DIR, exist_ok=True)
os.makedirs(KAGGLE_DIR, exist_ok=True)

# Définir les paramètres
IMG_SIZE = 224
RANDOM_SEED = 42

# Fixer les seeds pour la reproductibilité
torch.manual_seed(RANDOM_SEED)
np.random.seed(RANDOM_SEED)
random.seed(RANDOM_SEED)
if torch.cuda.is_available():
    torch.cuda.manual_seed(RANDOM_SEED)
    torch.backends.cudnn.deterministic = True
    torch.backends.cudnn.benchmark = False

# Déterminer le device
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
print(f"Utilisation de: {device}")

# Afficher les chemins des données
print(f"\nChemins des données:")
print(f"DATA_ROOT: {DATA_ROOT}")
print(f"KAGGLE_DIR: {KAGGLE_DIR}")
print(f"PLUM_DATA_DIR: {PLUM_DATA_DIR}")
print(f"NON_PLUM_DATA_DIR: {NON_PLUM_DATA_DIR}")
print(f"MODELS_DIR: {MODELS_DIR}")
print(f"TEST_IMAGES_DIR: {TEST_IMAGES_DIR}")

## 3. Configuration de l'API Kaggle

Pour télécharger le jeu de données Kaggle, nous devons configurer l'API Kaggle si ce n'est pas déjà fait dans les notebooks précédents.

In [None]:
# Configuration de l'API Kaggle
if IN_COLAB:
    from google.colab import files
    
    # Vérifier si le fichier kaggle.json existe dans Google Drive
    KAGGLE_CONFIG_PATH = os.path.expanduser('~/.kaggle/kaggle.json')
    DRIVE_KAGGLE_CONFIG_PATH = f"{DRIVE_PROJECT_DIR}/kaggle.json"
    
    # Vérifier si le fichier kaggle.json existe dans Google Drive
    kaggle_config_in_drive = os.path.exists(DRIVE_KAGGLE_CONFIG_PATH)
    
    # Vérifier si le fichier kaggle.json existe localement
    kaggle_config_exists = os.path.exists(KAGGLE_CONFIG_PATH)
    
    if kaggle_config_in_drive:
        print(f"Fichier kaggle.json trouvé dans Google Drive. Utilisation de ce fichier.")
        # Créer le répertoire .kaggle s'il n'existe pas
        os.makedirs(os.path.expanduser('~/.kaggle'), exist_ok=True)
        # Copier le fichier de Google Drive vers le répertoire local
        shutil.copy(DRIVE_KAGGLE_CONFIG_PATH, KAGGLE_CONFIG_PATH)
        # Définir les permissions appropriées
        os.chmod(KAGGLE_CONFIG_PATH, 600)
        print("Fichier kaggle.json configuré avec succès.")
    elif not kaggle_config_exists:
        print("Veuillez télécharger votre fichier kaggle.json pour l'authentification Kaggle.")
        print("Vous pouvez le générer sur https://www.kaggle.com/account dans la section 'API'.")
        
        # Télécharger le fichier kaggle.json
        uploaded = files.upload()
        
        # Créer le répertoire .kaggle s'il n'existe pas
        os.makedirs(os.path.expanduser('~/.kaggle'), exist_ok=True)
        
        # Déplacer le fichier kaggle.json vers le répertoire .kaggle
        if 'kaggle.json' in uploaded:
            shutil.move('kaggle.json', KAGGLE_CONFIG_PATH)
            # Définir les permissions appropriées
            os.chmod(KAGGLE_CONFIG_PATH, 600)
            # Sauvegarder également dans Google Drive pour une utilisation future
            shutil.copy(KAGGLE_CONFIG_PATH, DRIVE_KAGGLE_CONFIG_PATH)
            print("Fichier kaggle.json configuré avec succès et sauvegardé dans Google Drive.")
        else:
            print("Erreur: Le fichier kaggle.json n'a pas été téléchargé.")
    else:
        print("Le fichier kaggle.json existe déjà localement.")
        # Sauvegarder également dans Google Drive pour une utilisation future
        shutil.copy(KAGGLE_CONFIG_PATH, DRIVE_KAGGLE_CONFIG_PATH)
        print("Fichier kaggle.json sauvegardé dans Google Drive.")

## 4. Vérification des modèles entraînés dans Google Drive

Vérifions si les modèles ont déjà été entraînés dans les notebooks précédents et sont disponibles dans Google Drive.

In [None]:
# Vérifier si les modèles ont été entraînés dans les notebooks précédents
def check_models_availability():
    """Vérifie si les modèles ont été entraînés dans les notebooks précédents."""
    if IN_COLAB:
        # Vérifier si le fichier d'informations d'entraînement existe dans Google Drive
        training_info_path = f"{DRIVE_PROJECT_DIR}/training_info.json"
        if os.path.exists(training_info_path):
            try:
                with open(training_info_path, 'r') as f:
                    training_info = json.load(f)
                
                print(f"Informations d'entraînement trouvées dans Google Drive.")
                print(f"Date d'entraînement: {training_info.get('date_trained', 'date inconnue')}")
                return training_info
            except Exception as e:
                print(f"Erreur lors de la lecture du fichier d'informations d'entraînement: {e}")
    
    # Vérifier si les fichiers de modèle existent
    detection_model_path = os.path.join(MODELS_DIR, 'detection_best_acc.pth')
    classification_model_path = os.path.join(MODELS_DIR, 'classification_best_acc.pth')
    model_info_path = os.path.join(MODELS_DIR, 'two_stage_model_info.json')
    
    if os.path.exists(detection_model_path) and os.path.exists(classification_model_path) and os.path.exists(model_info_path):
        print("Les fichiers de modèle existent.")
        
        # Lire les informations du modèle
        try:
            with open(model_info_path, 'r') as f:
                model_info = json.load(f)
            
            print(f"Date de création du modèle: {model_info.get('date_created', 'date inconnue')}")
            return {
                'model_info': model_info,
                'models_available': True
            }
        except Exception as e:
            print(f"Erreur lors de la lecture du fichier d'informations du modèle: {e}")
    else:
        print("Les fichiers de modèle n'existent pas.")
        if not os.path.exists(detection_model_path):
            print(f"  - Fichier manquant: {detection_model_path}")
        if not os.path.exists(classification_model_path):
            print(f"  - Fichier manquant: {classification_model_path}")
        if not os.path.exists(model_info_path):
            print(f"  - Fichier manquant: {model_info_path}")
    
    return None

# Vérifier si les modèles ont été entraînés
training_info = check_models_availability()

if training_info:
    print("\nInformations sur les modèles entraînés:")
    if 'model_info' in training_info:
        model_info = training_info['model_info']
        print(f"Classes de détection: {model_info.get('detection_classes', [])}")
        print(f"Classes de classification: {model_info.get('classification_classes', [])}")
else:
    print("\nVeuillez d'abord exécuter le notebook d'entraînement des modèles.")
    
    # Si nous sommes dans Colab, proposer de télécharger les modèles
    if IN_COLAB:
        print("\nVous pouvez télécharger les modèles entraînés ci-dessous.")

## 5. Téléchargement des modèles entraînés (pour Google Colab)

Si vous êtes dans Google Colab et que les modèles ne sont pas disponibles dans Google Drive, vous pouvez les télécharger ici.

In [None]:
if IN_COLAB and (training_info is None):
    # Créer une fonction pour télécharger les modèles
    def upload_models():
        print("Veuillez télécharger les fichiers de modèle suivants:")
        print("1. detection_best_acc.pth")
        print("2. classification_best_acc.pth")
        print("3. two_stage_model_info.json")
        
        # Télécharger les fichiers
        uploaded = files.upload()
        
        # Déplacer les fichiers vers le répertoire des modèles
        for filename in uploaded.keys():
            dst_path = os.path.join(MODELS_DIR, filename)
            shutil.move(filename, dst_path)
            print(f"Fichier {filename} déplacé vers {dst_path}")
    
    # Demander à l'utilisateur s'il souhaite télécharger les modèles
    print("Souhaitez-vous télécharger les modèles maintenant? (Décommentez la ligne suivante pour télécharger)")
    # upload_models()

## 6. Préparation des images de test à partir du jeu de données Kaggle

Téléchargeons et préparons des images de test à partir du jeu de données Kaggle "African Plums Dataset".

In [None]:
def download_kaggle_dataset(force_download=False):
    """Télécharge le jeu de données Kaggle 'African Plums Dataset'."""
    # Vérifier si le jeu de données a déjà été téléchargé
    dataset_zip = os.path.join(KAGGLE_DIR, 'african-plums-dataset.zip')
    if os.path.exists(dataset_zip) and not force_download:
        print(f"Le jeu de données a déjà été téléchargé dans {dataset_zip}.")
        return dataset_zip
    
    print("Téléchargement du jeu de données Kaggle 'African Plums Dataset'...")
    try:
        # Télécharger le jeu de données
        !kaggle datasets download -d arnaudfadja/african-plums-quality-and-defect-assessment-data -p {KAGGLE_DIR}
        print(f"Jeu de données téléchargé avec succès dans {dataset_zip}.")
        return dataset_zip
    except Exception as e:
        print(f"Erreur lors du téléchargement du jeu de données: {e}")
        return None

def extract_and_prepare_test_images(dataset_zip, force_extract=False, num_images_per_class=3):
    """Extrait et prépare des images de test à partir du jeu de données Kaggle."""
    if not os.path.exists(dataset_zip):
        print(f"Le fichier {dataset_zip} n'existe pas.")
        return False
    
    # Vérifier si les données ont déjà été extraites
    extracted_dir = os.path.join(KAGGLE_DIR, 'extracted')
    if os.path.exists(extracted_dir) and not force_extract:
        print(f"Le jeu de données a déjà été extrait dans {extracted_dir}.")
    else:
        print(f"Extraction du jeu de données...")
        os.makedirs(extracted_dir, exist_ok=True)
        
        # Extraire le fichier zip
        with zipfile.ZipFile(dataset_zip, 'r') as zip_ref:
            zip_ref.extractall(extracted_dir)
        
        print(f"Jeu de données extrait avec succès dans {extracted_dir}.")
    
    # Préparer des images de test
    print("Préparation des images de test...")
    
    # Vérifier la structure du jeu de données extrait
    dataset_dir = os.path.join(extracted_dir, 'african_plums_dataset')
    if not os.path.exists(dataset_dir):
        print(f"Le répertoire {dataset_dir} n'existe pas.")
        return False
    
    # Mapper les classes du jeu de données Kaggle
    classes = ['bruised', 'cracked', 'rotten', 'spotted', 'unaffected', 'unripe']
    
    # Sélectionner des images aléatoires pour chaque classe
    for cls in classes:
        src_dir = os.path.join(dataset_dir, cls)
        if not os.path.exists(src_dir):
            print(f"Le répertoire {src_dir} n'existe pas.")
            continue
        
        # Obtenir la liste des images
        images = [f for f in os.listdir(src_dir) if os.path.isfile(os.path.join(src_dir, f)) and f.lower().endswith(('.png', '.jpg', '.jpeg'))]
        if not images:
            print(f"Aucune image trouvée dans {src_dir}.")
            continue
        
        # Sélectionner des images aléatoires
        selected_images = random.sample(images, min(num_images_per_class, len(images)))
        
        # Copier les images sélectionnées vers le répertoire de test
        for i, img_name in enumerate(selected_images):
            src_path = os.path.join(src_dir, img_name)
            dst_path = os.path.join(TEST_IMAGES_DIR, f"test_{cls}_{i+1}.jpg")
            shutil.copy(src_path, dst_path)
            print(f"Image copiée: {src_path} -> {dst_path}")
    
    # Ajouter des images non-prune (si disponibles)
    non_plum_dir = os.path.join(NON_PLUM_DATA_DIR, "non_plum")
    if os.path.exists(non_plum_dir):
        non_plum_images = [f for f in os.listdir(non_plum_dir) if os.path.isfile(os.path.join(non_plum_dir, f)) and f.lower().endswith(('.png', '.jpg', '.jpeg'))]
        if non_plum_images:
            selected_non_plum = random.sample(non_plum_images, min(5, len(non_plum_images)))
            for i, img_name in enumerate(selected_non_plum):
                src_path = os.path.join(non_plum_dir, img_name)
                dst_path = os.path.join(TEST_IMAGES_DIR, f"test_non_plum_{i+1}.jpg")
                shutil.copy(src_path, dst_path)
                print(f"Image non-prune copiée: {src_path} -> {dst_path}")
    
    # Vérifier le nombre d'images de test préparées
    test_images = [f for f in os.listdir(TEST_IMAGES_DIR) if os.path.isfile(os.path.join(TEST_IMAGES_DIR, f)) and f.lower().endswith(('.png', '.jpg', '.jpeg'))]
    print(f"\n{len(test_images)} images de test préparées avec succès.")
    
    return True

def prepare_test_images(force_prepare=False, num_images_per_class=3):
    """Prépare des images de test à partir du jeu de données Kaggle ou crée des images synthétiques."""
    # Vérifier si des images de test existent déjà
    existing_images = [f for f in os.listdir(TEST_IMAGES_DIR) if os.path.isfile(os.path.join(TEST_IMAGES_DIR, f)) and f.lower().endswith(('.png', '.jpg', '.jpeg'))]
    if existing_images and not force_prepare:
        print(f"Des images de test existent déjà ({len(existing_images)} images). Utilisez force_prepare=True pour les remplacer.")
        return
    
    # Essayer de télécharger et préparer des images de test à partir du jeu de données Kaggle
    try:
        dataset_zip = download_kaggle_dataset(force_download=False)
        if dataset_zip:
            success = extract_and_prepare_test_images(dataset_zip, force_extract=False, num_images_per_class=num_images_per_class)
            if success:
                print("Images de test préparées avec succès à partir du jeu de données Kaggle.")
                return
    except Exception as e:
        print(f"Erreur lors de la préparation des images de test à partir du jeu de données Kaggle: {e}")
    
    # Si le téléchargement ou la préparation échoue, créer des images synthétiques
    print("Création d'images de test synthétiques...")
    
    # Définir les couleurs pour les différentes classes
    colors = {
        "bruised": (150, 0, 0),      # Rouge foncé
        "cracked": (150, 100, 0),    # Marron
        "rotten": (100, 0, 100),     # Violet
        "spotted": (150, 50, 50),    # Rouge-rose
        "unaffected": (150, 50, 0),  # Orange-rouge
        "unripe": (0, 150, 0)        # Vert foncé
    }
    
    # Créer des images pour chaque classe de prune
    for cls, base_color in colors.items():
        for i in range(3):  # 3 images par classe
            # Ajouter un peu de variation aléatoire à la couleur
            color_var = [max(0, min(255, c + random.randint(-20, 20))) for c in base_color]
            
            # Créer une image
            img = Image.new('RGB', (224, 224), (255, 255, 255))
            pixels = img.load()
            
            # Dessiner un cercle approximatif avec la couleur
            center_x, center_y = 112, 112
            radius = 100 + random.randint(-10, 10)
            
            for x in range(img.width):
                for y in range(img.height):
                    dist = ((x - center_x) ** 2 + (y - center_y) ** 2) ** 0.5
                    if dist <= radius:
                        # Ajouter du bruit à chaque pixel
                        pixel_color = [max(0, min(255, c + random.randint(-10, 10))) for c in color_var]
                        pixels[x, y] = tuple(pixel_color)
            
            # Sauvegarder l'image
            img_path = os.path.join(TEST_IMAGES_DIR, f"test_{cls}_{i+1}.jpg")
            img.save(img_path)
    
    # Créer des images non-prune
    for i in range(5):  # 5 images non-prune
        # Couleur aléatoire qui n'est pas proche des couleurs de prune
        color = (random.randint(0, 100), random.randint(150, 255), random.randint(150, 255))
        
        # Créer une image
        img = Image.new('RGB', (224, 224), (255, 255, 255))
        pixels = img.load()
        
        # Dessiner une forme aléatoire (carré ou triangle)
        shape = random.choice(['square', 'triangle'])
        
        if shape == 'square':
            # Dessiner un carré
            size = random.randint(100, 150)
            top_left = (random.randint(0, 224-size), random.randint(0, 224-size))
            
            for x in range(top_left[0], top_left[0] + size):
                for y in range(top_left[1], top_left[1] + size):
                    if 0 <= x < 224 and 0 <= y < 224:
                        # Ajouter du bruit à chaque pixel
                        pixel_color = [max(0, min(255, c + random.randint(-10, 10))) for c in color]
                        pixels[x, y] = tuple(pixel_color)
        else:
            # Dessiner un triangle
            p1 = (random.randint(50, 174), random.randint(50, 174))
            p2 = (p1[0] + random.randint(30, 50), p1[1] + random.randint(30, 50))
            p3 = (p1[0] - random.randint(0, 30), p2[1])
            
            # Remplir le triangle (algorithme simple)
            min_x = min(p1[0], p2[0], p3[0])
            max_x = max(p1[0], p2[0], p3[0])
            min_y = min(p1[1], p2[1], p3[1])
            max_y = max(p1[1], p2[1], p3[1])
            
            for x in range(min_x, max_x + 1):
                for y in range(min_y, max_y + 1):
                    if 0 <= x < 224 and 0 <= y < 224:
                        # Vérification simple si le point est dans le triangle
                        if (x >= p1[0] and y >= p1[1] and x <= p2[0] and y <= p2[1]):
                            # Ajouter du bruit à chaque pixel
                            pixel_color = [max(0, min(255, c + random.randint(-10, 10))) for c in color]
                            pixels[x, y] = tuple(pixel_color)
        
        # Sauvegarder l'image
        img_path = os.path.join(TEST_IMAGES_DIR, f"test_non_plum_{i+1}.jpg")
        img.save(img_path)
    
    # Vérifier le nombre d'images de test créées
    test_images = [f for f in os.listdir(TEST_IMAGES_DIR) if os.path.isfile(os.path.join(TEST_IMAGES_DIR, f)) and f.lower().endswith(('.png', '.jpg', '.jpeg'))]
    print(f"\n{len(test_images)} images de test synthétiques créées avec succès.")

# Préparer des images de test
prepare_test_images(force_prepare=False, num_images_per_class=3)

## 7. Visualisation des images de test

Visualisons les images de test que nous avons préparées.

In [None]:
def visualize_test_images():
    """Visualise les images de test."""
    # Obtenir la liste des images de test
    test_images = [f for f in os.listdir(TEST_IMAGES_DIR) if os.path.isfile(os.path.join(TEST_IMAGES_DIR, f)) and f.lower().endswith(('.png', '.jpg', '.jpeg'))]
    if not test_images:
        print("Aucune image de test trouvée.")
        return
    
    # Trier les images par classe
    test_images.sort()
    
    # Déterminer le nombre de lignes et de colonnes pour l'affichage
    num_images = min(len(test_images), 15)  # Limiter à 15 images pour l'affichage
    num_cols = 5
    num_rows = (num_images + num_cols - 1) // num_cols
    
    # Créer la figure
    plt.figure(figsize=(15, 3 * num_rows))
    
    # Afficher chaque image
    for i, img_name in enumerate(test_images[:num_images]):
        img_path = os.path.join(TEST_IMAGES_DIR, img_name)
        img = Image.open(img_path)
        
        plt.subplot(num_rows, num_cols, i + 1)
        plt.imshow(img)
        plt.title(img_name.replace('test_', '').replace('.jpg', ''))
        plt.axis('off')
    
    plt.tight_layout()
    plt.show()
    
    # Sauvegarder la figure dans Google Drive si nous sommes dans Colab
    if IN_COLAB:
        # Sauvegarder la figure localement
        plt.savefig('test_images.png')
        # Copier la figure dans Google Drive
        test_images_fig_path = f"{DRIVE_PROJECT_DIR}/test_images.png"
        shutil.copy('test_images.png', test_images_fig_path)
        print(f"Figure des images de test sauvegardée dans Google Drive: {test_images_fig_path}")

# Visualiser les images de test
visualize_test_images()

## 8. Chargement du modèle

Chargeons le modèle à deux étapes que nous avons entraîné précédemment.

In [None]:
def load_two_stage_model():
    """Charge le modèle à deux étapes à partir des fichiers sauvegardés."""
    # Vérifier si les fichiers nécessaires existent
    model_info_path = os.path.join(MODELS_DIR, 'two_stage_model_info.json')
    detection_model_path = os.path.join(MODELS_DIR, 'detection_best_acc.pth')
    classification_model_path = os.path.join(MODELS_DIR, 'classification_best_acc.pth')
    
    if not os.path.exists(model_info_path):
        raise FileNotFoundError(f"Le fichier d'informations du modèle n'existe pas: {model_info_path}")
    if not os.path.exists(detection_model_path):
        raise FileNotFoundError(f"Le fichier du modèle de détection n'existe pas: {detection_model_path}")
    if not os.path.exists(classification_model_path):
        raise FileNotFoundError(f"Le fichier du modèle de classification n'existe pas: {classification_model_path}")
    
    # Charger les informations du modèle
    with open(model_info_path, 'r') as f:
        model_info = json.load(f)
    
    # Extraire les informations
    detection_classes = model_info['detection_classes']
    classification_classes = model_info['classification_classes']
    model_architecture_info = model_info['model_info']
    
    # Créer les modèles
    detection_model = get_model(
        model_name=model_architecture_info['detection_model']['base_model'].split('_')[0] if '_' in model_architecture_info['detection_model']['base_model'] else 'standard',
        num_classes=len(detection_classes),
        base_model=model_architecture_info['detection_model']['base_model'].split('_')[1] if '_' in model_architecture_info['detection_model']['base_model'] else model_architecture_info['detection_model']['base_model'],
        pretrained=False
    )
    
    classification_model = get_model(
        model_name=model_architecture_info['classification_model']['base_model'].split('_')[0] if '_' in model_architecture_info['classification_model']['base_model'] else 'standard',
        num_classes=len(classification_classes),
        base_model=model_architecture_info['classification_model']['base_model'].split('_')[1] if '_' in model_architecture_info['classification_model']['base_model'] else model_architecture_info['classification_model']['base_model'],
        pretrained=False
    )
    
    # Charger les poids
    detection_model.load_state_dict(torch.load(detection_model_path, map_location=device))
    classification_model.load_state_dict(torch.load(classification_model_path, map_location=device))
    
    # Créer le modèle à deux étapes
    two_stage_model = TwoStageModel(
        detection_model, 
        classification_model, 
        detection_threshold=model_architecture_info['detection_threshold'] if 'detection_threshold' in model_architecture_info else 0.7
    )
    
    return two_stage_model, detection_classes, classification_classes

# Charger le modèle
try:
    model, detection_classes, classification_classes = load_two_stage_model()
    model.detection_model.to(device)
    model.classification_model.to(device)
    
    print("Modèle à deux étapes chargé avec succès!")
    print(f"Classes de détection: {detection_classes}")
    print(f"Classes de classification: {classification_classes}")
except Exception as e:
    print(f"Erreur lors du chargement du modèle: {e}")
    print("\nSi vous n'avez pas encore entraîné le modèle, veuillez d'abord exécuter le notebook d'entraînement.")
    
    # Créer des classes fictives pour pouvoir continuer le notebook
    detection_classes = ['plum', 'non_plum']
    classification_classes = ['bruised', 'cracked', 'rotten', 'spotted', 'unaffected', 'unripe']
    print("\nUtilisation de classes fictives pour la démonstration:")
    print(f"Classes de détection: {detection_classes}")
    print(f"Classes de classification: {classification_classes}")

## 9. Prédiction sur une image individuelle

Testons notre modèle sur une image individuelle.

In [None]:
def predict_single_image(model, img_path, detection_classes, classification_classes):
    """Prédit la classe d'une image individuelle."""
    # Vérifier si le fichier existe
    if not os.path.exists(img_path):
        print(f"Le fichier {img_path} n'existe pas.")
        return None, None, None
    
    # Charger et prétraiter l'image
    img = Image.open(img_path).convert('RGB')
    img_tensor = preprocess_single_image(img, IMG_SIZE)
    img_tensor = img_tensor.unsqueeze(0).to(device)  # Ajouter la dimension du batch
    
    # Passer en mode évaluation
    model.detection_model.eval()
    model.classification_model.eval()
    
    # Prédire
    with torch.no_grad():
        # Prédiction de détection
        detection_output = model.detection_model(img_tensor)
        detection_probs = torch.nn.functional.softmax(detection_output, dim=1)
        detection_pred = torch.argmax(detection_probs, dim=1).item()
        detection_prob = detection_probs[0, detection_pred].item()
        
        # Si c'est une prune, prédire la classe
        if detection_classes[detection_pred] == 'plum' and detection_prob >= model.detection_threshold:
            # Prédiction de classification
            classification_output = model.classification_model(img_tensor)
            classification_probs = torch.nn.functional.softmax(classification_output, dim=1)
            classification_pred = torch.argmax(classification_probs, dim=1).item()
            classification_prob = classification_probs[0, classification_pred].item()
            
            return detection_classes[detection_pred], classification_classes[classification_pred], {
                'detection_prob': detection_prob,
                'classification_prob': classification_prob,
                'detection_probs': detection_probs.cpu().numpy()[0],
                'classification_probs': classification_probs.cpu().numpy()[0]
            }
        else:
            return detection_classes[detection_pred], None, {
                'detection_prob': detection_prob,
                'detection_probs': detection_probs.cpu().numpy()[0]
            }

def visualize_prediction(img_path, detection_pred, classification_pred, probs):
    """Visualise l'image avec sa prédiction."""
    # Charger l'image
    img = Image.open(img_path).convert('RGB')
    
    # Créer la figure
    plt.figure(figsize=(10, 6))
    
    # Afficher l'image
    plt.subplot(1, 2, 1)
    plt.imshow(img)
    plt.title("Image de test")
    plt.axis('off')
    
    # Afficher les prédictions
    plt.subplot(1, 2, 2)
    plt.axis('off')
    
    # Texte de prédiction
    text = f"Détection: {detection_pred} ({probs['detection_prob']:.2f})\n"
    if classification_pred is not None:
        text += f"Classification: {classification_pred} ({probs['classification_prob']:.2f})"
    else:
        text += "Classification: N/A"
    
    plt.text(0.1, 0.5, text, fontsize=12)
    
    # Afficher les probabilités de détection
    if 'detection_probs' in probs:
        plt.figure(figsize=(10, 4))
        plt.subplot(1, 2, 1)
        plt.bar(detection_classes, probs['detection_probs'])
        plt.title("Probabilités de détection")
        plt.xticks(rotation=45)
        
        # Afficher les probabilités de classification si disponibles
        if 'classification_probs' in probs:
            plt.subplot(1, 2, 2)
            plt.bar(classification_classes, probs['classification_probs'])
            plt.title("Probabilités de classification")
            plt.xticks(rotation=45)
    
    plt.tight_layout()
    plt.show()
    
    # Sauvegarder les figures dans Google Drive si nous sommes dans Colab
    if IN_COLAB:
        # Sauvegarder la figure localement
        plt.savefig('prediction_result.png')
        # Copier la figure dans Google Drive
        prediction_fig_path = f"{DRIVE_PROJECT_DIR}/prediction_result.png"
        shutil.copy('prediction_result.png', prediction_fig_path)
        print(f"Figure de prédiction sauvegardée dans Google Drive: {prediction_fig_path}")

# Tester le modèle sur une image individuelle
if 'model' in locals():
    # Obtenir la liste des images de test
    test_images = [f for f in os.listdir(TEST_IMAGES_DIR) if os.path.isfile(os.path.join(TEST_IMAGES_DIR, f)) and f.lower().endswith(('.png', '.jpg', '.jpeg'))]
    if test_images:
        # Sélectionner une image aléatoire
        test_img = random.choice(test_images)
        test_img_path = os.path.join(TEST_IMAGES_DIR, test_img)
        
        print(f"Test du modèle sur l'image: {test_img}")
        detection_pred, classification_pred, probs = predict_single_image(model, test_img_path, detection_classes, classification_classes)
        
        if detection_pred is not None:
            print(f"Prédiction de détection: {detection_pred} (probabilité: {probs['detection_prob']:.2f})")
            if classification_pred is not None:
                print(f"Prédiction de classification: {classification_pred} (probabilité: {probs['classification_prob']:.2f})")
            else:
                print("Prédiction de classification: N/A")
            
            # Visualiser la prédiction
            visualize_prediction(test_img_path, detection_pred, classification_pred, probs)
        else:
            print("Erreur lors de la prédiction.")
    else:
        print("Aucune image de test trouvée.")

## 10. Prédiction sur toutes les images de test

Testons notre modèle sur toutes les images de test.

In [None]:
def predict_all_test_images(model, test_dir, detection_classes, classification_classes):
    """Prédit la classe de toutes les images de test."""
    # Obtenir la liste des images de test
    test_images = [f for f in os.listdir(test_dir) if os.path.isfile(os.path.join(test_dir, f)) and f.lower().endswith(('.png', '.jpg', '.jpeg'))]
    if not test_images:
        print("Aucune image de test trouvée.")
        return None
    
    # Prédire pour chaque image
    results = []
    for img_name in test_images:
        img_path = os.path.join(test_dir, img_name)
        
        # Extraire la vraie classe à partir du nom de fichier
        true_class = None
        for cls in classification_classes:
            if cls in img_name:
                true_class = cls
                break
        
        if 'non_plum' in img_name:
            true_detection = 'non_plum'
            true_class = None
        else:
            true_detection = 'plum'
        
        # Prédire
        detection_pred, classification_pred, probs = predict_single_image(model, img_path, detection_classes, classification_classes)
        
        # Ajouter aux résultats
        results.append({
            'img_name': img_name,
            'img_path': img_path,
            'true_detection': true_detection,
            'true_class': true_class,
            'detection_pred': detection_pred,
            'classification_pred': classification_pred,
            'probs': probs
        })
    
    return results

def visualize_test_results(results):
    """Visualise les résultats des prédictions sur les images de test."""
    if not results:
        print("Aucun résultat à visualiser.")
        return
    
    # Calculer les métriques de détection
    detection_correct = sum(1 for r in results if r['true_detection'] == r['detection_pred'])
    detection_accuracy = detection_correct / len(results)
    
    # Calculer les métriques de classification
    classification_results = [r for r in results if r['true_detection'] == 'plum' and r['detection_pred'] == 'plum']
    classification_correct = sum(1 for r in classification_results if r['true_class'] == r['classification_pred'])
    classification_accuracy = classification_correct / len(classification_results) if classification_results else 0
    
    # Afficher les métriques
    print(f"Résultats sur {len(results)} images de test:")
    print(f"Précision de détection: {detection_accuracy:.2f} ({detection_correct}/{len(results)})")
    print(f"Précision de classification: {classification_accuracy:.2f} ({classification_correct}/{len(classification_results)})")
    
    # Créer une matrice de confusion pour la détection
    detection_true = [r['true_detection'] for r in results]
    detection_pred = [r['detection_pred'] for r in results]
    detection_classes_unique = sorted(list(set(detection_true + detection_pred)))
    
    detection_cm = confusion_matrix(detection_true, detection_pred, labels=detection_classes_unique)
    
    plt.figure(figsize=(10, 8))
    plt.subplot(2, 1, 1)
    sns.heatmap(detection_cm, annot=True, fmt='d', cmap='Blues', xticklabels=detection_classes_unique, yticklabels=detection_classes_unique)
    plt.title('Matrice de confusion - Détection')
    plt.ylabel('Vraie classe')
    plt.xlabel('Classe prédite')
    
    # Créer une matrice de confusion pour la classification
    if classification_results:
        classification_true = [r['true_class'] for r in classification_results]
        classification_pred = [r['classification_pred'] for r in classification_results]
        classification_classes_unique = sorted(list(set([c for c in classification_true + classification_pred if c is not None])))
        
        classification_cm = confusion_matrix(classification_true, classification_pred, labels=classification_classes_unique)
        
        plt.subplot(2, 1, 2)
        sns.heatmap(classification_cm, annot=True, fmt='d', cmap='Blues', xticklabels=classification_classes_unique, yticklabels=classification_classes_unique)
        plt.title('Matrice de confusion - Classification')
        plt.ylabel('Vraie classe')
        plt.xlabel('Classe prédite')
    
    plt.tight_layout()
    plt.show()
    
    # Sauvegarder la figure dans Google Drive si nous sommes dans Colab
    if IN_COLAB:
        # Sauvegarder la figure localement
        plt.savefig('confusion_matrices.png')
        # Copier la figure dans Google Drive
        confusion_matrices_path = f"{DRIVE_PROJECT_DIR}/confusion_matrices.png"
        shutil.copy('confusion_matrices.png', confusion_matrices_path)
        print(f"Matrices de confusion sauvegardées dans Google Drive: {confusion_matrices_path}")
    
    # Afficher quelques exemples de prédictions
    num_examples = min(5, len(results))
    plt.figure(figsize=(15, 4 * num_examples))
    
    for i in range(num_examples):
        result = results[i]
        img = Image.open(result['img_path']).convert('RGB')
        
        plt.subplot(num_examples, 2, 2*i + 1)
        plt.imshow(img)
        plt.title(f"Image: {result['img_name']}")
        plt.axis('off')
        
        plt.subplot(num_examples, 2, 2*i + 2)
        plt.axis('off')
        
        # Texte de prédiction
        text = f"Vraie détection: {result['true_detection']}\n"
        text += f"Prédiction de détection: {result['detection_pred']} ({result['probs']['detection_prob']:.2f})\n\n"
        
        if result['true_class'] is not None:
            text += f"Vraie classe: {result['true_class']}\n"
        else:
            text += "Vraie classe: N/A\n"
        
        if result['classification_pred'] is not None:
            text += f"Prédiction de classification: {result['classification_pred']} ({result['probs']['classification_prob']:.2f})"
        else:
            text += "Prédiction de classification: N/A"
        
        plt.text(0.1, 0.5, text, fontsize=12)
    
    plt.tight_layout()
    plt.show()
    
    # Sauvegarder la figure dans Google Drive si nous sommes dans Colab
    if IN_COLAB:
        # Sauvegarder la figure localement
        plt.savefig('prediction_examples.png')
        # Copier la figure dans Google Drive
        prediction_examples_path = f"{DRIVE_PROJECT_DIR}/prediction_examples.png"
        shutil.copy('prediction_examples.png', prediction_examples_path)
        print(f"Exemples de prédictions sauvegardés dans Google Drive: {prediction_examples_path}")
    
    # Sauvegarder les résultats dans Google Drive si nous sommes dans Colab
    if IN_COLAB:
        # Convertir les résultats en format JSON sérialisable
        serializable_results = []
        for r in results:
            serializable_result = {
                'img_name': r['img_name'],
                'true_detection': r['true_detection'],
                'true_class': r['true_class'],
                'detection_pred': r['detection_pred'],
                'classification_pred': r['classification_pred'],
                'detection_prob': r['probs']['detection_prob']
            }
            if 'classification_prob' in r['probs']:
                serializable_result['classification_prob'] = r['probs']['classification_prob']
            serializable_results.append(serializable_result)
        
        # Sauvegarder les résultats
        test_results_path = f"{DRIVE_PROJECT_DIR}/test_results.json"
        with open(test_results_path, 'w') as f:
            json.dump(serializable_results, f, indent=4)
        
        print(f"Résultats des tests sauvegardés dans Google Drive: {test_results_path}")

# Tester le modèle sur toutes les images de test
if 'model' in locals():
    print("Test du modèle sur toutes les images de test...")
    results = predict_all_test_images(model, TEST_IMAGES_DIR, detection_classes, classification_classes)
    
    if results:
        visualize_test_results(results)

## 11. Test interactif avec téléchargement d'images (pour Google Colab)

Si vous êtes dans Google Colab, vous pouvez télécharger vos propres images pour les tester.

In [None]:
if IN_COLAB and 'model' in locals():
    from google.colab import files
    
    def test_uploaded_image():
        print("Veuillez télécharger une image à tester.")
        uploaded = files.upload()
        
        for filename in uploaded.keys():
            # Sauvegarder l'image téléchargée
            img_path = os.path.join(TEST_IMAGES_DIR, filename)
            with open(img_path, 'wb') as f:
                f.write(uploaded[filename])
            
            # Sauvegarder également dans Google Drive
            drive_img_path = os.path.join(DRIVE_TEST_IMAGES_DIR, filename)
            shutil.copy(img_path, drive_img_path)
            
            print(f"Test du modèle sur l'image téléchargée: {filename}")
            detection_pred, classification_pred, probs = predict_single_image(model, img_path, detection_classes, classification_classes)
            
            if detection_pred is not None:
                print(f"Prédiction de détection: {detection_pred} (probabilité: {probs['detection_prob']:.2f})")
                if classification_pred is not None:
                    print(f"Prédiction de classification: {classification_pred} (probabilité: {probs['classification_prob']:.2f})")
                else:
                    print("Prédiction de classification: N/A")
                
                # Visualiser la prédiction
                visualize_prediction(img_path, detection_pred, classification_pred, probs)
            else:
                print("Erreur lors de la prédiction.")
    
    # Décommentez la ligne suivante pour tester avec vos propres images
    # test_uploaded_image()

## 12. Conclusion

Dans ce notebook, nous avons utilisé les fonctions existantes des modules `data_preprocessing` et `model_architecture` pour :
1. Charger les modèles entraînés dans les notebooks précédents à partir de Google Drive
2. Télécharger et préparer des images de test à partir du jeu de données Kaggle "African Plums Dataset"
3. Tester le modèle sur des images individuelles
4. Évaluer les performances du modèle sur un ensemble d'images de test
5. Tester le modèle sur des images téléchargées par l'utilisateur (dans Google Colab)
6. Sauvegarder les résultats et les figures dans Google Drive pour une utilisation ultérieure

Le modèle est maintenant prêt à être utilisé pour classifier des prunes africaines en fonction de leur qualité et de leurs défauts.