# Classification multiclasses des images d'animaux sauvages avec WildLens

## R√©sum√©
Ce notebook impl√©mente un mod√®le de classification d'images pour identifier 17 esp√®ces d'animaux sauvages. Il utilise une approche de transfer learning avec MobileNetV3Small, suivie d'un fine-tuning pour optimiser les performances.

## Informations g√©n√©rales
- **Auteur** : C√©dric Sanchez, gr√¢ce aux travaux de Laurent PISSOT
- **Date** : 12 Mai 2025
- **Statut** : **Valid√©**
- **Objectif** : Cr√©er un mod√®le de classification d'images l√©ger et performant pour l'application mobile WildLens
- **R√©f√©rences** : 
  - [Documentation MobileNetV3Small](https://docs.pytorch.org/vision/main/models/generated/torchvision.models.mobilenet_v3_small.html)
  - [Impl√©mentation PyTorch de MobileNetV3](https://pytorch.org/blog/torchvision-mobilenet-v3-implementation/)
  - [Documentation des mod√®les PyTorch](https://docs.pytorch.org/vision/0.22/models.html)
  - [PyTorch 2.6.0](https://pypi.org/project/torch/2.6.0/)

### Introduction

MobileNetV3, une architecture de pointe pour des mod√®les de deep learning efficaces con√ßus pour les appareils mobiles. Il s‚Äôagit de la troisi√®me g√©n√©ration de la famille MobileNet.

Les MobileNet sont des r√©seaux neuronaux convolutifs (CNN) l√©gers optimis√©s pour la vitesse et la pr√©cision. MobileNetV3 introduit de nouvelles am√©liorations de l‚Äôarchitecture, telles que la recherche d‚Äôarchitecture neuronale (NAS) sensible √† la plate-forme et NetAdapt, afin d‚Äôam√©liorer encore les performances.

**Qu'est-ce que MobileNet ?**<br>
MobileNet est une famille de r√©seaux neuronaux con√ßus pour une inf√©rence efficace sur les appareils mobiles et int√©gr√©s. Le MobileNetV1 original a introduit une technique appel√©e convolutions s√©parables en profondeur, qui a consid√©rablement r√©duit le nombre de calculs par rapport aux convolutions traditionnelles.

Les MobileNet sont particuli√®rement bien adapt√©s aux t√¢ches telles que la classification d‚Äôimages, la d√©tection d‚Äôobjets et la segmentation s√©mantique sur des appareils disposant d‚Äôune puissance de calcul limit√©e.

**MobileNetV1 vs V2 vs V3 : quelle est la diff√©rence ?**

**MobileNetV1** : Introduction de convolutions s√©parables en profondeur pour r√©duire le calcul et la taille du mod√®le.

**MobileNetV2** : Ajout de r√©sidus invers√©s et de goulets d‚Äô√©tranglement lin√©aires pour rendre le r√©seau plus efficace.

**MobileNetV3** : Combine le meilleur des deux versions pr√©c√©dentes et les am√©liore avec :

- NAS sensible √† la plate-forme pour optimiser l‚Äôarchitecture des processeurs mobiles.
- NetAdapt pour affiner les couches r√©seau pour plus d‚Äôefficacit√©.
- Modules Squeeze-and-Excite (SE) pour stimuler l‚Äôapprentissage des fonctionnalit√©s.
- Fonction d‚Äôactivation H-Swish pour am√©liorer l‚Äôefficacit√© du mod√®le.

## √âtape 1 : Configuration de l'environnement d'ex√©cution

Cette section initialise l'environnement de travail pour l'entra√Ænement du mod√®le :
- Importation des biblioth√®ques n√©cessaires (PyTorch, torchvision, sklearn, etc.)
- D√©finition des constantes globales pour l'entra√Ænement
- Configuration d'un timer pour mesurer les performances d'ex√©cution

### Param√®tres principaux
- **IMG_SIZE** : Taille des images d'entr√©e (224x224 pixels)
- **BATCH_SIZE** : Nombre d'images trait√©es par lot (32)
- **LR** : Taux d'apprentissage initial (0.001)
- **NB_EPOCHS** : Nombre d'√©poques d'entra√Ænement (10)
- **NB_CLASSES** : Nombre de classes √† pr√©dire (17 esp√®ces d'animaux)

In [None]:
import time

from IPython.core.magic import register_cell_magic

debut_notebook = time.time()
from ML.utils.utils import afficher_matrice_confusion
from ML.utils.utils import generer_rapport_classification
from ML.utils.utils import afficher_courbes_entrainement
from pathlib import Path

import torchvision.models as models
import os
import pandas as pd
from PIL import ImageStat
from PIL import Image
from sqlalchemy import create_engine
from torch.utils.data import Dataset, DataLoader
import torch
import torch.nn as nn
import torch.optim as optim
import matplotlib.pyplot as plt

@register_cell_magic
def timer(line, cell):
    start = time.time()
    exec(cell, globals())
    end = time.time()
    print(f"‚è± Temps d'ex√©cution de la cellule : {end - start:.2f} secondes")

# D√©finition des hyperparam√®tres pour l'entra√Ænement
IMG_SIZE = 224
BATCH_SIZE = 32
LR = 0.001
NB_EPOCHS = 20
NB_FINE_EPOCHS = 20
NB_CLASSES = 17

# D√©tection d'images de qualit√© douteuse
Cette cellule analyse le jeu de donn√©es pour d√©tecter les images qui pourraient √™tre probl√©matiques pour l'entra√Ænement du mod√®le.


## Fonctionnement
1. Parcours du dataset : Exploration de chaque classe d'image (sous-dossiers)
2. Analyse statistique : Conversion en niveaux de gris et calcul de deux indicateurs cl√©s:
    - `luminosit√©` : luminosit√© moyenne de l'image
    - `stddev` : √©cart-type (mesure du contraste)
3. D√©tection : Une image est marqu√©e comme "suspecte" si:
luminosit√© < 40 (trop sombre)
stddev < 10 (contraste insuffisant)
## R√©sultats
- D√©compte des images suspectes (total et par classe)
- Cr√©ation d'un DataFrame avec toutes les statistiques pour analyse ult√©rieure
Cette analyse permet d'identifier les images de mauvaise qualit√© qui pourraient nuire √† l'apprentissage du mod√®le.

In [None]:
%%time

# R√©pertoire des donn√©es
data_dir = "../ETL/ressource/image/augmented_train"

# Initialisation des r√©sultats
results = []

# Parcours des sous-dossiers (une classe = un dossier)
for class_name in os.listdir(data_dir):
    class_path = os.path.join(data_dir, class_name)
    if not os.path.isdir(class_path):
        continue  # ignorer les fichiers

    for img_file in os.listdir(class_path):
        img_path = os.path.join(class_path, img_file)
        try:
            img = Image.open(img_path).convert("L")
            stat = ImageStat.Stat(img)
            brightness = stat.mean[0]
            stddev = stat.stddev[0]

            results.append({
                "chemin": img_path,
                "classe": class_name,
                "luminosite": brightness,
                "stddev": stddev,
                "suspecte": brightness < 40 or stddev < 10
            })
        except Exception as e:
            print(f"Erreur lecture image {img_path} : {e}")

# R√©sultats sous forme de DataFrame
df = pd.DataFrame(results)
print(f"\nüìä Images suspectes d√©tect√©es : {df['suspecte'].sum()} sur {len(df)} images")

# Nombre d‚Äôimages suspectes par classe
print("\nNombre d‚Äôimages suspectes par classe :")
print(df[df['suspecte']].groupby('classe').size())

# Affichage d‚Äôun √©chant


In [None]:
# V√©rifie qu'on a d√©j√† un DataFrame `df` avec la colonne 'suspecte'
df_suspect = df[df['suspecte']].copy()
n = min(20, len(df_suspect))

if n == 0:
    print("‚úÖ Aucune image suspecte √† afficher.")
else:
    print(f"üé® Affichage de {n} image(s) suspecte(s) :")
    sample = df_suspect.sample(n=n, random_state=1)

    plt.figure(figsize=(16, 6))
    for i, row in enumerate(sample.itertuples()):
        img = Image.open(row.chemin).convert("RGB")
        plt.subplot(1, n, i + 1)
        plt.imshow(img)
        plt.axis("off")
        plt.title(f"{row.classe}\nLum: {row.luminosite:.0f} | Std: {row.stddev:.0f}")
    plt.tight_layout()
    plt.show()


# D√©tection d'empreintes dans la neige

Cette cellule identifie les images contenant probablement de la neige gr√¢ce √† deux crit√®res colorim√©triques : la pr√©sence de pixels blancs purs (`seuil_blanc`) et la dominance de la composante bleue (`bleu_dominant`). Les images d√©tect√©es sont ensuite ajout√©es au DataFrame avec un marqueur `neige_v2` et visualis√©es pour v√©rification.

In [None]:
# D√©tection am√©lior√©e d'empreintes dans la neige avec filtre sur "blanc pur" et "bleu dominant"
from PIL import Image
import numpy as np
import matplotlib.pyplot as plt

def est_neigeuse_avancee(img_path, seuil_blanc=230, ratio_blanc_min=0.2, ratio_bleu_dominant=0.6):
    try:
        img = Image.open(img_path).convert('RGB').resize((128, 128))
        arr = np.asarray(img).astype(np.float32)

        # D√©tection de "pixels blancs purs"
        masque_blanc = (arr[..., 0] > seuil_blanc) & (arr[..., 1] > seuil_blanc) & (arr[..., 2] > seuil_blanc)
        ratio_blanc = masque_blanc.sum() / (128 * 128)

        # D√©tection de "pixels bleus dominants"
        bleu_dominant = (arr[..., 2] > arr[..., 0] + 15) & (arr[..., 2] > arr[..., 1] + 15)
        ratio_bleu = bleu_dominant.sum() / (128 * 128)

        return (ratio_blanc > ratio_blanc_min) or (ratio_bleu > ratio_bleu_dominant)

    except Exception as e:
        print(f"Erreur avec {img_path}: {e}")
        return False

# Application √† toutes les images
df['neige_v2'] = df['chemin'].apply(est_neigeuse_avancee)

# Affichage du r√©sultat
nb_detectees = df['neige_v2'].sum()
print(f"‚ùÑÔ∏è Neige d√©tect√©e (version avanc√©e) sur {nb_detectees} images / {len(df)}")

# Affichage des images (max 20)
echantillon = df[df['neige_v2']].sample(n=min(20, nb_detectees), random_state=42)

plt.figure(figsize=(31, 8))
for i, row in enumerate(echantillon.itertuples()):
    img = Image.open(row.chemin)
    plt.subplot(4, 5, i+1)
    plt.imshow(img)
    plt.title(row.classe, fontsize=9)
    plt.axis("off")
plt.suptitle("Empreintes d√©tect√©es comme dans la neige (d√©tection am√©lior√©e)", fontsize=14)
plt.tight_layout()
plt.show()



### **Documentation**

Cette transformation normalise les valeurs des pixels de l'image en utilisant la moyenne et l'√©cart-type par canal (R, G, B) calcul√©s sur ImageNet.

### **Fonctionnement :**


- Pour chaque pixel et canal:

    ` pixel_normalis√© = (pixel_original - moyenne) / √©cart_type`

* Canal R: `(R - 0.485) / 0.229`
* Canal G: `(G - 0.456) / 0.224`
* Canal B: `(B - 0.406) / 0.225`

Pourquoi ces valeurs? Ces moyennes et √©carts-types correspondent aux statistiques d'ImageNet, le dataset sur lequel MobileNetV3 a √©t√© pr√©-entra√Æn√©.

### Avantages:

* Acc√©l√®re la convergence de l'entra√Ænement
* Am√©liore la pr√©cision des pr√©dictions
* N√©cessaire pour utiliser correctement les mod√®les pr√©-entra√Æn√©s

In [None]:
from torchvision import transforms

# Transformations standards pour MobileNetV3
transform_train = transforms.Compose([
    transforms.Resize((224, 224)),  # redimensionnement obligatoire
    transforms.ToTensor(),
    transforms.Normalize(mean=[0.485, 0.456, 0.406],
                         std=[0.229, 0.224, 0.225])
])

# Pas d‚Äôaugmentation, donc m√™mes transformations pour val/test
transform_val = transform_train
transform_test = transform_train

# Pr√©paration des donn√©es pour le mod√®le de classification
Ce code effectue le chargement et la pr√©paration des donn√©es d'images depuis la base de donn√©es MySQL pour le mod√®le de classification d'empreintes d'animaux.

Le code r√©alise quatre op√©rations principales:


1. Chargement des donn√©es depuis la base MySQL et fusion des tables d'images et d'√©tiquettes
2. Conversion des ID d'esp√®ces en indices num√©riques s√©quentiels (0, 1, 2...) n√©cessaires pour l'entra√Ænement
3. Cr√©ation de la colonne label_class qui servira d'√©tiquette pour le mod√®le d'apprentissage
4. Division des donn√©es en trois ensembles distincts selon la valeur de id_etat (1=train, 2=validation, 3=test)

In [None]:
engine = create_engine("mysql+pymysql://root:root@localhost:3306/wildlens")
df_all = pd.read_sql("SELECT * FROM wildlens_images", engine)
df_labels = pd.read_sql("SELECT id_espece, nom_fr FROM wildlens_facts", engine)
df_all = pd.merge(df_all, df_labels, on="id_espece", how="left")

# √âtape 1 : r√©cup√©rer les ID d'esp√®ce uniques (par s√©curit√©)
unique_species_ids = sorted(df_all['id_espece'].unique())

# √âtape 2 : dictionnaire de mappage
id_to_class = {id_: idx for idx, id_ in enumerate(unique_species_ids)}

# √âtape 3 : conversion dans le DataFrame
df_all['label_class'] = df_all['id_espece'].map(id_to_class)

# Split + copie propre
train_df = df_all[df_all["id_etat"] == 1].copy()
val_df = df_all[df_all["id_etat"] == 2].copy()
test_df = df_all[df_all["id_etat"] == 3].copy()

In [None]:
# train_df.to_json("train_df.json", orient="records", lines=True)
# val_df.to_json("val_df.json", orient="records", lines=True)
# test_df.to_json("test_df.json", orient="records", lines=True)

# train_df = pd.read_json("train_df.json", lines=True)
# val_df = pd.read_json("val_df.json", lines=True)
# test_df = pd.read_json("test_df.json", lines=True)


##  WildLensDataset

Cette classe h√©rite de `torch.utils.data.Dataset` et permet de charger des images √† partir d‚Äôun DataFrame.

###  Param√®tres
- `dataframe` *(pd.DataFrame)* : table contenant les colonnes `image` (chemin relatif) et `label_class` (√©tiquette).
- `base_path` *(str ou Path)* : dossier racine contenant les images.
- `transform` *(callable, optionnel)* : transformations √† appliquer aux images (ex : redimensionnement, normalisation).

###  M√©thodes
- `__len__()` : retourne le nombre d‚Äô√©l√©ments dans le dataset.
- `__getitem__(idx)` :
  - Charge l‚Äôimage et le label correspondant √† l‚Äôindice `idx`.
  - V√©rifie que l‚Äôindice est valide.
  - Applique les transformations si sp√©cifi√©es.

###  Gestion des erreurs
- Conversion s√©curis√©e de l‚Äôindex (`int`, `Tensor`, `tuple`, etc.)
- Messages explicites en cas de probl√®me d‚Äôacc√®s au DataFrame ou d‚Äôouverture de fichier image.


In [None]:
class WildLensDataset(Dataset):
    def __init__(self, dataframe, base_path, transform=None):
        self.df = dataframe.reset_index(drop=True)
        self.base_path = Path(base_path)
        self.transform = transform


    def __len__(self):
        return len(self.df)

    def __getitem__(self, idx):
        # Forcer index entier (r√©sout 90% des cas)
        if isinstance(idx, torch.Tensor):
            idx = idx.item()
        elif isinstance(idx, (list, tuple)):
            idx = idx[0]

        #  Debug temporaire : afficher l'index et taille max
        if idx >= len(self.df):
            raise IndexError(f"Index {idx} hors limites (longueur dataset : {len(self.df)})")

        try:
            row = self.df.iloc[int(idx)]
        except Exception as e:
            print(f"Erreur √† l'acc√®s iloc[{idx}]")
            raise e

        image_path_bdd = self.base_path / row["image"]
        label = row["label_class"]

        try:
            image_bdd = Image.open(image_path_bdd).convert("RGB")
        except Exception as e:
            print(f"Erreur d'ouverture d'image : {image_path_bdd}")
            raise e

        if self.transform:
            image_bdd = self.transform(image_bdd)
        return image_bdd, label

In [None]:
# train_dataset est un objet PyTorch, une interface permettant de charger dynamiquement les images et labels pour l‚Äôentra√Ænement

# Cr√©er les datasets avec la classe WildLensDataset
train_dataset = WildLensDataset(train_df, "../ETL/ressource/image/augmented_train", transform_train)
val_dataset = WildLensDataset(val_df, "../ETL/ressource/image/augmented_train", transform_val)
test_dataset = WildLensDataset(test_df, "../ETL/ressource/image/augmented_train", transform_test)

# Cr√©er les DataLoaders avec les bons datasets
BATCH_SIZE = 32
train_loader = DataLoader(train_dataset, batch_size=BATCH_SIZE, shuffle=True)
val_loader = DataLoader(val_dataset, batch_size=BATCH_SIZE, shuffle=False)
test_loader = DataLoader(test_dataset, batch_size=BATCH_SIZE, shuffle=False)

In [None]:
from ML.utils.utils import afficher_echantillon

afficher_echantillon(train_df, df_all)

## √âtape 5 : Entra√Ænement du mod√®le

Cette section couvre le processus d'entra√Ænement du mod√®le MobileNetV3 sur notre dataset d'animaux sauvages :

### Strat√©gie d'entra√Ænement
- **Fonction de perte** : Cross-Entropy Loss, adapt√©e aux probl√®mes de classification multi-classes
- **Optimiseur** : Adam avec un taux d'apprentissage de 0.001
- **Nombre d'√©poques** : 20 passages complets sur l'ensemble d'entra√Ænement
- **Sauvegarde du mod√®le** : Conservation du mod√®le avec la meilleure pr√©cision sur l'ensemble de validation

### Suivi des performances
- Calcul et affichage de la perte (loss) et de la pr√©cision (accuracy) √† chaque √©poque
- √âvaluation sur l'ensemble de validation pour d√©tecter le surapprentissage
- Visualisation de l'√©volution des m√©triques avec des graphiques

### R√©sultats attendus
L'entra√Ænement devrait montrer une diminution progressive de la perte et une augmentation de la pr√©cision, avec une convergence vers les meilleures performances apr√®s plusieurs √©poques.

In [None]:
# D√©tection de l'appareil (GPU ou CPU)
device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")

# Cr√©ation du mod√®le (avec les bons poids pr√©-entra√Æn√©s)
mobilenet_v3 = models.mobilenet_v3_small(weights=models.MobileNet_V3_Small_Weights.DEFAULT)

# Modification de la derni√®re couche pour correspondre au nombre de classes de notre jeu de donn√©es
mobilenet_v3.classifier[3] = nn.Linear(mobilenet_v3.classifier[3].in_features, NB_CLASSES)
mobilenet_v3 = mobilenet_v3.to(device)

# Fonction de co√ªt et optimiseur
criterion = nn.CrossEntropyLoss()
optimizer = optim.Adam(mobilenet_v3.parameters(), lr=LR)

# Initialisation des listes pour le suivi
train_losses = []
val_losses = []
train_accuracies = []
val_accuracies = []
best_val_acc = 0

for epoch in range(NB_EPOCHS):
    mobilenet_v3.train()
    running_loss, correct, total = 0.0, 0, 0

    for inputs, labels in train_loader:
        inputs, labels = inputs.to(device), labels.to(device)

        optimizer.zero_grad()
        outputs = mobilenet_v3(inputs)
        loss = criterion(outputs, labels)
        loss.backward()
        optimizer.step()

        running_loss += loss.item()
        _, predicted = torch.max(outputs, 1)
        total += labels.size(0)
        correct += (predicted == labels).sum().item()

    epoch_loss = running_loss / len(train_loader)
    epoch_accuracy = 100 * correct / total

    # √âvaluation sur validation
    mobilenet_v3.eval()
    correct_val, total_val, val_running_loss = 0, 0, 0.0
    with torch.no_grad():
        for inputs, labels in val_loader:
            inputs, labels = inputs.to(device), labels.to(device)
            outputs = mobilenet_v3(inputs)
            loss = criterion(outputs, labels)
            val_running_loss += loss.item()

            _, predicted = torch.max(outputs, 1)
            total_val += labels.size(0)
            correct_val += (predicted == labels).sum().item()

    val_accuracy = 100 * correct_val / total_val
    val_loss = val_running_loss / len(val_loader)

    # Sauvegarde du meilleur mod√®le
    if val_accuracy > best_val_acc:
        best_val_acc = val_accuracy
        torch.save(mobilenet_v3.state_dict(), "models\best_model_wildlens.pt")
        print(f"üíæ Nouveau meilleur mod√®le sauvegard√© √† l‚Äô√©poque {epoch+1} (val_acc = {val_accuracy:.2f}%)")

    # Journalisation
    train_losses.append(epoch_loss)
    val_losses.append(val_loss)
    train_accuracies.append(epoch_accuracy)
    val_accuracies.append(val_accuracy)

    print(f"Epoch {epoch+1}/{NB_EPOCHS} - Loss: {epoch_loss:.4f} - Val Loss: {val_loss:.4f} - "
          f"Train Acc: {epoch_accuracy:.2f}% - Val Acc: {val_accuracy:.2f}%")


In [None]:
print(train_losses[:5])
print(train_accuracies[:5])
print(val_accuracies[:5])


In [None]:
afficher_courbes_entrainement(
    train_losses=train_losses,
    train_accuracies=train_accuracies,
    val_losses=val_losses,
    val_accuracies=val_accuracies,
    titre="Courbes d'entra√Ænement du mod√®le MobileNetV3"
)


In [None]:
# Mapping label_class (entier 0 ‚Üí 16) vers nom_fr
idx_to_label = {
    id_to_class[id_espece]: nom_fr
    for id_espece, nom_fr in zip(df_labels["id_espece"], df_labels["nom_fr"])
}

print(idx_to_label)


In [None]:


# Chargement du mod√®le entra√Æn√©
mobilenet_v3.load_state_dict(torch.load("models\best_model_wildlens.pt"))
mobilenet_v3.eval()

# √âvaluation sur test set
correct_test, total_test = 0, 0
true_test, pred_test = [], []

with torch.no_grad():
    for inputs, labels in test_loader:
        inputs, labels = inputs.to(device), labels.to(device)
        outputs = mobilenet_v3(inputs)
        _, predicted = torch.max(outputs, 1)

        total_test += labels.size(0)
        correct_test += (predicted == labels).sum().item()

        true_test.extend(labels.cpu().numpy())
        pred_test.extend(predicted.cpu().numpy())

test_accuracy = 100 * correct_test / total_test
print(f"‚úÖ Accuracy finale sur le jeu de test : {test_accuracy:.2f}%")


In [None]:
afficher_matrice_confusion(true_test, pred_test, idx_to_label)

In [None]:
generer_rapport_classification(true_test, pred_test, idx_to_label)

## üìä Interpr√©tation du tableau de classification par classe

Ce tableau r√©sume les performances du mod√®le pour chaque classe du jeu de test. Il comporte les colonnes suivantes :

- **Classe** : le nom de l'esp√®ce (ou cat√©gorie) √©valu√©e.

- **Pr√©cision (`precision`)** :
  - D√©finition : proportion des pr√©dictions correctes parmi toutes les pr√©dictions faites pour cette classe.
  - Exemple : Si le mod√®le pr√©dit 10 fois "chat", mais que seulement 5 sont correctes, la pr√©cision est 0.50.
  - Interpr√©tation : plus la pr√©cision est √©lev√©e, moins le mod√®le fait de **faux positifs** pour cette classe.

- **Rappel (`recall`)** :
  - D√©finition : proportion des images de cette classe correctement identifi√©es parmi toutes les images r√©ellement de cette classe.
  - Exemple : Si 10 "chat" sont pr√©sents dans les donn√©es, mais que le mod√®le n'en d√©tecte que 4, le rappel est 0.40.
  - Interpr√©tation : plus le rappel est √©lev√©, moins il y a de **faux n√©gatifs**.

- **F1-score (`f1-score`)** :
  - D√©finition : moyenne harmonique entre la pr√©cision et le rappel.
  - Formule : `2 * (precision * recall) / (precision + recall)`
  - Interpr√©tation : mesure globale de la performance, utile quand les classes sont d√©s√©quilibr√©es.
  - Un bon F1-score indique un bon compromis entre peu de faux positifs et peu de faux n√©gatifs.

- **Support (`support`)** :
  - D√©finition : nombre d‚Äô√©chantillons r√©els de cette classe dans le jeu de test.
  - Utile pour interpr√©ter le poids d‚Äôune classe dans l‚Äô√©valuation globale.

---

### Exemple : classe `"Chat"`

- Pr√©cision : 0.45 ‚Üí sur 100 pr√©dictions "chat", 45 √©taient correctes
- Rappel : 0.43 ‚Üí sur 100 vraies empreintes de chat, 43 ont √©t√© reconnues
- F1-score : 0.44 ‚Üí performance globale moyenne
- Support : 23 ‚Üí 23 images de chat dans le test

Cela montre que le mod√®le a du mal avec cette classe (empreintes trop vari√©es ou peu distinctives).



## √âtape 6 : √âvaluation du mod√®le

Cette section √©value les performances du mod√®le entra√Æn√© sur diff√©rents ensembles de donn√©es :

### M√©triques d'√©valuation
- **Accuracy** : Pourcentage d'images correctement classifi√©es
- **Matrice de confusion** : Visualisation d√©taill√©e des pr√©dictions par classe
- **Analyse des erreurs** : Identification des classes souvent confondues

### Processus d'√©valuation
1. √âvaluation sur l'ensemble d'entra√Ænement pour v√©rifier l'apprentissage
2. √âvaluation sur l'ensemble de test pour mesurer la g√©n√©ralisation
3. Visualisation des r√©sultats avec une matrice de confusion

### Interpr√©tation des r√©sultats
Les performances sur l'ensemble de test refl√®tent la capacit√© du mod√®le √† g√©n√©raliser √† de nouvelles images. Une diff√©rence importante entre les performances sur l'entra√Ænement et le test peut indiquer un surapprentissage.

In [None]:
%%timer

mobilenet_v3.eval()

correct, total = 0, 0
with torch.no_grad():
    for inputs, labels in train_loader:
        outputs = mobilenet_v3(inputs)
        _, predicted = torch.max(outputs.data, 1)
        total += labels.size(0)
        correct += (predicted == labels).sum().item()
accuracy = 100 * correct / total
print(f'Train Accuracy: {accuracy:.2f}%')

* Mesure des performances en TEST en it√©rant sur les donn√©es du dataset `test_loader` :

In [None]:
%%timer

correct, total = 0, 0
with torch.no_grad():
    for inputs, labels in test_loader:
        predictions = mobilenet_v3(inputs)
        predicted = torch.argmax(predictions, dim=1)
        total += labels.size(0)
        correct += (predicted == labels).sum().item()
test_accuracy = 100 * correct / total
print(f'Test Accuracy: {test_accuracy:.2f}%')

## √âtape 7 : Inf√©rences sur des images individuelles

Cette section d√©montre comment utiliser le mod√®le entra√Æn√© pour classifier des images individuelles :

### Processus d'inf√©rence
1. **Chargement du mod√®le** : Utilisation du meilleur mod√®le sauvegard√©
2. **Pr√©traitement de l'image** : Redimensionnement, normalisation et conversion en tenseur
3. **Pr√©diction** : Passage de l'image dans le mod√®le pour obtenir les probabilit√©s de classe
4. **Interpr√©tation** : Affichage de la classe pr√©dite et du score de confiance

### Application pratique
Cette fonctionnalit√© est essentielle pour l'application mobile WildLens, o√π les utilisateurs pourront prendre des photos d'animaux et obtenir une identification en temps r√©el. Le code pr√©sent√© ici sert de base pour l'impl√©mentation de cette fonctionnalit√© dans l'application.

* Nouvelle √©valuation globale sur les donn√©es de TEST en it√©rant manuellement sur les images physiques :

In [None]:
import random
from pathlib import Path
from PIL import Image
import torch.nn.functional as F
import torchvision.transforms as transforms
import matplotlib.pyplot as plt

# ‚úÖ Recharge le mod√®le
mobilenet_v3.load_state_dict(torch.load("models\best_model_wildlens.pt"))
mobilenet_v3.eval()

# üìÅ Base du dossier image
base_path = Path("../ETL/ressource/image/augmented_train")

# üé≤ S√©lection al√©atoire d‚Äôune classe et d‚Äôune image
all_classes = [d for d in base_path.iterdir() if d.is_dir()]
chosen_class = random.choice(all_classes)
chosen_image = random.choice(list(chosen_class.glob("*.jpg")))

print(f"üì∏ Image s√©lectionn√©e : {chosen_image}")

# üîÑ Pr√©traitement
transform = transforms.Compose([
    transforms.Resize((224, 224)),
    transforms.ToTensor(),
    transforms.Normalize(mean=[0.485, 0.456, 0.406],
                         std=[0.229, 0.224, 0.225])
])
image = Image.open(chosen_image).convert("RGB")
input_tensor = transform(image).unsqueeze(0).to(device)

# üîÆ Pr√©diction
with torch.no_grad():
    output = mobilenet_v3(input_tensor)
    probs = F.softmax(output, dim=1)
    confidence, predicted_class = torch.max(probs, dim=1)

# üñºÔ∏è Affichage image + pr√©diction
plt.imshow(image)
plt.axis('off')
plt.title(f"Pr√©diction : {idx_to_label[predicted_class.item()]}\nConfiance : {confidence.item()*100:.2f}%")
plt.show()


# Fine tuning

In [None]:
%%timer
import torch
import torch.nn as nn
import torch.optim as optim

# Rechargement du mod√®le pr√©-entra√Æn√©
mobilenet_v3 = models.mobilenet_v3_small(weights=models.MobileNet_V3_Small_Weights.DEFAULT)
mobilenet_v3.classifier[3] = nn.Linear(mobilenet_v3.classifier[3].in_features, 17)
mobilenet_v3.load_state_dict(torch.load("models\best_model_wildlens.pt"))
mobilenet_v3 = mobilenet_v3.to(device)

# D√©bloquer toutes les couches pour fine-tuning
for param in mobilenet_v3.parameters():
    param.requires_grad = True

# Optimiseur et loss
optimizer = optim.Adam(mobilenet_v3.parameters(), lr=1e-5)
criterion = nn.CrossEntropyLoss()

# Logs pour les courbes
fine_train_losses = []
fine_train_accuracies = []
fine_val_losses = []
fine_val_accuracies = []

# Boucle fine-tuning
for epoch in range(NB_FINE_EPOCHS):
    mobilenet_v3.train()
    running_loss, correct, total = 0.0, 0, 0

    for inputs, labels in train_loader:
        inputs, labels = inputs.to(device), labels.to(device)
        optimizer.zero_grad()
        outputs = mobilenet_v3(inputs)
        loss = criterion(outputs, labels)
        loss.backward()
        optimizer.step()

        running_loss += loss.item()
        _, predicted = torch.max(outputs, 1)
        total += labels.size(0)
        correct += (predicted == labels).sum().item()

    train_loss = running_loss / len(train_loader)
    train_acc = 100 * correct / total

    # Validation
    mobilenet_v3.eval()
    val_loss, val_correct, val_total = 0.0, 0, 0
    with torch.no_grad():
        for inputs, labels in val_loader:
            inputs, labels = inputs.to(device), labels.to(device)
            outputs = mobilenet_v3(inputs)
            loss = criterion(outputs, labels)
            val_loss += loss.item()
            _, predicted = torch.max(outputs, 1)
            val_total += labels.size(0)
            val_correct += (predicted == labels).sum().item()

    val_loss /= len(val_loader)
    val_acc = 100 * val_correct / val_total

    # Log
    fine_train_losses.append(train_loss)
    fine_train_accuracies.append(train_acc)
    fine_val_losses.append(val_loss)
    fine_val_accuracies.append(val_acc)

    print(f"Epoch {epoch+1}/{NB_FINE_EPOCHS} - "
          f"Train Loss: {train_loss:.4f}, Train Acc: {train_acc:.2f}% - "
          f"Val Loss: {val_loss:.4f}, Val Acc: {val_acc:.2f}%")

# Sauvegarde du mod√®le affin√©
torch.save(mobilenet_v3.state_dict(), "models\best_model_finetuned_wildlens.pt")

print("‚úÖ Fine-tuned model saved as 'best_model_finetuned_wildlens.pt'")


afficher_courbes_entrainement(
    train_losses=fine_train_losses,
    train_accuracies=fine_train_accuracies,
    val_losses=fine_val_losses,
    val_accuracies=fine_val_accuracies,
    titre="Courbes fine-tuning du mod√®le MobileNetV3"
)


In [None]:
afficher_courbes_entrainement(
    train_losses=train_losses,
    train_accuracies=train_accuracies,
    val_losses=val_losses,
    val_accuracies=val_accuracies,
    titre="Courbes d'entra√Ænement du mod√®le MobileNetV3"
)

afficher_courbes_entrainement(
    train_losses=fine_train_losses,
    train_accuracies=fine_train_accuracies,
    val_losses=fine_val_losses,
    val_accuracies=fine_val_accuracies,
    titre="Courbes fine-tuning du mod√®le MobileNetV3"
)

# √âvaluation du mod√®le fine-tun√© sur le test set
mobilenet_v3.eval()
true_labels_ft, predicted_labels_ft = [], []

with torch.no_grad():
    for inputs, labels in test_loader:
        inputs, labels = inputs.to(device), labels.to(device)
        outputs = mobilenet_v3(inputs)
        _, preds = torch.max(outputs, 1)
        true_labels_ft.extend(labels.cpu().numpy())
        predicted_labels_ft.extend(preds.cpu().numpy())

# Affichage de la matrice de confusion
afficher_matrice_confusion(
    true_labels=true_labels_ft,
    predicted_labels=predicted_labels_ft,
    idx_to_label=idx_to_label,
    titre="Matrice de confusion - Mod√®le fine-tun√©"
)

from sklearn.metrics import classification_report
print(classification_report(true_labels_ft, predicted_labels_ft,
                            target_names=[idx_to_label[i] for i in range(len(idx_to_label))]))


import time

# S'assurer que le mod√®le est bien en mode √©valuation
mobilenet_v3.eval()

# √âvaluation sur le jeu d'entra√Ænement
correct, total = 0, 0
with torch.no_grad():
    for inputs, labels in train_loader:
        inputs, labels = inputs.to(device), labels.to(device)
        outputs = mobilenet_v3(inputs)
        _, predicted = torch.max(outputs, 1)
        total += labels.size(0)
        correct += (predicted == labels).sum().item()
train_accuracy = 100 * correct / total
print(f"‚úÖ Train Accuracy apr√®s fine-tuning : {train_accuracy:.2f}%")

# √âvaluation sur le jeu de test
correct, total = 0, 0
with torch.no_grad():
    for inputs, labels in test_loader:
        inputs, labels = inputs.to(device), labels.to(device)
        predictions = mobilenet_v3(inputs)
        predicted = torch.argmax(predictions, dim=1)
        total += labels.size(0)
        correct += (predicted == labels).sum().item()
test_accuracy = 100 * correct / total
print(f"‚úÖ Test Accuracy finale : {test_accuracy:.2f}%")

In [None]:
# import torch
# import torch.nn as nn
# from torchvision import models
#
# # üì¶ Charger le mod√®le entra√Æn√© (t√™te seule)
# mobilenet_v3 = models.mobilenet_v3_small(weights=models.MobileNet_V3_Small_Weights.DEFAULT)
# mobilenet_v3.classifier[3] = nn.Linear(mobilenet_v3.classifier[3].in_features, 17)
# mobilenet_v3.load_state_dict(torch.load("best_model_wildlens.pt"))
# mobilenet_v3.eval()
#
# # üß™ Entr√©e factice pour tracer le mod√®le
# dummy_input = torch.randn(1, 3, 224, 224)
#
# # üßµ Tracer le mod√®le avec TorchScript
# scripted_model = torch.jit.trace(mobilenet_v3, dummy_input)
#
# # üíæ Sauvegarde avec nom explicite pour Android
# scripted_model.save("mobilenetv3_wildlens_android.pt")
# print("‚úÖ Mod√®le export√© pour Android : mobilenetv3_wildlens_android.pt")


In [None]:
fin_notebook = time.time()
duree_totale = fin_notebook - debut_notebook

minutes, secondes = divmod(duree_totale, 60)
print(f"‚è±Ô∏è Temps total d'ex√©cution du notebook : {int(minutes)} min {int(secondes)} sec")
