Mini-projet XAI ‚Äî **ProtoPNet (Prototypical Part Network)**
"This Looks Like That: Deep Learning for Interpretable Image Recognition"

**√âtudiant**: CHAIBOU SAIDOU Abdoulaye<br>
**Professeur**: Tawfik Masrour<br>
**Date**: 16 D√©cembre 2025<br>
**Fili√®re**: IATD-SI<br>
**Etablissement**: [ENSAM-Mekn√®s](https://ensam.umi.ac.ma)

**Remerciements**:
Ce projet est bas√© sur l'article "This Looks Like That: Deep Learning for 
Interpretable Image Recognition" (NeurIPS 2019), par Chaofan Chen*, Oscar Li*, 
Chaofan Tao, Alina Jade Barnett, Jonathan Su, et Cynthia Rudin (Duke University).
Code original: [PPNet repo](https://github.com/cfchen-duke/ProtoPNet).

**Infos**: Ce notebook pr√©sente bri√®vement la technique interpr√©table d'explication des r√©seaux de convolutifs appel√©e Prototypical Part Network par ses auteurs officiels, sous forme de mini-projet (IA Explicable) de classe. Nous utilisons egalement un mod√®le pr√©-entra√Æn√© par *Alina Jade Barnett* pour l'analyse de la methode, par soucis de simplicit√© et de gain de temps.

In [5]:
import torch
import torch.nn as nn
import torch.nn.functional as F
import torchvision
import torchvision.transforms as transforms
from torchvision import models
from torch.utils.data import DataLoader
from torchvision.datasets import ImageFolder
import numpy as np
import matplotlib.pyplot as plt
import matplotlib.patches as patches
from sklearn.metrics import accuracy_score, confusion_matrix
import seaborn as sns
from PIL import Image
import cv2
import os
from pathlib import Path
import copy

# Configuration matplotlib pour de belles visualisations
plt.rcParams['figure.figsize'] = (12, 8)
plt.rcParams['font.size'] = 10
sns.set_style("whitegrid")

print(f"PyTorch version: {torch.__version__}")
print(f"CUDA disponible: {torch.cuda.is_available()}")

# Force CPU pour stabilit√© (recommand√© pour ce projet)
device = torch.device("cpu")
print(f"Device utilis√©: {device} (mode stable)")

PyTorch version: 2.5.0+cpu
CUDA disponible: False
Device utilis√©: cpu (mode stable)


üî¥ LE PROBL√àME DES BO√éTES NOIRES :

Les r√©seaux de neurones profonds (CNN) sont extr√™mement performants pour la
classification d'images, MAIS ils sont des "bo√Ætes noires" inexplicables :

  M√©decin : "Pourquoi le mod√®le dit que c'est un cancer ?"
  CNN Classique : "ü§∑ R√©sultat = 95% cancer"
  
  Juge : "Sur quelle base le mod√®le a identifi√© cette personne ?"
  CNN Classique : "ü§∑ Confiance = 98%"

‚ùå Cons√©quences :
  - Impossible de v√©rifier le raisonnement
  - Risque de biais cach√©s
  - Manque de confiance des experts
  - Non-conforme aux r√©gulations (RGPD, FDA)

üí° LA SOLUTION PROTOPNET :

Au lieu d'une bo√Æte noire, ProtoPNet fonctionne comme l'esprit humain :
raisonnement par SIMILITUDE avec des CAS M√âMORIS√âS (prototypes).

  M√©decin : "Pourquoi cancer ?"
  ProtoPNet : "Cette r√©gion ressemble √† 85% √† ce prototype de m√©lanome,
               cette autre r√©gion ressemble √† 78% √† cet autre prototype..."
  M√©decin : ‚úÖ "Je peux v√©rifier ! Le raisonnement est correct."


## TYPE D'EXPLICATION

üìä GLOBALE + LOCALE :
  - GLOBALE : Les prototypes sont appris une fois pour toutes les classes
  - LOCALE : Chaque pr√©diction s'explique par similarit√© aux prototypes

üñºÔ∏è DOMAINE D'APPLICATION : IMAGES / CNN
  - Classification d'oiseaux (dataset CUB-200)
  - Diagnostic m√©dical (dermatologie, radiologie)
  - Contr√¥le qualit√© industriel
  - Toute t√¢che de classification fine-grained

üéØ AVANTAGE CL√â : INTERPR√âTABILIT√â INTRINS√àQUE

Contrairement √† LIME, SHAP, Grad-CAM (m√©thodes POST-HOC qui approximent),
ProtoPNet est INTRINS√àQUEMENT INTERPR√âTABLE :
  - L'explication fait partie de l'architecture
  - Pas d'approximation
  - Fid√©lit√© garantie √† 100%

## ANALOGIE HUMAINE

Imaginez que vous apprenez √† reconna√Ætre des oiseaux :

1Ô∏è‚É£ PHASE D'APPRENTISSAGE (m√©morisation de prototypes) :
   
   Vous voyez beaucoup d'oiseaux et m√©morisez des CARACT√âRISTIQUES TYPIQUES :
   ```
   üê¶ Cardinals :
      ‚Üí Prototype A : "cr√™te rouge vif caract√©ristique"
      ‚Üí Prototype B : "bec orange pointu"
      ‚Üí Prototype C : "masque noir autour des yeux"
   
   üê¶ Geais bleus :
      ‚Üí Prototype D : "plumes bleues brillantes"
      ‚Üí Prototype E : "bande noire sur la t√™te"
      ‚Üí Prototype F : "bout des ailes blanc"
```
2Ô∏è‚É£ PHASE DE RECONNAISSANCE (nouvelle image) :
   
   Vous voyez un nouvel oiseau inconnu :
   
   
   | üê¶ Oiseau myst√®re |
|------------------|
| ‚úì Cette partie ressemble beaucoup au **Prototype A** |
| ‚úì Cette autre partie ressemble au **Prototype B** |
| ‚úó Pas de similarit√© avec les prototypes de **geai bleu** |

   
   CONCLUSION : "C'est probablement un cardinal !"

3Ô∏è‚É£ EXPLICATION :
   
   Si on vous demande "Pourquoi cardinal ?" :
   ```
   ‚Üí "Parce que sa cr√™te ressemble au Prototype A (85% similaire)"
   ‚Üí "Et son bec ressemble au Prototype B (78% similaire)"
   ```

## C'EST EXACTEMENT CE QUE FAIT PROTOPNET !

üèóÔ∏è ARCHITECTURE EN 3 √âTAPES :
```
   ‚îå‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îê
   ‚îÇ  Image Input    ‚îÇ  üì∏ Exemple : photo d'oiseau 224√ó224√ó3
   ‚îÇ  (224√ó224√ó3)    ‚îÇ
   ‚îî‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚î¨‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îò
            ‚îÇ
            ‚ñº
   ‚îå‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îê
   ‚îÇ  CNN Backbone   ‚îÇ  üîß VGG16 / ResNet : extraction de features
   ‚îÇ  (ex: VGG16)    ‚îÇ     Sortie : feature map H√óW√óD
   ‚îî‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚î¨‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îò     (ex: 14√ó14√ó128)
            ‚îÇ
            ‚ñº
   ‚îå‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îê
   ‚îÇ Prototype Layer ‚îÇ  üéØ Compare chaque r√©gion aux m prototypes
   ‚îÇ  (m prototypes) ‚îÇ     Calcule similarit√©s spatiales
   ‚îî‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚î¨‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îò     Sortie : m scores de similarit√©
            ‚îÇ
            ‚ñº
   ‚îå‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îê
   ‚îÇClassification   ‚îÇ  üìä Combine les similarit√©s avec poids appris
   ‚îÇ     Layer       ‚îÇ     Sortie : scores par classe
   ‚îî‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îò
```
![diagram of the architecture](images/architectureppnet.png)
üì§ QUE PRODUIT LA M√âTHODE ?

Pour chaque image √† classifier :

1. HEATMAP DE SIMILARIT√â:
```
 pour chaque prototype activ√© ‚Üí Montre QUELLE R√âGION de l'image ressemble au prototype
 ```

2. TOP-K PROTOTYPES:
```
les plus similaires ‚Üí "Les 5 prototypes qui matchent le mieux avec cette image"
```
3. EXPLICATION VISUELLE :
   ‚Üí "Cette partie [bbox rouge] ressemble √† 85% au Prototype #42"
   ‚Üí "Prototype #42 = cr√™te rouge d'un cardinal"

4. RAISONNEMENT COMPLET :
```
   ‚Üí Similarit√© prototype 1 : 0.85  √ó  Poids 1.2  =  +1.02
   ‚Üí Similarit√© prototype 2 : 0.78  √ó  Poids 0.9  =  +0.70
   ‚Üí Similarit√© prototype 3 : 0.12  √ó  Poids -0.3 =  -0.04
   ‚Üí ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ
   ‚Üí TOTAL score pour "Cardinal" : 1.68 ‚Üí Softmax ‚Üí 92%
```
üéØ FAMILLE XAI :
Comparaison entre ProtoPNet (interpr√©tabilit√© intrins√®que) et les m√©thodes post-hoc courantes (LIME, SHAP, Grad-CAM) :

| Aspect | ProtoPNet (interpr√©tabilit√© intrins√®que) | M√©thodes post-hoc (LIME, SHAP, Grad-CAM) |
|------|------------------------------------------|------------------------------------------|
| Moment de l‚Äôexplication | **Pendant la pr√©diction** | Apr√®s la pr√©diction |
| Principe | Raisonnement par **similarit√© avec des prototypes** | Approximation ou analyse a posteriori |
| Lien avec le mod√®le | L‚Äôexplication **fait partie du mod√®le** | L‚Äôexplication est **ajout√©e par-dessus** |
| Fid√©lit√© √† la d√©cision | **100 % fid√®le** (pas d‚Äôapproximation) | Approximative |
| Type d‚Äôexplication | ¬´ *Cette partie ressemble √† ce prototype* ¬ª | Importance de pixels / features |
| Raisonnement | **Case-Based Reasoning** (par cas) | Attribution de contribution |
| Stabilit√© | Stable (m√™mes prototypes) | Peut varier selon les param√®tres |
| Co√ªt de calcul | Mod√©r√© | SHAP souvent **tr√®s co√ªteux** |
| Compr√©hensible par humain | **Oui (visuel + s√©mantique)** | Parfois difficile √† interpr√©ter |
| Confiance utilisateur | √âlev√©e | Variable |


### NOTATIONS

- $x ‚àà ‚Ñù^{224\times224\times3}$     : image d'entr√©e RGB
- $f(x) ‚àà ‚Ñù^{H\times\text{W}\times\text{D}}$       : carte de features extraite par le CNN
                          (ex: H=14, W=14, D=128 pour input $224\times224$)
- $P = {p‚ÇÅ, ..., p‚Çò}$     : ensemble des m prototypes
                          (chaque $p_j ‚àà ‚Ñù^D$, m√™me dimension que features)
- $d(¬∑,¬∑)$                : distance L2 (euclidienne)
- $K$                     : nombre de classes

### √âQUATION 1 :
#### SIMILARIT√â AUX PROTOTYPES

$$
\textbf{Pour un prototype } p_j \textbf{ donn√©, on calcule sa similarit√© avec l'image } x :
$$

$$
\mathrm{sim}(x, p_j)
= \max_{h,w} \; \exp\!\left(- d^2\!\left(f(x)_{h,w},\, p_j\right)\right)
$$

$$
\textbf{D√©composition :}
$$

$$
\textbf{1. } f(x)_{h,w} \in \mathbb{R}^D
\quad \text{: vecteur de caract√©ristiques √† la position spatiale } (h,w)
$$

$$
\textbf{2. } d^2\!\left(f(x)_{h,w}, p_j\right)
= \left\| f(x)_{h,w} - p_j \right\|^2
= \sum_{k=1}^{D} \left( f(x)_{h,w,k} - p_j[k] \right)^2
$$

$$
\textbf{3. } \exp(-d^2)
\quad \text{: conversion distance } \rightarrow \text{ similarit√©}
$$

$$
\begin{aligned}
d^2 &= 0 \quad &\Rightarrow \quad \exp(0) &= 1.0 \quad &(\text{identique}) \\
d^2 &= 1 \quad &\Rightarrow \quad \exp(-1) &= 0.37 \quad &(\text{assez similaire}) \\
d^2 &= 5 \quad &\Rightarrow \quad \exp(-5) &= 0.007 \quad &(\text{tr√®s diff√©rent})
\end{aligned}
$$

$$
\textbf{4. } \max_{h,w}
\quad \text{: recherche de la meilleure correspondance spatiale}
$$

$$
\Rightarrow \text{on s√©lectionne la r√©gion de l'image la plus proche du prototype}
$$

$$
\textbf{Intuition :}
\quad
\text{``Quelle est la r√©gion de l'image qui ressemble le plus au prototype } p_j \text{ ?''}
$$



#### PR√âDICTION FINALE

##### Score de classe (logit)

Le score ($logit$) pour la classe $k$ est :

$$
g_k(x) = \sum_{j} w_{k,j} \cdot \mathrm{sim}(x, p_j)
$$

##### D√©composition

- $$ w_{k,j} \in \mathbb{R} $$
  poids appris repr√©sentant l'importance du prototype $p_j$ pour la classe $k$

- **Somme pond√©r√©e**  
  on combine toutes les similarit√©s entre l'image et les prototypes

- **Transformation en probabilit√©s (softmax)** :

$$
P(\text{classe} = k \mid x)
=
\frac{\exp\left(g_k(x)\right)}
{\sum_{k'} \exp\left(g_{k'}(x)\right)}
$$

---

##### üí° Intuition

> *¬´ Chaque prototype **vote** pour les classes en fonction de sa similarit√© avec l'image ¬ª*

---

##### Exemple concret

###### Classe **"Cardinal"** ($ k = 5 $)

- **Prototype 25** (cr√™te rouge)  
  $$ \mathrm{sim} = 0.85, \quad w_{5,25} = 1.2 \quad \Rightarrow \quad +1.02 $$

- **Prototype 26** (bec orange)  
  $$ \mathrm{sim} = 0.78, \quad w_{5,26} = 0.9 \quad \Rightarrow \quad +0.70 $$

- **Prototype 27** (masque noir)  
  $$ \mathrm{sim} = 0.65, \quad w_{5,27} = 0.7 \quad \Rightarrow \quad +0.46 $$

- **Autres 97 prototypes**  
  contribution faible  
  $$ \Rightarrow +0.32 $$

---

###### Score total

$$
g_5(x) = 2.50
\quad \Rightarrow \quad
P(\text{Cardinal} \mid x) = 0.92
$$


#### FONCTION DE PERTE (ENTRA√éNEMENT)
L'entra√Ænement optimise une fonction de perte multi-objectifs :
$$
    L_{total} = L_{cls} + Œª‚ÇÅ L_{clst} + Œª‚ÇÇ L_{sep} + Œª‚ÇÉ L_{reg}
$$
D√©composition :

1Ô∏è‚É£ $L_{cls}$ = $\text{CrossEntropy}(g(x), y_{true})$
   ‚Üí Perte de classification standard<br>
   ‚Üí Force le mod√®le √† pr√©dire correctement

2Ô∏è‚É£ $L_{clst}$ = $- \sum_{j} \min_{x \in \text{classe}(p_j)}d^2\!\left(f(x),\, p_j\right)$
   ‚Üí "Clustering loss"<br>
   ‚Üí Force chaque prototype √† √™tre PROCHE d'au moins un exemple 
     de SA PROPRE classe<br>
   ‚Üí Garantit que les prototypes sont repr√©sentatifs

3Ô∏è‚É£ $L_{sep}$ = $\sum_{j} \min_{x \notin \text{classe}(p_j)}\left( - d^2\!\left(f(x),\, p_j\right) \right)$
   ‚Üí "Separation loss"<br>
   ‚Üí Force chaque prototype √† √™tre √âLOIGN√â des exemples 
     des AUTRES classes<br>
   ‚Üí Garantit la discriminativit√©

4Ô∏è‚É£ $L_{reg}$ = $\| W \|_1$
   ‚Üí R√©gularisation L1 sur les poids<br>
   ‚Üí Encourage la sparsit√© : peu de prototypes par classe<br>
   ‚Üí Facilite l'interpr√©tation<br>

üí° INTUITION :
"Les prototypes doivent √™tre proches de leur classe, √©loign√©s des autres,
 et le mod√®le doit bien classifier avec peu de prototypes actifs"


### LIEN AVEC VOS CONNAISSANCES

üîó CNN / R√©tropropagation :
   - $f(x)$ = forward pass standard d'un CNN (VGG16, ResNet)
   - Les gradients se propagent √† travers les prototypes
   - M√™me m√©canisme d'optimisation (Adam, SGD)

üîó Max Pooling :
   - $max_{h,w}$ dans $\text{sim}(x, p_j)$ = max pooling spatial guid√©
   - Au lieu de max(features), on fait max(similarit√©s)

üîó Noyau RBF (Radial Basis Function) :
   - $exp(-d¬≤)$ = noyau gaussien, classique en ML
   - Utilis√© en SVM, clustering, r√©seaux de neurones

üîó K-means / Clustering :
   - Les prototypes jouent le r√¥le de "centres de clusters"
   - $L_{clst}$ ‚âà minimiser distance intra-classe (K-means)
   - $L_{sep}$ ‚âà maximiser distance inter-classe

üîó Attention Mechanism :
   - $max_{h,w}$ = forme d'attention spatiale "hard"
   - Le mod√®le "attend" aux r√©gions importantes