# Synthèse des Modèles de Classification

## 1. Résumé des Modèles Testés

Trois architectures de modèles ont été conçues et évaluées :

- **Modèle 1** : Modèle de base, utilisé comme point de départ.
- **Modèle 2** : Version améliorée avec régularisation (Dropout).
- **Modèle 3** : Modèle final optimisé, avec ajustements d’architecture et d’hyperparamètres.

Chaque modèle a été entraîné, validé, puis évalué sur un set de test indépendant pour analyser ses performances.

---

## 2. Justification des Métriques

Les métriques suivantes ont été utilisées :

- **Accuracy** : Pourcentage de bonnes prédictions sur l’ensemble des classes.
- **Précision** : Capacité du modèle à ne pas produire de faux positifs.
- **Rappel** : Capacité à détecter tous les exemples pertinents.
- **F1-Score** : Moyenne harmonique entre précision et rappel, utile en cas de déséquilibre des classes.
- **Matrice de confusion** : Permet de visualiser les confusions entre classes.

L’utilisation conjointe de ces métriques permet une évaluation fine, robuste et équilibrée du modèle.

---

## 3. Généralisation et Jeux de Données

- **Set d’entraînement et de validation** utilisés pour l’apprentissage et le réglage des hyperparamètres.
- **Set de test séparé** pour évaluer la capacité du modèle à généraliser à des données nouvelles.
  
Cela permet de s’assurer que les modèles ne sont pas simplement surajustés aux données d'entraînement, mais qu’ils sont **généralisables**.

---

## 4. Démarche Suivie

- **Exploration des données** : Analyse des distributions, déséquilibres, nettoyage éventuel.
- **Modèle de base (M1)** : Première estimation des performances.
- **Itérations successives** (M2 → M3) : 
  - Ajout de couches ou ajustement de l’architecture.
  - Utilisation de régularisation.
  - Réglage de l’optimiseur et du taux d’apprentissage.
- **Évaluations visuelles et quantitatives** : Suivi des courbes de loss/accuracy, comparaison des matrices de confusion et scores F1.

---

## 5. Comparaison des Modèles

| Modèle    | Courbes d’entraînement     | Précision/Recall/F1 | Matrice de confusion | Overfitting |
|-----------|----------------------------|----------------------|----------------------|-------------|
| Modèle 1  | Apprentissage rapide, mais instable | Scores corrects mais déséquilibrés | Forte confusion inter-classes | Oui |
| Modèle 2  | Courbes plus stables       | Scores améliorés sur certaines classes | Moins de confusion | Modéré |
| **Modèle 3** | **Courbes régulières, bonne convergence** | **Meilleurs scores globaux** | **Moins de confusion** | **Bien maîtrisé** |

Le **Modèle 3** offre les **meilleures performances globales** et **la meilleure généralisation**.

---

### Analyse des métriques clés

**Modèle 1 :**

![image.png](attachment:image.png)
![image-2.png](attachment:image-2.png) 
![image-3.png](attachment:image-3.png)

**Modèle 2 :**

![image-4.png](attachment:image-4.png)
![image-5.png](attachment:image-5.png)
![image-6.png](attachment:image-6.png)

**Modèle 3 :**

![image-7.png](attachment:image-7.png)
![image-8.png](attachment:image-8.png)
![image-9.png](attachment:image-9.png)


| Métrique                  | Modèle 1               | Modèle 2               | Explication |
|---------------------------|------------------------|------------------------|-------------|
| **Exactitude (Accuracy)** | (513+488)/1050 = **0.954** | (507+504)/1050 = **0.963** | Proportion de prédictions correctes |
| **Précision (classe 1)**  | 488 / (488+12) = **0.976** | 504 / (504+18) = **0.965** | Sur les prédits "1", combien étaient corrects |
| **Rappel (classe 1)**     | 488 / (488+37) = **0.929** | 504 / (504+21) = **0.96**  | Sur les vrais "1", combien ont été bien prédits |
| **F1-score (classe 1)**   | **0.952**               | **0.962**               | Moyenne harmonique entre précision et rappel |
| **Précision (classe 0)**  | 513 / (513+37) = **0.933** | 507 / (507+21) = **0.96**  | Idem, mais pour la classe 0 |
| **Rappel (classe 0)**     | 513 / (513+12) = **0.977** | 507 / (507+18) = **0.965** | Idem, mais pour la classe 0 |

---

### Conclusion

- La **2ème matrice** est **meilleure globalement** :
  - Meilleure **exactitude** (96.3 % vs 95.4 %)
  - Meilleur **rappel** sur les deux classes (surtout classe 1)
  - **Moins de faux négatifs** (21 contre 37), ce qui est souvent crucial

- La **1ère matrice** a une **meilleure précision pour la classe 1** (0.976 vs 0.965), ce qui peut être utile si l'on cherche à minimiser les faux positifs.

> **Choix selon le contexte :**
> - Si l'objectif est d'éviter les **faux négatifs** (ex : détection de maladies) → **2ème matrice** recommandée.
> - Si l'objectif est d'éviter les **faux positifs** (ex : système d’alerte ou judiciaire) → **1ère matrice** préférable.

Le modèle final (**Modèle 3**) est retenu car :

- Il présente de bonnes performances sur l’ensemble des métriques.
- Il généralise bien à de nouvelles données.
- Il montre une amélioration progressive justifiée par une démarche expérimentale rigoureuse.

La démarche complète adoptée (exploration, tests successifs, évaluation multi-critères) garantit la **fiabilité et la robustesse du modèle**.