# projet-sda-deep-learning
#### [GTSRB - German Traffic Sign Recognition Benchmark](https://www.kaggle.com/datasets/meowmeowmeowmeowmeow/gtsrb-german-traffic-sign)


## 1. **Introduction au Projet**
  - Analyse du problème de classification des panneaux de signalisation routière.
  - Importance de cette tâche dans les systèmes de conduite autonome.
  - Présentation du dataset GTSRB (German Traffic Sign Recognition Benchmark).
  - Objectifs du projet.

## ToDo
- [ ] Importation des library 
- [ ] Chargement du dataset GTSRB.
- [ ] Aperçu des classes de panneaux de signalisation présentes dans le dataset (visualisation des premières images et des labels).

## 2. **Préparation des Données**
  - Explication des étapes de prétraitement des données.
  - Importance du redimensionnement, de la normalisation et de l’augmentation des données.

## ToDo
- [ ] Chargement et exploration du dataset
  - [ ] Dimensions
  - [ ] Classes
  - [ ] Visualisation des images
  - [ ] Distribution des classes
- [ ] Prétraitement des images
  - [ ] Redimensionnement à une taille fixe (par exemple, 32x32 ou 64x64)
  - [ ] Normalisation des valeurs des pixels (mise à l’échelle entre 0 et 1)
- [ ] Division du dataset en ensembles d’entraînement, de validation et de test
  - [ ] Utilisation de `train_test_split` ou autre technique de séparation
- [ ] Implémentation de l’augmentation des données
  - [ ] Rotation
  - [ ] Zoom
  - [ ] Translation
  - [ ] Variations de luminosité
  - [ ] Via des bibliothèques comme `ImageDataGenerator` ou `torchvision.transforms`


## 3. **Conception et Implémentation du Modèle CNN**
  - Présentation des concepts de base des CNN (convolutions, pooling, fully connected layers).
  - Comparaison d’architectures : du simple au complexe (VGG, ResNet).
  - Techniques de régularisation (Dropout, Batch Normalization).

## ToDo
- [ ] Implémentation d’une architecture CNN simple
  - [ ] Couches de convolution
  - [ ] Couches de pooling
  - [ ] Couches fully connected
- [ ] Ajout de techniques de régularisation
  - [ ] Dropout pour prévenir l’overfitting
  - [ ] Batch Normalization pour stabiliser et accélérer l'entraînement
- [ ] Exploration d’architectures plus complexes
  - [ ] Par exemple, VGG16 ou ResNet


## 4. **Entraînement du Modèle**
  - Définir les paramètres d’entraînement (fonction de coût, optimiseur).
  - Importance du suivi des performances sur l’ensemble de validation.

## ToDo
- [ ] Choix de la fonction de coût
  - [ ] `categorical_crossentropy` pour la classification multi-classes
- [ ] Implémentation des optimisateurs
  - [ ] Adam
  - [ ] SGD (avec annealing du taux d’apprentissage)
- [ ] Entraînement du modèle sur les données prétraitées et augmentées
  - [ ] Suivi des performances sur l’ensemble de validation
- [ ] Visualisation des courbes de loss et d’accuracy pendant l’entraînement


## 5. **Évaluation du Modèle**
  - Explication des métriques de performance : précision, rappel, F1-score.
  - Importance de la matrice de confusion pour comprendre les erreurs de classification.

## ToDo
- [ ] Évaluation du modèle sur l’ensemble de test
- [ ] Calcul et affichage des métriques de performance
  - [ ] Précision
  - [ ] Rappel
  - [ ] F1-score
- [ ] Génération et visualisation d’une matrice de confusion
- [ ] Optionnel : comparer les performances des différentes architectures testées

## 6. **Améliorations et Expérimentations**
  - Amélioration des performances (ajustement des hyperparamètres, augmentation des données, transfer learning).
  - Techniques avancées : le transfer learning.

## ToDo 
- [ ] Ajustement des hyperparamètres
  - [ ] Taille des batchs
  - [ ] Taux d’apprentissage
- [ ] Test d’autres techniques d’augmentation des données
- [ ] Implémentation du transfer learning avec un modèle pré-entraîné
  - [ ] Par exemple, ResNet ou VGG pré-entraîné sur ImageNet
- [ ] Fine-tuning du modèle pré-entraîné sur le dataset GTSRB

## 7. **Interprétation et Visualisation des Résultats**
  - Explication de l’importance de visualiser les activations des couches CNN.
  - Présentation de Grad-CAM pour l’interprétation des résultats.

## ToDo
- [ ] Visualisation des activations des différentes couches du modèle
  - [ ] Comprendre comment il extrait les caractéristiques des images
- [ ] Implémentation et visualisation avec Grad-CAM
  - [ ] Voir quelles parties des images sont utilisées par le modèle pour faire ses prédictions
- [ ] Discussion des erreurs courantes
  - [ ] Confusion entre panneaux similaires
  - [ ] Exploration de solutions potentielles

## 8. **Extension du Projet (Facultatif)**
  - Poursuivre le projet (classification + localisation, tests dans des conditions adverses).
  - Propositions pour des expériences plus avancées (détection d’objets, robustesse aux perturbations).

## ToDo
- [ ] Implémentation d’une architecture de détection d’objets
- [ ] Ajout de bruit ou d’occlusions aux images pour tester la robustesse du modèle

## 9. **Code Python, Rédaction du Rapport et Présentation**
  - Résumé du projet.

## ToDo
- [ ] Code Python 
- [ ] Explication détaillée (Rapport 5-10 pages)
- [ ] Explicaiton synthétique (Présentation 10 slides)
- [ ] Sauvegarde du modèle entraîné

## Conclusion