## L'équipe en médecine pour la détection des pneumonies

##### L'analyse des radiographies thoraciques permet de détecter les cas de pneumonie.

##### Automatiser cette action et améliorer la prédiction des cas est indispensable.

##### Un POC (Proof of Concept) sera réalisé avec :
- **Utilisation du Transfert Learning** pour les prédictions.
- **Application de CNN** sur les modèles de Transfert Learning pour améliorer les performances et réduire les coûts.
- **Déploiement sur GitHub** pour assurer la versioning et l'accessibilité du projet.
- **Intégration de MLOps** pour la gestion du cycle de vie du modèle.
- **Mise en place d'un historique** pour suivre les tests effectués.
- **Préparation rigoureuse du dataset** pour garantir la pertinence des données utilisées.
- **Visualisation des résultats via des graphiques** pour mettre en évidence les performances du modèle.
- **Ajout d'un `.gitignore`** pour éviter d'inclure les bibliothèques et frameworks inutiles.
- **Rédaction d'un README.md** pour détailler le projet et son implémentation.


### Lecture du rapport de 2024

- Référence : [MDPI - Rapport 2024](https://www.mdpi.com/2306-5354/11/4/)
- Le rapport souligne l'importance d'utiliser des modèles pré-entraînés plutôt que d'entraîner ses propres réseaux CNN.
- Bien que CNN affiche un bon taux de réussite, l'adoption de modèles pré-entraînés optimise le temps et les ressources.


### Compétences sur le Transfert Learning

#### Pourquoi utiliser le Transfert Learning ?
- **Optimisation du travail sur les réseaux neuronaux**.
- **Réduction de la quantité de données à stocker**.
- **Prévention du sur-apprentissage** pour améliorer la généralisation.
- **Gain de temps et réduction des coûts en ressources mémoire et calcul**.
- **Modèles existants performants, adaptés aux besoins spécifiques du projet**.


### Choix du modèle de Transfert Learning

#### Critères de sélection :
- **Accuracy obtenue**.
- **Loss mesuré**.
- **Temps d'exécution**.
- **Coût en termes de données**.
- **Tests de performance** pour identifier le modèle le plus pertinent.
- **Mise en place d'un historique** pour documenter les performances.


### Comparaison des modèles testés

| Modèle     | Accuracy | Loss   |
|------------|----------|--------|
| **VGG16**  | 91.18%   | 0.41   |
| **ResNet50** | 77,00%   | 0,32   |
| **Xception** | 81.57%   | 0.0595 |

#### Justification du choix :
- **VGG16 affiche la meilleure accuracy**.
- **Loss faible** indiquant une bonne fiabilité du modèle.
- **Temps par époque** : 50 secondes.
- **MLflow** documente les tests et valide le choix du modèle.


## Pourquoi Xception est le Meilleur Choix ?

### 1. Comparaison des architectures

| Modèle | Profondeur | Paramètres | Points Forts | Points Faibles |
|--------|------------|------------|--------------|----------------|
| VGG16 | 16 | 138M | Architecture claire | Très lourd en calcul |
| ResNet50 | 50 | 25.6M | Meilleure convergence | Complexe à optimiser |
| Xception | 71 | 22.9M | Convolutions séparables | Nécessite plus de données |

### 2. Avantages techniques
- **Efficacité computationnelle** grâce aux convolutions séparables.
- **Moins de paramètres**, donc entraînement plus rapide.
- **Adapté aux images médicales** pour une classification fine.

### 3. Performance sur notre dataset
- **Accuracy** : 91.18%
- **Loss** : 0.041
- **Temps d'entraînement par époque** : 50 secondes

### 4. Validation et tests
- **Robustesse face aux variations de qualité d’image**.
- **Cohérence des prédictions** sur différents cas cliniques.
- **Optimisation des hyperparamètres et de l’architecture**.

### 5. Conclusion et évolutions futures
- **Fine-tuning continu** pour améliorer la performance.
- **Intégration de nouvelles données pour enrichir le modèle**.
- **Déploiement et optimisation du temps de calcul**.
