*Filière :* ING3 - Tronc commun

*Auteurs :*
**Michael KISUKA** et
**Nivethan SIVANESAN**

*Professeur référent :* 
**TAJINI Badr**

*Année :* 2024-2025

**ESIEE-IT**

## Projet : Classification de chiffres manuscrits (MNIST) avec MLP  

Ce notebook couvre les phases 4 et 5 du projet :  
**Phase 4** : Améliorer la précision du modèle en ajustant son architecture et les hyperparamètres.  
**Phase 5** : Visualiser les prédictions et analyser les erreurs à l'aide d'une matrice de confusion.

In [None]:
!pip install numpy scikit-learn matplotlib seaborn

In [None]:
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.datasets import fetch_openml
from sklearn.neural_network import MLPClassifier
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score, confusion_matrix, classification_report

## Phase 4 : Amélioration de la précision du modèle MLP  
### Objectif  
L'objectif est d'améliorer la précision du modèle en ajustant :  
- **L'architecture du réseau** (nombre de couches et neurones).  
- **La régularisation L2** (`alpha`) pour éviter l'overfitting.  
- **L'algorithme d'optimisation** (`adam`, `sgd`).

### Étapes :  
Avant d'améliorer le modèle, il est essentiel de bien comprendre comment ses paramètres influencent la performance. La profondeur du réseau, le nombre de neurones par couche, ainsi que les techniques de régularisation jouent un rôle clé dans l'optimisation. Un bon compromis doit être trouvé entre un modèle trop simple (sous-ajustement) et un modèle trop complexe (sur-ajustement).

In [None]:
mnist = fetch_openml('mnist_784', version=1)
X = mnist.data.astype(np.float32) / 255.0  # Normalisation des pixels
y = mnist.target.astype(int)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

In [None]:
clf = MLPClassifier(hidden_layer_sizes=(128, 64, 32), activation='relu', solver='adam', 
                    alpha=0.0005, batch_size=200, learning_rate_init=0.001, max_iter=30, random_state=42)
clf.fit(X_train, y_train)
y_pred = clf.predict(X_test)
accuracy = accuracy_score(y_test, y_pred)
print(f'Précision du modèle amélioré : {accuracy:.4f}')

## Phase 5 : Visualisation des résultats et analyse des erreurs  
### Objectif  
Analyser les prédictions du modèle et identifier les erreurs à l'aide de visualisations et d'une matrice de confusion.

### Matrice de confusion  
Une matrice de confusion permet de mieux comprendre les erreurs du modèle en comparant les valeurs réelles aux prédictions. En examinant cette matrice, on peut identifier les chiffres les plus souvent mal classés et comprendre les similitudes qui induisent ces erreurs.

In [None]:
conf_matrix = confusion_matrix(y_test, y_pred)
plt.figure(figsize=(10, 8))
sns.heatmap(conf_matrix, annot=True, fmt='d', cmap='Blues')
plt.xlabel("Prédictions")
plt.ylabel("Vraies valeurs")
plt.title("Matrice de Confusion")
plt.show()

### Rapport de classification  
Le rapport de classification fournit des métriques précises telles que la précision, le rappel et le score F1 pour chaque classe. Ces métriques permettent d'identifier si certaines classes sont mieux reconnues que d'autres et si le modèle souffre d'un déséquilibre dans ses prédictions.

In [None]:
report = classification_report(y_test, y_pred)
print("\nRapport de classification:\n", report)

### Analyse des résultats  
Le modèle atteint une précision de **{accuracy:.4f}**, ce qui montre une amélioration par rapport aux versions précédentes. Cependant, certaines classes restent plus difficiles à classifier, en particulier celles ayant des formes similaires, comme les chiffres 3 et 8. En observant la matrice de confusion, on remarque que le modèle confond souvent ces chiffres, ce qui pourrait être amélioré en intégrant des techniques supplémentaires comme l'augmentation de données ou des architectures plus avancées.