*Filière :* ING3 - Tronc commun

*Auteurs :*
**Michael KISUKA** et
**Nivethan SIVANESAN**

*Professeur référent :* 
**TAJINI Badr**

*Année :* 2024-2025

**ESIEE-IT**

# Projet : Classification de chiffres manuscrits (MNIST) avec MLP

## Phase 2 : Construction d'un modèle MLP basique

### Objectif
L'objectif de cette phase est de se familiariser avec la construction d'un modèle MLP (Multi-Layer Perceptron) en utilisant le dataset MNIST. Les étapes incluent :
- **Chargement des données** : Comprendre la structure des données MNIST.
- **Préparation des données** : Normalisation des valeurs des pixels.
- **Construction du modèle** : Instanciation d'un modèle MLP avec différents hyperparamètres.

---

### Étapes

 **1. Chargement des données MNIST**
 
Le dataset MNIST contient 70 000 images de chiffres manuscrits (de 0 à 9), chacune étant une image en niveaux de gris de 28x28 pixels. Ces images sont aplaties en vecteurs de 784 pixels pour être utilisées par le modèle.


In [None]:
from sklearn.datasets import fetch_openml
import numpy as np

# Charger le dataset MNIST
mnist = fetch_openml('mnist_784', version=1)
X = mnist.data
y = mnist.target

# Examiner les données
print("Forme des données d'images (X) :", X.shape)  # (70000, 784)
print("Forme des étiquettes (y) :", y.shape)       # (70000,)

**2. Préparation des données**

Pour améliorer l’apprentissage, on normalise les données en divisant les valeurs des pixels par 255.0, ce qui ramène les valeurs entre 0 et 1

In [None]:
# Normalisation des données
X = X / 255.0

**3. Construction du modèle MLP**

Plusieurs modèles MLP sont instanciés avec différentes configurations pour explorer l'impact des hyperparamètres.

In [None]:
from sklearn.neural_network import MLPClassifier

# Exemple 1 : Un MLP très simple avec une seule couche cachée de 50 neurones
mlp_simple = MLPClassifier(hidden_layer_sizes=(50,), max_iter=10)
print("Modèle MLP simple créé :", mlp_simple)

# Exemple 2 : Un MLP avec deux couches cachées
mlp_deux_couches = MLPClassifier(hidden_layer_sizes=(100, 50), max_iter=10)
print("Modèle MLP à deux couches créé :", mlp_deux_couches)

# Exemple 3 : Essayer différents algorithmes d'optimisation
mlp_adam = MLPClassifier(hidden_layer_sizes=(50,), solver='adam', max_iter=10)
print("MLP avec optimiseur Adam :", mlp_adam)

mlp_sgd = MLPClassifier(hidden_layer_sizes=(50,), solver='sgd', learning_rate_init=0.01, max_iter=10)
print("MLP avec optimiseur SGD :", mlp_sgd)

## Le code final :

In [None]:
from sklearn.datasets import fetch_openml
from sklearn.neural_network import MLPClassifier
import numpy as np

# 1. Charger le dataset MNIST
mnist = fetch_openml('mnist_784', version=1)
X = mnist.data
y = mnist.target

# 2. Examiner les données (pour comprendre leur forme)
print("Forme des données d'images (X) :", X.shape)
print("Forme des étiquettes (y) :", y.shape)

# 3. Préparer les données (une étape simple : mise à l'échelle - peut être simplifiée au début)
#    Note : Pour simplifier au maximum, on pourrait même sauter cette étape au début.
X = X / 255.0

# 4. Construire un modèle MLP basique
#    Ici, nous allons juste instancier le modèle avec différents paramètres.

# Exemple 1 : Un MLP très simple avec une seule couche cachée de 50 neurones
mlp_simple = MLPClassifier(hidden_layer_sizes=(50,), max_iter=10)
print("Modèle MLP simple créé :", mlp_simple)

# Exemple 2 : Un MLP avec deux couches cachées
mlp_deux_couches = MLPClassifier(hidden_layer_sizes=(100, 50), max_iter=10)
print("Modèle MLP à deux couches créé :", mlp_deux_couches)

# Exemple 3 : Essayer différents algorithmes d'optimisation
mlp_adam = MLPClassifier(hidden_layer_sizes=(50,), solver='adam', max_iter=10)
print("MLP avec optimiseur Adam :", mlp_adam)

mlp_sgd = MLPClassifier(hidden_layer_sizes=(50,), solver='sgd', learning_rate_init=0.01, max_iter=10)
print("MLP avec optimiseur SGD :", mlp_sgd)

# Remarque : `max_iter` est limité ici pour éviter que l'entraînement ne prenne trop de temps si on l'exécute.
# L'objectif principal est l'instanciation du modèle.

Forme des données d'images (X) : (70000, 784)
Forme des étiquettes (y) : (70000,)
Modèle MLP simple créé : MLPClassifier(hidden_layer_sizes=(50,), max_iter=10)
Modèle MLP à deux couches créé : MLPClassifier(hidden_layer_sizes=(100, 50), max_iter=10)
MLP avec optimiseur Adam : MLPClassifier(hidden_layer_sizes=(50,), max_iter=10)
MLP avec optimiseur SGD : MLPClassifier(hidden_layer_sizes=(50,), learning_rate_init=0.01, max_iter=10,
              solver='sgd')


# Analyse des résultats

**1. Forme des données**

X.shape : (70000, 784) → 70 000 images avec 784 caractéristiques chacune (les pixels).

y.shape : (70000,) → 70 000 étiquettes correspondant aux chiffres de 0 à 9.

**2. Impact des hyperparamètres**

hidden_layer_sizes=(50,) : Une seule couche cachée avec 50 neurones.

hidden_layer_sizes=(100, 50) : Deux couches cachées avec 100 et 50 neurones.

solver='adam' : Algorithme souvent efficace, qui ajuste automatiquement le taux d’apprentissage.

solver='sgd' : Descente de gradient stochastique, qui nécessite un réglage manuel du taux d’apprentissage (learning_rate_init).

**3. Remarques**

Ajouter plus de neurones et de couches peut améliorer la capacité du modèle à apprendre des relations complexes, mais cela rend l'entraînement plus long et exige plus de puissance de calcul.

L’argument max_iter=10 limite le nombre d’itérations d’apprentissage pour éviter un temps de calcul trop long lors des tests. En pratique, un modèle bien entraîné nécessite plusieurs centaines d’itérations.

## Conclusion
Cette phase permet d'expérimenter avec différentes architectures et méthodes d’optimisation pour mieux comprendre le fonctionnement des réseaux de neurones avant de les entraîner réellement. La prochaine étape consistera à entraîner ces modèles et à évaluer leurs performances.