In [None]:
These two code sections demonstrate the implementation of multilayer perceptrons (MLPs) for different classification tasks.

The first part is an MLP model applied to the XOR function, a classic example to showcase neural networks' ability to learn non-linear relationships. The model has one hidden layer with 2 neurons, using the ReLU activation function and the Adam optimizer. After training on the XOR inputs, the model outputs predictions, calculates accuracy, and displays weights and biases of the network layers.

The second part involves an MLP for the MNIST digit classification task. This model includes two hidden layers with 128 and 64 neurons, both using ReLU, and a 10-neuron output layer with a softmax activation for multi-class classification. The model is compiled with `categorical_crossentropy` loss and the Adam optimizer, trained over 5 epochs, and evaluated for accuracy on the test set, demonstrating its ability to handle complex, large-scale data.

**MLP pour XOR**

In [None]:
# Importation des bibliothèques nécessaires
from sklearn.neural_network import MLPClassifier
from sklearn.metrics import accuracy_score

# Définition des données d'entraînement
# On définit les entrées et les sorties pour la fonction XOR
# XOR(0,0) = 0, XOR(0,1) = 1, XOR(1,0) = 1, XOR(1,1) = 0
X = [[0, 0], [0, 1], [1, 0], [1, 1]]
y = [0, 1, 1, 0]

# Création du modèle MLP (Perceptron Multicouche)
# Le modèle a 2 neurones dans la couche cachée, avec la fonction d'activation 'relu'
# et l'algorithme de rétropropagation 'adam'
mlp = MLPClassifier(hidden_layer_sizes=(2,), activation='relu', solver='adam', max_iter=10000)

# Entraînement du modèle sur les données d'entraînement
mlp.fit(X, y)

# Prédiction sur les données d'entraînement pour évaluer les performances
y_pred = mlp.predict(X)

# Calcul de l'exactitude du modèle
accuracy = accuracy_score(y, y_pred)

# Affichage des résultats
print("Prédictions du MLP sur les données d'entraînement :", y_pred)
print("Exactitude du modèle :", accuracy)

# Affichage des poids des couches du réseau de neurones
print("Poids entre l'entrée et la couche cachée :", mlp.coefs_[0])
print("Poids entre la couche cachée et la sortie :", mlp.coefs_[1])

# Affichage des biais des neurones
print("Biais de la couche cachée :", mlp.intercepts_[0])
print("Biais de la couche de sortie :", mlp.intercepts_[1])



Prédictions du MLP sur les données d'entraînement : [0 1 1 0]
Exactitude du modèle : 1.0
Poids entre l'entrée et la couche cachée : [[ 2.18846795 -1.86266266]
 [ 2.18828852 -1.86278539]]
Poids entre la couche cachée et la sortie : [[-1.99501509]
 [-2.32648246]]
Biais de la couche cachée : [-2.18824793  1.86263993]
Biais de la couche de sortie : [1.86035519]


**MLP MNIST**

In [None]:
#### ESSAI 1

import tensorflow as tf
from tensorflow.keras import layers, models
from tensorflow.keras.datasets import mnist

# Charger les données MNIST
(x_train, y_train), (x_test, y_test) = mnist.load_data()

# Normaliser les données (0-255 -> 0-1)
x_train = x_train.reshape(60000, 28 * 28).astype('float32') / 255.0
x_test = x_test.reshape(10000, 28 * 28).astype('float32') / 255.0

# Encoder les labels en one-hot vectors
y_train = tf.keras.utils.to_categorical(y_train, 10)
y_test = tf.keras.utils.to_categorical(y_test, 10)

# Construction du modèle MLP
model = models.Sequential()
model.add(layers.Dense(128, activation='relu', input_shape=(784,)))
model.add(layers.Dense(64, activation='relu'))
model.add(layers.Dense(10, activation='softmax'))

# Compilation du modèle
model.compile(optimizer='adam',
              loss='categorical_crossentropy',
              metrics=['accuracy'])

# Entraînement du modèle avec 5 itérations et par lot de 64 exemples
model.fit(x_train, y_train, epochs=5, batch_size=64)

# Évaluation du modèle
test_loss, test_acc = model.evaluate(x_test, y_test)
print('Précision sur l\'ensemble de test:', test_acc)


In [None]:
#### ESSAI 2  : EARLY STOPPING + CHANGE;ENT DE L'OPTIMIZER ET LEARNING RATE


import tensorflow as tf
from tensorflow.keras import layers, models
from tensorflow.keras.datasets import mnist


#### ajout de early stopping
from tensorflow.keras.callbacks import EarlyStopping
early_stopping = EarlyStopping(monitor='val_loss', patience=3)


# Charger les données MNIST
(x_train, y_train), (x_test, y_test) = mnist.load_data()

# Normaliser les données (0-255 -> 0-1)
x_train = x_train.reshape(60000, 28 * 28).astype('float32') / 255.0
x_test = x_test.reshape(10000, 28 * 28).astype('float32') / 255.0

# Encoder les labels en one-hot vectors
y_train = tf.keras.utils.to_categorical(y_train, 10)
y_test = tf.keras.utils.to_categorical(y_test, 10)

# Construction du modèle MLP
#Couche d'entrée : 784 neurones (correspondant à chaque pixel de l'image).
#Première couche cachée :  128 neurones avec la fonction d'activation ReLU.
#Deuxième couche cachée :  64 neurones avec la fonction d'activation ReLU.
#Couche de sortie : 10 neurones (correspondant aux 10 classes), avec une activation softmax.

model = models.Sequential()
model.add(layers.Dense(128, activation='relu', input_shape=(784,)))
model.add(layers.Dense(64, activation='relu'))
model.add(layers.Dense(10, activation='softmax'))

# Compilation du modèle
#Utiliser la fonction de coût categorical crossentropy pour la classification multi-classes.
#Optimiser le modèle avec l'algorithme Adam.
#Entraîner le modèle sur l'ensemble d'entraînement
model.compile(optimizer=tf.keras.optimizers.Adam(learning_rate=0.001), # pERMET
              loss='categorical_crossentropy',
              metrics=['accuracy'])

# Entraînement du modèle qvec 5 éteration et par lot de 64 exemples
model.fit(x_train, y_train, epochs=20, batch_size=64, validation_split=0.2, callbacks=[early_stopping])

# Évaluation du modèle
test_loss, test_acc = model.evaluate(x_test, y_test)
print('Précision sur l\'ensemble de test:', test_acc)


In [None]:
### ESSAI 3 : AJOUT D'UN DROPOUT LAYER + 10 EPOCH


import tensorflow as tf
from tensorflow.keras import layers, models
from tensorflow.keras.datasets import mnist

# Charger les données MNIST
(x_train, y_train), (x_test, y_test) = mnist.load_data()

# Normaliser les données (0-255 -> 0-1)
x_train = x_train.reshape(60000, 28 * 28).astype('float32') / 255.0
x_test = x_test.reshape(10000, 28 * 28).astype('float32') / 255.0

# Encoder les labels en one-hot vectors
y_train = tf.keras.utils.to_categorical(y_train, 10)
y_test = tf.keras.utils.to_categorical(y_test, 10)

# Construction du modèle MLP
model = models.Sequential()
model.add(layers.Dense(128, activation='relu', input_shape=(784,)))
model.add(layers.Dense(64, activation='relu'))
model.add(layers.Dense(10, activation='softmax'))
model.add(layers.Dropout(0.3))  # Drop 30% of the neurons at random


# Compilation du modèle
model.compile(optimizer='adam',
              loss='categorical_crossentropy',
              metrics=['accuracy'])

# Entraînement du modèle avec 5 itérations et par lot de 64 exemples
model.fit(x_train, y_train, epochs=10, batch_size=64)

# Évaluation du modèle
test_loss, test_acc = model.evaluate(x_test, y_test)
print('Précision sur l\'ensemble de test:', test_acc)


In [None]:
# Affichage du résumé du modèle pour voir l'architecture et les paramètres
model.summary()